以下是csdn论坛上的一个帖子:
很长的log file记录了用户访问amazon.com的过程,两列分别为 userID 和
pageName.
log从上倒下按照点击发生的时间顺序。找出最popular的3连击。
eg:
zhang welcome
Li Hello
Wang welcome
Li books
Wang Hello
zhang books
Li shopping cart
Li checkout
zhang shopping cart
Wang camera
zhang checkout
最popular的3 combo是books -> shopping cart -> checkout
我一时找不出什么办法,只有一个最笨的办法就是把所有的3连击都找出来。
本文介绍了一种通过分析用户在网站上的连续行为记录来找出最热门的行为组合的方法。使用了一个具体的例子来展示如何通过编程手段统计并找出出现频率最高的三个连续用户行为。

1026

被折叠的 条评论
为什么被折叠?



