微博用户相似度分析

本文探讨了微博用户相似度分析的多种方法,包括标签传播算法、关键词拟合算法、时间差分拟合算法和好友聚合算法。通过这些算法,可以评估用户之间的关系密切程度和兴趣匹配度,并考虑了时间因素和社交行为的影响。

微博的几个操作:原创、转发、回复、阅读、关注、@。其中,前四个是针对短博文;关注和@则针对的是用户之间的关系,关注某个人就意味着你成为他的粉丝,而他成为你的好友;@某个人意味着你想要他看到你的微博信息。


1)标签传播算法

只针对用户标签:

    a)对每一个用户,根据其初始标签生成标签向量X={x1,x2,...xn}。

    b)对每一个用户,令Y = X1 ∩ X2 ...∩ Xm = {y1,y2,...,yk},表示其好友和粉丝的标签向量的交集;对Y的每一个分量yi,统计yi在X1 ∪ X2 ...∪ Xm中出现的频率。

    c)选择向量Y中频率最高的K个标签分量作为该用户的K个标签。

    d)重复b、c直到每个用户的标签变化不大。

2)关键词拟合算法

只针对用户微博:

    a)对每一个用户,根据其微博内容分词,生成关键词向量X={x1,x2,...xn}。

    b)对该用户的每个好友和粉丝Xi,用 | X ∩ Xi | 除以 | X ∪ Xi | 表示Xi与X的微博相似程度。

    c)根据该相似度对标签传播进行加权。

3)时间差分拟合算法

考虑时间因素造成用户兴趣的变化:

    a)对每一个用户,只选取最近300条或最近100天发出的微博,每30条一组或10天一组,对每组微博的贡献加不同的权值,分别是r,r*r,r*r*r...。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值