大数据技术原理与应用 第四篇 大数据应用 推荐系统

文章介绍了大数据在互联网领域的应用,尤其是推荐系统如何通过分析用户历史记录进行个性化推荐。推荐系统包括专家推荐、统计推荐、基于内容的推荐、协同过滤以及混合推荐等多种方法。协同过滤分为基于用户的UserCF和基于物品的ItemCF,两种方法各有优缺点,UserCF更社会化但计算复杂,而ItemCF更个性化但可能导致推荐多样性不足。

第十五章 大数据在互联网领域的应用

一、 推荐系统

1.1 推荐系统介绍

推荐系统是大数据在互联网领域的典型应用,它可以通过分析用户的历史记录来了解用户的喜好,从而主动为用户推荐其感兴趣的信息,满足用户的个性化推荐需求

推荐系统是自动联系用户和物品的一种工具,和搜索引擎相比,推荐系统通过研究用户的兴趣偏好,进行个性化计算。推荐系统可发现用户的兴趣点,帮助用户从海量信息中去发掘自己潜在的需求

作用:推荐系统可以创造全新的商业和经济模式,帮助实现长尾商品的销售。可以通过发掘长尾商品并推荐给感兴趣的用户来提高销售额。这需要通过个性化推荐来实现

1.2 推荐方法

推荐系统的本质是建立用户与物品的联系,推荐方法包括如下几类:

专家推荐:人工推荐,由资深专业人士进行物品筛选和推荐,需较多人力成本

基于统计的推荐:基于统计信息的推荐(如热门推荐),易于实现,但对用户个性化偏好的描述能力较弱

基于内容的推荐:通过机器学习的方法去描述内容的特征,并基于内容的特征来发现与之相似的内容

协同过滤推荐:最早和最成功的推荐方法之一,利用与目标用户相似的用户已有的商品评价信息,来预测目标用户对特定商品的喜好程度

混合推荐:结合多种推荐算法来提升推荐效果

1.3 推荐系统模型

完整推荐系统通常包括:用户建模模块、推荐对象建模模块、推荐算法模块

用户建模模块:根据用户行为和属性数据分析用户兴趣和需求

推荐对象建模模块:根据对象数据对推荐对象进行建模

推荐算法模块:基于用户特征和物品特征,计算用户可能感兴趣的对象,并根据场景对推荐结果进行一定调整,将推荐结果展示给用户

二、协同过滤

协同过滤作为最早、最知名的推荐算法,不仅在学术界得到了深入研究,而且至今在业界仍有广泛的应用。协同过滤可分为基于用户的协同过滤和基于物品的协同过滤

2.1 基于用户的协同过滤

UserCF算法(“趣味相投”),即兴趣相似的用户往往有相同的物品喜好:当目标用户需要个性化推荐时,可以先找到和目标用户有相似兴趣的用户群体,然后将这个用户群体喜欢的、而目标用户没有听说过的物品推荐给目标用户

UserCF算法的实现主要包括两个步骤:

第一步:找到和目标用户兴趣相似的用户集合

第二步:找到该集合中的用户所喜欢的、且目标用户没有听说过的物品推荐给目标用户

关键:实现UserCF算法的关键步骤是计算用户与用户之间的兴趣相似度。

2.2 基于物品的协同过滤

基于物品的协同过滤算法(简称 ItemCF 算法)是目前业界应用最多的算法

ItemCF算法是给目标用户推荐那些和他们之前喜欢的物品相似的物品。ItemCF算法主要通过分析用户的行为记录来计算物品之间的相似度

ItemCF算法与UserCF算法类似,计算也分为两步:

第一步:计算物品之间的相似度;

第二步:根据物品的相似度和用户的历史行为,给用户生成推荐列表。

关键:ItemCF算法通过建立用户到物品倒排表(每个用户喜欢的物品列表)来计算物品相似度

2.3 UserCF算法和ItemCF算法的对比

  1. UserCF 的推荐更偏向社会化,而 ItemCF 的推荐更偏向于个性化
  2. UserCF 随着用户效目的增大,用户相似度计算复杂度越来越高。而且UserCF推荐结果相关性较弱,难以对推荐结果作出解释容易受大众影响而推荐热门物品
  3. ItemCF 倾向于推荐与用户已购买商品相似的商品,往往会出现多样性不足、推荐新颖度较低的问题
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

月望曦

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值