博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
吴恩达机器学习笔记 —— 17 推荐系统
阅读量:6646 次
发布时间:2019-06-25

本文共 916 字,大约阅读时间需要 3 分钟。

本章讲述了推荐系统相关的知识,比如基于内容的推荐算法、基于协同过滤的推荐算法以及实践中遇到的问题。

更多内容参考

推荐系统是机器学习在工业界应用最广泛的方向,很多电子商务类、咨询类的平台都在做个性化推荐的工作,通过机器学习的算法让自己的平台个性定制,千人千面。

o_wuenda17_1.png
比如我们拥有这样的数据集,其中nu代表用户的个数,nm代表物品的个数,r(i,j)为1代表用户j对物品i有评分,y(i,j)代表用户j对物品的分值。

基于内容的推荐

现在我们有了上面的数据集,即用户对电影的评分。还有电影的两个特征,浪漫指数和动作指数,假设我们针对每个用户都有一个θ,使得θTx能预测到一个分值——可以看做每个用户拥有一个线性回归的公式,通过这个公式,可以跟电影的两个特征(还有一个偏置项,固定为1)计算出分值。

其中r(i,j)是用户J对电影i是否有评分,y(i,j)是对应的分值,θ(j)代表用户j的参数向量,x(i)代表电影i的特征向量,因此对于用户j对电影i的评分就是(θ(j))T(x(i)),m(j)是用户j评分的电影数量。因此就有下面的公式:

o_wuenda17_2.png

协同过滤

前面的算法有一个特点就是需要有每个电影的特征向量,这个需要人为的来标注,如果你的数据没有这种现成的向量,而是有用户的偏好特征。比如知道一个用户对两个特征的喜好程度x,又知道他对这个电影的评分,那么就可以猜测出来这个电影对应的特征指数了。

比如上面的例子中如果用户的洗好向量是[0,5,0],对于第一个电影它的评分又是5,第五个电影评分时0,我们就可以猜到第一个电影的特征是[1,1,0],第五个电影是[1,0,1],这样就可以猜测出来每个电影的特征指数了。

总结来说,如果有电影的特征向量,就可以猜测出来用户对电影的评分;如果有用户的特征偏好,也可以猜测出来电影的特征指数。还有一种简单的方式就是随机给定θ,然后训练得出x,再通过x训练得出θ——这就是矩阵分解的意思啊!

o_wuenda17_3.png

o_wuenda17_4.png
这里讲到了通过评分矩阵可以计算相似物品,其实这也是物品协同过滤的核心:
o_wuenda17_5.png
有一个实践的小技巧,如果用户对任何的物品都没有评分,那么可以先给他初始化成均值(我们在做推荐系统的时候,这种用户一般都不会用协同过滤来做推荐)
o_wuenda17_6.png

转载地址:http://udyto.baihongyu.com/

你可能感兴趣的文章
我们需要一台怎么样的车载空气净化器?
查看>>
死性不改!2015年全球最差密码还是它
查看>>
韩国军方被黑,韩方表示:肯定是朝鲜人干的!
查看>>
数字企业的三大备份与归档策略
查看>>
Facebook推出Events应用 帮用户找到有趣活动
查看>>
预告:人工智能的冰与火之歌:回顾2016,展望2017(主讲人:余凯)丨硬创公开课...
查看>>
从摩拜单车看懂不同物联网制式
查看>>
商业模式解析:基于 SaaS 和交易系统的 SEM 生态系统
查看>>
新疆将建大数据平台解决农产品供需难题
查看>>
PTS铂金版横空出世!想做双11?简单!
查看>>
“生物黑客”未来可植入大脑 “阿凡达”将无处不在
查看>>
Windows 10创意者更新升不升?看完这5点遗憾再决定
查看>>
海康威视保持高效增长:前三季度营收破200亿
查看>>
vue.js条件渲染
查看>>
【云计算的1024种玩法】搭建个人博客
查看>>
Windows 10 Build 16226发布:任务管理器新增GPU追踪
查看>>
淘富成真平台——淘宝众筹绿色推荐通道
查看>>
《Scala机器学习》一一1.7 总结
查看>>
“无条件安全”的量子通信,这些知识你应该知道
查看>>
最佳身份管理建议
查看>>