失效链接处理 |
统计推荐系统 PDF 下载
下载地址:
版权归出版社和原作者所有,链接已删除,请购买正版
用户下载说明:
电子版仅供预览,下载后24小时内务必删除,支持正版,喜欢的请购买正版书籍:
http://product.dangdang.com/27943319.html
相关截图: 资料简介: 推荐系统是一类自动化的计算机程序,能够在不同场景下将物品和用户进行匹配。推荐系统无处不在,已然成为我们日常生活的一部分。例如,亚马逊购物网站上的产品推荐,雅虎上的内容推荐,Netflix上的电影推荐,领英上的工作推荐等。匹配算法的构建需要用到大量高频数据,它们来源于用户与物品的历史交互行为。从本质上来看,推荐算法属于统计学范畴,在序贯决策过程、高维类别数据的建模以及开发可伸缩的统计方法等领域都面临着挑战。在推荐系统领域,算法的推陈出新依赖于计算机科学家、机器学习专家、统计学家、优化专家、系统专家,当然还有领域专家之间的密切合作。可以说,推荐系统是大数据领域振奋人心的应用之一。 资料目录:
出版者的话
译者序
前言
部分 基础知识
第1章 简介2
1.1 面向网络应用的推荐系统概述3
1.1.1 算法3
1.1.2 优化指标5
1.1.3 探索与利用之间的权衡5
1.1.4 推荐系统的评估5
1.1.5 推荐和搜索:推送与拉取6
1.2 一个简单的评分模型:热门推荐7
1.3 练习10
第2章 经典推荐方法11
2.1 物品特征11
2.1.1 分类12
2.1.2 词袋模型13
2.1.3 主题建模15
2.1.4 其他物品特征16
2.2 用户特征16
2.2.1 声明的个人信息17
2.2.2 基于内容的画像17
2.2.3 其他用户特征18
2.3 基于特征的方法18
2.3.1 无监督方法18
2.3.2 有监督方法19
2.3.3 上下文信息22
2.4 协同过滤22
2.4.1 基于用户-用户相似度的方法23
2.4.2 基于物品-物品相似度的方法24
2.4.3 矩阵分解24
2.5 混合方法27
2.6 小结28
2.7 练习28
第3章 面向推荐问题的探索与利用29
3.1 探索与利用之间的权衡简介30
3.2 多臂赌博机问题31
3.2.1 贝叶斯方法31
3.2.2 极小化极大方法34
3.2.3 启发式赌博方案35
3.2.4 方法评价36
3.3 推荐系统中的探索与利用36
3.3.1 热门推荐36
3.3.2 个性化推荐36
3.3.3 数据稀疏性的挑战37
3.4 处理数据稀疏性的探索与利用37
3.4.1 降维方法37
3.4.2 降维中的探索与利用39
3.4.3 在线模型39
3.5 小结40
3.6 练习40
第4章 评估方法41
4.1 传统的离线评估方法41
4.1.1 数据划分方法42
4.1.2 准确度指标44
4.1.3 排序指标45
4.2 在线分桶测试49
4.2.1 设置分桶测试49
4.2.2 在线性能指标50
4.2.3 测试结果分析51
4.3 离线模拟52
4.4 离线回放54
4.4.1 基本回放估计55
4.4.2 回放的扩展57
4.5 小结58
4.6 练习58
第二部分 常见问题设置
第5章 问题设置与系统架构60
5.1 问题设置60
5.1.1 常见的推荐模块60
5.1.2 应用设置63
5.1.3 常见的统计方法65
5.2 系统架构66
5.2.1 主要组件66
5.2.2 示例系统67
第6章 热门推荐69
6.1 应用案例:雅虎“今日”模块69
6.2 问题定义71
6.3 贝叶斯方案72
6.3.1 2×2案例:两件物品,两个间隔73
6.3.2 K×2案例:K件物品,两个间隔75
6.3.3 一般解77
6.4 非贝叶斯方案79
6.5 实验评估81
6.5.1 比较分析81
6.5.2 方案刻画83
6.5.3 分段分析85
6.5.4 桶测试结果86
6.6 大规模内容池87
6.7 小结87
6.8 练习88
第7章 基于特征回归的个性化89
7.1 快速在线双线性因子模型90
7.1.1 FOBFM概述90
7.1.2 FOBFM详解91
7.2 离线训练93
7.2.1 EM算法94
7.2.2 E步骤95
7.2.3 M步骤96
7.2.4 可扩展性97
7.3 在线学习97
7.3.1 在线高斯模型97
7.3.2 在线逻辑模型98
7.3.3 探索与利用方案99
7.3.4 在线模型选择99
7.4 雅虎数据集上的效果展示100
7.4.1 My Yahoo!数据集101
7.4.2 雅虎首页数据集103
7.4.3 不包含离线双线性项的FOBFM105
7.5 小结105
7.6 练习106
第8章 基于因子模型的个性化107
8.1 面向回归的隐因子模型107
8.1.1 从矩阵分解到RLFM108
8.1.2 模型详解109
8.1.3 RLFM的随机过程112
8.2 拟合算法113
8.2.1 适用于高斯响应的EM算法114
8.2.2 适用于逻辑响应的基于ARS的EM算法118
8.2.3 适用于逻辑响应的变分EM算法121
8.3 冷启动效果展示124
8.4 时间敏感物品的大规模推荐127
8.4.1 在线学习127
8.4.2 并行拟合算法128
8.5 大规模问题效果展示130
8.5.1 MovieLens-1M数据131
8.5.2 小规模雅虎首页数据132
8.5.3 大规模雅虎首页数据134
8.5.4 结果讨论137
8.6 小结138
8.7 练习138
第三部分 进阶主题
第9章 基于隐含狄利克雷分布的分解140
9.1 简介140
9.2 模型141
9.2.1 模型概述141
9.2.2 模型详解142
9.3 训练和预测145
9.3.1 模型拟合145
9.3.2 预测150
9.4 实验150
9.4.1 MovieLens数据150
9.4.2 Yahoo! Buzz应用151
9.4.3 BookCrossing数据集153
9.5 相关工作154
9.6 小结155
第10章 上下文相关推荐156
10.1 张量分解模型157
10.1.1 建模157
10.1.2 模型拟合158
10.1.3 讨论159
10.2 层次收缩模型160
10.2.1 建模160
10.2.2 模型拟合161
10.2.3 局部增强张量模型164
10.3 多角度新闻文章推荐165
10.3.1 探索性数据分析166
10.3.2 实验评估171
10.4 相关物品推荐176
10.4.1 语义相关性177
10.4.2 响应预测177
10.4.3 预测响应和预测相关性的结合178
10.5 小结178
第11章 多目标优化179
11.1 应用设置179
11.2 分段方法180
11.2.1 问题设置180
11.2.2 目标优化181
11.3 个性化方法183
11.3.1 原始表示184
11.3.2 拉格朗日对偶185
11.4 近似方法188
11.4.1 聚类188
11.4.2 采样189
11.5 实验189
11.5.1 实验设置190
11.5.2 实验结果191
11.6 相关工作197
11.7 小结198
参考文献199
索引205
|