失效链接处理 |
商品搭配大数据推荐方法研究综述 PDF 下载
本站整理下载:
提取码:xajv
相关截图:
主要内容:
1 引言
互联网信息技术的快速发展,在给人们的生活
和工作带来极大便利的同时,也带来了信息超载[1]
的问题。虽然以搜索引擎为代表的信息检索系统
如谷歌、百度等可以帮助用户过滤和筛选信息,但
只能满足大众的简单需求,无法满足个性化的用户
需求。因此,个性化推荐系统应运而生,成为当前
解决“信息超载”问题的有效方法[2]。它根据用户
需求、兴趣爱好等,通过推荐算法从海量数据中挖
掘用户感兴趣的信息、商品等,以个性化列表的形
式推荐给用户。目前,个性化推荐系统广泛应用于
很多领域,其中在电子商务领域的应用最为典型并
具有良好的发展前景。随着电子商务的发展,用户
需求的满足越发艰巨,传统个性化推荐系统[3,4]的
多样性差、覆盖率低等问题日益显著。但是,大数
据时代的到来,使商品数据的表现变得丰富多样,
使搭配推荐成为可能,为大数据环境下的个性化推
荐提供了一条有效途径。
商品搭配推荐是个性化推荐中的一个新方法,
它从用户消费行为中挖掘信息,比相似推荐更具实
际意义。例如,用户网购一件衬衫后,通常会选购
一条裤子来搭配,而不会再去浏览衬衫。生成这些
搭配信息最直接的做法是人工标定:让众多搭配专
家来手工标定哪些商品是相搭配的。在传统商业
中商品数量少,这一方法具有可行性;而在如今的
电商中,用户和商品的数量巨大,虽然可以通过众
包(Crowdsourcing)[5]等 方 式 实 现 大 规 模 标 注,但
成本会非常高。例如阿里众包需要给每位参与者
一定的酬劳。因此,关于如何自动化地生成商品间
的搭配信息的研究,对学术界和工业界分别具有较
高的学术研究价值和广阔的应用前景。
在学术界,国内外许多大学和研究机构对商品
搭配大数据推荐方法开展了广泛的研究,涌现出了
各具特色的搭配推荐方法。例如将卷积神经网络
引入搭配推荐,自动提取数据特征;对用户行为和
商品信息进行过滤、建模,挖掘商品间的搭配关系
等。但是,目前搭配推荐的研究还存在一些挑战与
问题,例如,多源异构数据的融合;商品类目更细粒
度的划分;商品图像背景复杂,给图像内容识别带
来了巨大的挑战等[6]。
在工业界,由于互联网公司的竞争越来越激
烈,而且用户是最重要的资源,因此只有不断地提
升用户体验,才能防止用户流失。随着用户个性化
需求的增强,互联网公司对商品搭配推荐的研究越
来越重视。例如,阿里云举办了面向全社会开放的
淘宝穿衣搭配算法竞赛,报名和参赛无时间限制并
提供永久排行榜,只为能给用户提供优质、专业的
个性化穿衣搭配推荐。目前,商品搭配推荐方法已
在各大电商平台有了不同程度的应用,有效地提升
了电商系统推荐结果的准确度、覆盖率、新颖性和
多样性。根据 搜 狐 网 报 道,2017年 中 国 网 络 零 售
总额高达67100亿元,同比增长30.1%。作为亚
洲最大的购物网站淘宝网更是在2018年双十一狂
欢节创下了单日交易2135亿元的记录,表现出了
我国电子商务蓬勃发展的活力[7]。对用户而言,有
效的搭配推荐解决了用户在海量商品中发现自己
所需商品耗时长的问题,带来了更好的购物体验;
同时,对商家而言,搭配推荐可以促进用户购买或
点击行为的发生,提高商品销量,增加经济收入,具
有重要的商业意义。
到目 前 为 止,关于传统推荐方法的研 究 综
述[1,2,8,9]已有不少,但这些方法只是针对商品的相
似推荐,很少提及搭配推荐。本文是第1篇专门对
现有搭配推荐方法进行研究的综述,针对已有的研
究成果进行 分 析 比 较、综 述 总 结 并 对 未 来 提 出 展
望,为从事研究搭配推荐方法的学者和业界人士提
供借鉴与参考,以期商品搭配大数据推荐方法在学
术界进一步推动推荐技术的发展,在工业界创造出
更高的商业价值。 2 概述
2.1 商品的搭配推荐和度量
商品搭配推荐是从商品信息、用户信息及用户
与商品的交互行为等大量数据中挖掘商品之间的
搭配关系,根据用户已经购买的商品向其推荐可搭
配商品,或直接向用户推荐搭配好的商品套装。商
品搭配推荐一直是个备受人们关注的问题,与其相
关的工作最早可以追溯到频繁项集挖掘(Frequent
Item-setMining)[10]。该方法通过分析商品 的 历
史购买记录来生成搭配关系,即经常被共同购买的
商品可能是相搭配的,最经典的案例便是“啤酒”与 “尿布”。
但是,频繁项集挖掘依赖于商品的历史购买记
陈 鑫等:商品搭配大数据推荐方法研究综述 73
录,所以存在“冷启动”问题,即无法为那些没有历
史购买记录的新商品生成搭配信息[11]。为了解决
冷启动问题,需要引入除历史记录以外的其他信
息,比如内 容 信 息 (Content-based)等。相 较 历 史
记录信息,内容信息更为稠密,且不会出现老商品
有信息而新商品没有信息的情况,因为所有商品都
有自己的类目、标题及图像等信息,从根本上克服
了冷启动问题。
商品搭配度表示2个商品之间的搭配程度,可
以用来产生每个商品对应的搭配商品列表。关于
商品搭配度的数学定义,研究者们从不同角度给出
了不同的 公 式,相关内容见文献[6,12-15]。本 文
分别选取西南交通大学孙广路[6]在其博士论文中
给出的商品搭配度定义和浙江大学钊魁[14]在其硕
士论文中给出的搭配度计算公式详作介绍。 (1)对于2件商品,如果大量用户一起购买,说
明它们在某些方面是搭配的,搭配度的取值为[0, 1],如式(1)所示: Wc = 1,N ≥F 0.6,0< N <F 0,N = 烅烄烆 0 (1)
其中,N 是购 买 的 用 户 数 量;F 是 阈 值,可 根 据 需
求自行设置。搭配度的粒度可以划分得更细,这里
划分了3个等级,对于一般需求也是足够的。 (2)钊魁[14]提 出 了 基 于 深 度 样 式 匹 配 的 商 品
搭配推荐,设计了一个对拍卷积神经网络(Siamese
ConvolutionalNeuralNetwork)对 2 个 商 品 标 题
所组成的短文本对进行建模:首先,通过卷积神经
网络将每个商品的标题表示为1个多维实数向量;
然后,将实数向量映射到特定的搭配空间中;最后,
在搭配空间中计算2个商品间的搭配度,计算公式
如式(2)所示: p(y=1|q,c)=σ(xTqMxc +b)= 1 1+e-(xTqMxc+b) (2)
其中,如果2个商品q与c相搭配,则标定y=1,否
则标定y=0。通过卷积神经网络分别将2个商品
的标题映射 为 实 数 向 量xq ∈Rn 与xc∈Rn 。M ∈ Rn×n是搭配 矩 阵,把它所张成的空间称为搭配空
间,b是一个标量,矩阵 M 与b 都是模型训练过程
中需要 学 习 的 参 数。对xa 线 性 变 换x′q =xTqM,T
表示对矩阵转置,x′q表 示 与q 最 相 搭 的 样 式,因 此
与q最相 搭 的 就 是 与x′q线性核距离最近的商品。
通过在亚马逊和淘宝这2个数据集上的实验表明,
该方法能够有效地提高搭配推荐的准确度。
2.2 研究内容
简单而言,商品搭配推荐就是依据一定的输入
数据遵循 特 定 的 搭 配 算 法 给 出 相 应 的 推 荐 结 果。
输入数据有多种多样的类型,包括商品内容信息、
用户属性信息、用户对商品的行为信息、领域知识
等。推荐结果则是推荐给用户的商品列表,按照搭
配算法计算的搭配程度的优先级别展现给用户。
目前,商品搭配大数据推荐方法的研究内容主
要包括以下几个方面: (1)商品图像的特征提取。深度卷积神经网络
的层次结构可以对图像语义特征进行表示,这也使
得其在许 多 图 像 分 类 和 识 别 任 务 上 取 得 了 成 功。
通过卷积神经网络对商品图像进行特征提取,可以
计算商品图像特征的相似度来进行商品搭配推荐。 (2)多 源 异 构 数 据 的 融 合。由 于 数 据 来 源 多
样、结 构 复 杂,研 究 者 们 提 出 从 商 品 内 容、领 域 知
识、用户交互的角度,分别建立商品搭配度度量模
型,表示商品之间的搭配程度。通过将各种数据融
合到搭配推荐技术中,可以根据用户的需求和习惯
推荐不同的搭配方案。 (3)挖掘商品间的搭配关系。在搭配推荐中,
商品间的关系是重要的基础信息。通过对商品内
容信息、用户属性信息和用户对商品的行为信息进
行过滤、建模等处理,可以挖掘商品间的搭配关系,
从而应用于搭配推荐方法中。 (4)多种搭配推荐算法的融合。目前,搭配推
荐算法各具特色。例如,基于商品内容的搭配推荐
反映大部分人的搭配偏好,基于协同过滤的搭配推
荐更具个性化。如果将这2种算法融合再综合推
荐,则可以满足用户对于推荐结果同时兼备个性化
和流行性的推荐需求。
2.3 应用实例
在电子商务的推动下,商品搭配推荐系统一直
保持着较高的研究热度。表1给出了商品搭配推
荐系统在国内外商业领域的典型应用,应用领域涉
及电商网站、服装 APP和饮食 APP。
Table1 Typicalapplicationsofbigdata
recommendationmethodsofcommoditycollocation
表1 商品搭配大数据推荐方法的典型应用
应用领域 应用名称
电商网站 淘宝网,京东商城,Amazon,唯品会
服装 APP 穿衣助手,衣橱,衣品会潮流百搭
饮食 APP 食物搭配大全,薄荷健康,妙健康
以淘宝网为例,它的搭配推荐应用在系统中的
83 ComputerEngineering& Science 计算机工程与科学 2020,42(1)
很多地方,具体包括: (1)收藏夹页面。根据用户收藏的商品给出搭
配推荐。在该页面中,左侧一列展示了用户收藏夹
里面的商品,在 商 品 右 侧 有 “找 搭 配”选 项。点 击
该选项后便会展示搭配推荐结果。 (2)商品的详情页面。例如,浏览淘宝网时随
机进入一件商品的详情页面,然后向下滑动页面,
在商品的参数、评价等信息下方展示了根据该商品
推荐的可搭配商品。目前,淘宝网只有部分商品附
带这个搭配推荐模块。 (3)加入购物车页面。用户将感兴趣的商品加
入购物车后,向用户推荐与已经加购的商品相搭配
的商品。 3 商品搭配推荐方法分类
目前,学术界和工业界对推荐系统类型并没有
统一的划分标准,传统的推荐方法主要包括协同过
滤推荐、基于内容的推荐和混合推荐。本文通过充
分调研当前商品搭配推荐方法的研究情况,根据推
荐方法中使用的文本、图像数据类型并结合传统推
荐方法的分类,将当前的研究主要分为如下3类。
3.1 基于商品内容的搭配推荐
基于商品内容的搭配推荐关注商品的内在属
性信息,通过内容相关性进行搭配推荐,可以有效
地解决冷启动问题[16]。商品内容一般包括文本信
息与图像信息。文本信息有标题、价格和商品类目
等,图像信息可以通过深度学习技术进行处理,从
而生成搭配信息。在具体的搭配场景中,图像一般
聚焦于服饰类商品的搭配推荐,而标题一般用于常
规商品的搭配推荐。 (1)基于商品图像的搭配推荐。
本文从图像处理技术上分别介绍研究者们提
出的基于商品图像的搭配推荐。 ①基于分割理解图像的搭配推荐。Jagadeesh
等人[17]通过 图 像 分 割(ImageSegmentation)算 法
从街头照片中直接解析出相搭配的衣服,他们假设
街头照片中人们所穿的衣服是相搭配的,因此通过
图像分割算法把不同的衣服从图像中分割出来后,
这些衣服便形 成了具有搭配关系的商品。
Yamaguchi等人[18]通过计算视觉上的相似来扩展
由图像分割所生成的搭配信息。Di等人[19]则做了
更进一步的探索,关注于样式相关的精细化属性信
息,比如是否有纽扣、帽子等。他们首先以人工方
式精细化地标定了若干衣服,形成数据集 WFC,然
后利用这一数据集建立起基于属性搭配的服装搭
配模型。②基于卷积神经网络处理图像的搭配推荐。
目前深度学习已成为互联网大数据和人工智能的
一个研究热 潮[20],卷 积 神 经 网 络 作 为 深 度 学 习 中
一种重要的应用模型,能较好地解决图像中出现的
复杂多变、低分辨率等问题,在图像处理领域得到
了广 泛 的 应 用[21]。 Mcauley 等 人[22]与 Veit 等 人[23]通过图像信息为所有类别中的商品生成搭配
信息。他们先利用卷积神经网络处理商品的图像
信息,再利用图像中所反映的相似性来衡量商品间
的搭配程度。文献[24]提出了基于深度学习的搭
配推荐系统,首先根据用户的历史购买数据筛选出
召回集;其次通过计算商品标题文本信息的余弦相
似度,获得待预测搭配商品的召回集;然后通过搭
配类别过滤 并 根 据 其 各 自 的 命 中 率 加 权 融 合[25];
最终,通过卷积神经网络提取图像特征,并使用逻
辑回归模型计算召回集同测试集的搭配概率,利用
该概率对融合召回集进行修正重排序,从而向用户
提供搭配推荐,进行关联销售。实验表明,使用卷
积神经网络提取的特征在逻辑回归模型中会产生
较好的分类效果,提高了搭配推荐的准确度。
|