--小组: 推荐系统

金牌译作 推荐系统的艺术、科学和生意

1868个读者 翻译: 小白  09/28/2007 原文 引用 双语对照及眉批 字体大小

雷已经翻译过了,比我翻译得好,推荐一下:http://www.yeeyan.com/articles/view/thunder/361

去年(2006)10月,Netflix发起了一场不寻常的竞赛。这个在线电影租赁公司悬赏1百万美元寻找能将他们的推荐引擎性能提高10%的人。Netflix以勇于创新和大胆行动著称,在这样的大背景下,1百万美元对于这样的生意来说并不是一个大数字。

这项赛事仍在继续中(它“将至少持续到2011年10月2号”),那么,这是一次商业炒作还是一次用较少钱做研究的尝试?一个更好的推荐是Netflix真的需要呢,还是可有可无?现在Netflix正面临苏醒的巨头BlockBuster的挑战,它当然需要寻找竞争优势。一个好的推荐系统能够为这项服务留住并且吸引用户。比如,当一个用户归还一部电影的时候,推荐一部他们可能喜欢的另一部电影——这可以增加更多的回头客。

浏览和推荐

一个好的推荐引擎不光对Netflix起着重要作用,对任何电子商务网站都是如此。这是因为两个基本的在线行为——搜索和浏览。当一个客户清楚地知道她要找的东西的时候,她会去搜索。但是当她并不是在找一个特定东西时,即在浏览。浏览过程对推荐系统来说是一个黄金机会,因为用户并不是专注于某一件东西——她需要建议。

在浏览过程中,用户的注意力(和他们的钱)谁都可以去争取。通过展示一些具有吸引力的东西,网站可以将交易的可能性最大化。所以,如果一个网站能提高推荐的成功几率,它就能赚更多的钱。显然,这是一个很困难的问题,但是解决它的激励也很大。主要的方法可以分为以下几类:

  • 个性化推荐(Personalized recommendation) —— 根据个人过去的行为推荐
  • 社会化推荐(Social recommendation) —— 根据类似用户过去的行为推荐
  • 物品推荐(Item recommendation) —— 根据物品本身推荐
  • 上述3种方法综合使用

我们现在来通过一些网站看看这几种不同的方法:老的网站如亚马逊(Amazon),新兴网站如Pandora(译者注:音乐推荐网站)和del.icio.us(译者注:书签网站,有翻译为美味书签)。

亚马逊 —— 推荐之王

亚马逊被誉为在线商城,尤其是个性化推荐的领袖。过去十年,该公司已投入了大量的金钱和智力建成一套智能推荐系统,它会考虑你的历史浏览记录,过去的购买记录和其他购物者的记录——所有这些都是为了确保你能买东西。让我们看看亚马逊推荐系统的各个模块,来了解他们到底是怎么工作的。下面几块是我登陆Amazon之后看到的主要部分:

recommendation_engines2.jpg

这一块是社会化推荐。可以看到,它的分析性很强,从统计学上帮我分析了购买一件物品的理由。同时,它也是一项个性化推荐,因为推荐基于我最近点击的一个物品。

http://www.readwriteweb.com/images/recommendation_engines3.jpg

上面这块是基于新版本的物品推荐(Item recommendation)。点击"Why is this recommended for you?"(为什么推荐这个给你)链接,可以查看我的购买历史记录。所以,这也是一个个性化推荐,因为它是基于我过去的行为的。

在这个页面还有四个其他的模块,每一块都组合运用了上述的几种个性化推荐机制。我们用表格总结如下:

http://www.readwriteweb.com/images/recommendation_engines4.jpg

                               亚马逊个性化推荐系统

你的浏览历史                                    你的购买历史

实际的物品                                        新的版本(物品推荐)

相关物品(物品推荐)                       相关物品(物品推荐)

其他人购买(社会化推荐)               其他人购买(社会化推荐)

系统是对称和全面的,这不足为奇。所有的推荐都是基于个人行为的,再加上物品本身的信息或者是亚马逊其他用户的行为。不管你想购买的原因是什么:这件物品跟你以前的买的东西相关,或者是其他人里面很流行,这个系统都会促使你把这件物品放到你的购物篮里面去。

除了亚马逊

亚马逊的系统相当棒。它是一个协作购物和自动化的天才,几乎没法复制。这个系统花了亚马逊十年的时间来建造和完善。它基于一个超大的物品和集体行为数据库,该数据库“记住”了你在几年以前和几分钟以前的行为。新公司要怎么样才能跟它竞争呢?

令人惊讶的是,确实是有方法的。答案在一个与在线购物没什么关系的领域找到——遗传学。如你所知,这门科学是研究DNA片段,即基因,是怎么对人类的特征和行为进行编码的。比如说,一个家庭的成员相貌和行为是相像的,因为他们有相同的基因片段。遗传学作为一门科学已经存在150多年了,它为医学和历史学提供了强大的工具。但是在2006年1月6日,事情发生了意想不到的转变——Tim Westergren和他的朋友们决定将遗传学的概念应用到音乐上。

潘多拉(Pandora)——基于基因的推荐系统

音乐基因组计划旨在将音乐分解成基本的基因片段。其背后的想法是,我们喜欢一段音乐是因为它的属性——为什么不利用音乐片段之间的相似性做一个音乐推荐系统呢?这种类型的推荐引擎属于物品推荐(Item recommendation)。但是新奇而深刻的是,像一段音乐这样的物品,它的相似度需要通过它的“基因”构成来衡量。

recommendation_engines5.jpg

这个项目经过多年的奋斗和处理大量的音乐,积累了足够的数据,并推出了这个服务:潘多拉(Pandora)。潘多拉的成功在于它的精确性和输入的简洁。用户只要选出一个艺人,或者一首歌,就可以建立一个始终播放类似音乐的电台。

这种快感是难以抗拒的。潘多拉理解是什么导致音乐相似,所以他可以在不知道用户喜欢什么的情况下抓住他们。潘多拉不需要知道用户的口味和记忆,因为它有自己的——基于音乐DNA。当然,有时它可能并不完美,因为用户的口味并不是完全固定不变。但是它很少出错。

一个自然的问题是,这种基于基因的方法可以用在其他领域吗——比如书籍,电影,红酒,旅馆或旅游地点?每一种分别由什么构成基因?比如,我们是否能够说,红酒的基因就是那些形容口味的东西:黑莓味、泥土味、水果味、复杂、混合等等。而对于书,基因是否就是描述情节的词?如果我们认为基因就是那些使得物体独一无二的东西,那么各种东西都可以毫不费力地用基因来描述。在过去的几年里,我们在网上就大量地做了这样一件事:标注。

美味书签(Del.icio.us)——标签是否能成为基因?

潘多拉启动成本很大,因为有成千上万个音乐片段需要人工注释。而del.icio.us的社会化书签现象则用到了另一个方法——让人们自己去注释。这种自组织的方法很好用,而且del.icio.us在早期的使用者中迅速地流行了起来。现在,del.icio.us已经不单单是一个书签网站了——它还是一个新闻站点和一个搜索引擎。但是del.icio.us是一个推荐系统吗?

recommendation_engines6.jpg

答案是肯定的。这里有一个基本的推荐系统,它基于一个基因——标签。比如在上面的图中,我们看到了使用linux标签的一些流行的链接,同时,我们也看到了相关的标签比如open source和ubuntu.但是一个更让人兴奋的推荐系统是基于多标签匹配的。不幸的是,现在这种启发式的方法并不总是管用。这也是其推荐特征并不明显的原因。但是幸运的是,它对读写网(Read/Write Web)的页面很有效,产生了大量相似博客的列表。(见下面的"related items"):

recommendation_engines7.jpg

所以,del.icio.us的方法极有可能被用于构造一个自组织分类和推荐系统。通过足够的用户量和更多打磨,社会化标签可以产生一个对书籍、红酒和音乐都很管用的推荐系统。当然,前提是标签要好到足以成为基因!

结论

推荐引擎是在线交易系统和用户体验很重要一块。零售商们有很大的激励向那些“只是浏览”的用户推荐产品,来诱导他们购买。Amazon.com,这个领域的领袖,提供令人瞩目的个性化服务。其他零售商面临的问题是缺少用户信息和基础架构。

最近被应用到推荐系统的一些方法,比如潘多拉的基因灵感和del.icio.us的社会化标签,都是值得思考的。这些方法能即时地产生推荐,而不需要用户暴露他们的喜好和过去的历史记录。不管将来怎样,亚马逊,潘多拉,美味书签都是拥有非凡推荐系统技术的典范。我们赞赏他们,并期待着接下来会出现什么。

继续阅读
  • Top 100 web2.0网站 最热门的100个网站

    视频 *YouTube :YouTube(你的视频)是一个可以让用户免费上传、观赏、分享视频短片的热门视频共享网站 *Meta Cafe: Metacafe (麦塔咖啡厅)-得到最好的网上视频-搞笑...

  • 十亿消费者

    十亿消费者——来自中国商界第一线的经验 作者:James McGregor   翻译:白痴年代 前言    这原本是从北京飞往沿海城市福州的一次常规飞行。航空公司是一家新成立的国有公司,飞机也是新进...

  • 网站推荐机制中的艺术、科学与商务问题

    (译者:网站推荐机制是电子商务或内容网站的核心功能之一。例如你在一个网站买了一本书后,网站会推荐其他你可能会感兴趣的书。这被认为是亚马逊等电子商务巨头成功的关键。本文对几个出色的推荐系统进行了较透彻...

  • Amazon S3-独立软件开发者的好帮手

    介绍Amazon S3的功用

  • 《连线》杂志2008商业趋势之五:眨眼企业家的崛起

    著名科技期刊《连线》推出2008商业趋势系列文章“悲观经济中的乐观主义”。这一篇的主题是:眨眼企业家(instapreneur)的崛起。

  • “哈利波特”点缀亚马逊数字魔法

    哈利波特和他的巫师伙伴们或许将掀起一场数字出版波澜。在线图书销售商亚马逊已经计划发布无线电子阅读设备,一种泛文学的iPod,它已经迫使英国出版商争先恐后的去争取这一数字出版的一系列权益。

  • Amazon Kindle 提供新出版平台

    Amazon推出Kindle无线阅读器后,又推出了DTP电子文书平台,从内容上开始数字出版领域的革新。

  • 云计算:着眼于天空

    关于远程计算的技术不断的涌现出来,但是关于这个概念的本身对很多人来说仍然是云里雾里。这篇文章,带你近距离观察“云计算”。

相关小组

标签:

内容有问题?请与我们联络。

译作评分

  • Currently 5.00/5
  • 1
  • 2
  • 3
  • 4
  • 5
 5.0  |  1 个评分

0条评论    0眉批

添加评论

欢迎访问译言网。在这里,您可以。。。

阅读
发现
翻译