关于tagging的认知分析
(或tagging的低认知成本是怎样使其流行起来的)
(译者:tagging就是由网友自己对其内容添加标签,然后通过标签对网页内容进行自动分类,这种通过标签分类的方法又称为“自由分类法”。就像译言的翻译工具里面会让译者填写文本的标签一样,这使读者很容易找到与其文章有相同标签的文章。但是这样随意分配标签的方法也存在缺乏规范,缺乏统一,随意性大的缺点。)
我得承认,一开始我对tagging是持反对意见的。从我第一次接触tagging(在del.ico.us和flicker上),我就认为tag是一件非常容易的事情。但我却花了很多时间去理解tagging的认知过程。由此产生了“Rashmi关于tagging的理论”--该理论是我提出的关于我们在给一个东西(译者:网页,文章等)加标签时所经历的认知过程的一些假设,以及这个认知过程与“分类法”的认知过程有什么不同的假设。我希望以此来解释为什么tagging越来越流行,并为tagging/分类系统的设计提供一些意见和建议。
我的理论大多是在认知心理学、人类学的基础上,通过观察人们如何对网页等做标签,并通过标签将网页等互相联系起来得出的。这只是初期的认识,随着认识的加深还会对其进行修改,因此欢迎大家多提反馈意见。
去年tagging(1)的快速流行就是对人们认为自己写标签是多么容易和有趣的证明。问题是我们应该如何从认知的角度来解释这一现象。为此,我又重新翻出了自己尘封已久的认知心理学课本。这是我以前的学习内容(2)。
(如图),分类是两步认知过程。
第一步:激活相关类目 第一步要做的是计算对象(译者:对我们来说有价值的对象,如文章,图片,书籍……)和
候选概念之间的相似度。例如,我在图书馆看到《雪崩》(snowcrash)一书,霎时间就有几个相关的语义概念在我脑中
被激活了:“书”、“科幻小说”、“尼尔史蒂芬生”(译注:该书作者)、“黄道带”(译者:Zodiac,史蒂芬生的另
一部小说。)等等。其他概念可能就更加个人化(personal)。如“最喜欢的作者”,“飞机旅行”。另外的一些被激活
的概念可能会和书本身的特点有关,如:“平装本”、“很旧”。
我们是怎么知道这些的呢?认知心理学家研究这一现象的方法是:请人们列出他们关于某个物体产生的语义联想,然
后将这些联想分类,并测算它们出现的频率。另外一种方法是利用“内隐认知方法”去探测对象脑中生成了哪些概念。随
着功能性磁共振(fMRI)技术的出现,已经可以做到依据体内血液的流向——流至大脑的哪个部位——来判断概念的生成
。这方面的细节与本文无关,重要的是,认知心理学家对于此类“概念激活”现象已经有了广泛共识。
到目前为止,我们了解了相关概念是如何被激活的。记下这些相关概念是很简单的。标注行为在这一阶段没有任何限
制,你产生了多少联想都可以标上去。从认知角度上来讲,这就是tagging所做的工作。是的,就是这么简单。
另一方面,分类的工作才刚刚开始。
第二步:做出决定。既然我们已经列出了候选的类目,就需要在这些类目中做出选择。哪一个类目才是最好的呢?从认知角度讲,这个过程相当简单——就是计算款目和候选类目之间的相似度。Shepard-Luce(ppt)描述了人们是怎样做出决定的。
(该过程听起来很吓人,其实不然。选择最佳类目是我们一直都在做的事情。当我们看到一个动物,它是一只狗还是狼。我们会很快判断出来。这就是一个最基本的认知过程——把某物归类,这样的事情连小鸟也能做到。在我读研究生的时候,隔壁实验室的教授 就在研究白鸽是如何分类的。有证据证明婴儿 也能进行分类。)
从认知角度来讲,我们天生就具有分类的能力。那么,为什么我们还会觉得分类这么困难呢,尤其是在数字化环境下——例如把邮件归类到不同的文件夹中,对书签分类,对文件分类等。下面一些因素引导出一个理论,我称之为“激活后分析瘫痪”。
首先,在数字化领域在待分类的对象之间缺乏文化共识。分类通常是基于文化知识。例如,我们多年来在狼和狗,沙发和椅子,水果和蔬菜之间形成了文化共识。而对数字化对象来说,在分类方面就没有达成这样的共识——事实上,tagging的目标就是为我们传达数字化生活中的文化知识。(这本身就是一个有趣的话题而且值得我们对其进行研究)。
在数字化环境,我不仅是对一个对象进行分类,也要优化该对象在将来的易找到性(findability)。因此,我们不仅要选择最接近该款目的类目,也要考虑查找时人们最容易使用哪个类目来查找该款目。这两个问题的答案可能会冲突,并使分类过程更复杂。
同时,对于数字化对象,这不仅仅是adhoc分类——为某对象分配一个类目,该类目是任何一个你能想到的类目。我们要考虑整个分类方案(译者:也就是从整体角度考虑分类是否合理)。类目分配是否不平衡?是否一个类目拥有了过多的对象,而其他类目的对象又相对较少呢?如果我把所有的东西都分为一类,将永远不可能找到任何东西。是否需要为对象分配一个新的类目?该对象是否适合这个类目呢?
在数字化环境中考虑整个类目方案比起每天做出分类决定来说要重要得多。例如, 遇到一个动物,把它归类为狗。我没必要担心自己分的类是否太大,是否需要给他分配一个子类。从认知角度来说,对我们遇到的对象做出按照个人感觉和印象分类就够了,大脑具有神奇的计算功能,这其中包括前面对动物的分类。当我成为一个对狗有研究的专家,我就会为狗这个类插入一些诸如宾格狗、dachshunds和terriers(译者:关于狗的一些品种)等的子类,但是这时我不用考虑该类目的结构。下次当我遇到一只terriers狗时,很神奇的,terriers这个子类就会被激活。试想一下若将该方法应用到email文件夹中,会为我们省去多少工作啊。
最后,一旦完成了对数字对象的分类就无法再改动了。其实也可以改动,但代价是高昂的。你得从第一个类别中把对象取出来,再放到第二个类别中去。用户界面在这里要起到重要的作用--大多数系统假定你一旦完成分类就不会再改变了。根本就不给你提供改动的功能。而Gmail聪明的地方就在于它把加标签和长期保存邮件这两项功能区分开了。
思考一下这些内容再回过头来理解“激活后分析瘫痪”。你害怕自己会做出错误的决定。该对象将会因此而永久消失——他会被隐藏在一些找不到的地方,或者是难以到达的地方,最后从你的眼中消失。
回到我们开始时的问题——tagging为什么很简单。我认为他忽略了决策——(选择匹配的类目),对大多数人来说,免除了的“分析瘫痪”这一步。(注意,很多人还是会在选择正确的tag标签上犯难,或者说寻求一种优化其可寻找性的方法。但是可以肯定的是tagging会改进得比现在更好。)
关于tagging的另一个观点——它提供了 即时本质和社会反馈( immediate self and social feedback)。每一个tag都体现了你的个人喜好。你会自觉找到自己所属的社会群体。别人是怎么看到该对象的呢?这些零散的反馈创造了一个循环的积极的累加效果,使得你更加频繁地使用标签tag。这不会使tagging变得容易,但会使其更有趣。
总之,tagging的成功之处就在于它从一个现存的认知过程入手而没有增加额外的认知成本。在认知层面,人们已经做出了个人主观的,概念性的观察。tagging从整个分类方案中分离出这些概念性观察。tagging系统所面临的挑战就是做人的大脑所能做的事情——对个人主观观察进行智能计算,并寻找一个有效的、可预测的确保款目易寻找性的方法。
1:我所说的tagging是针对flicker和del.icio.us上的tagging-将一个款目和一些词语关联,记录下这些关联。在本文中,我关注的是tagging过程的输入过程-个人为款目分配标签tag,而不是tagging过程的输出过程或者通过tag找到信息的过程。)
2:对于阅读本文的认知学专家——我很清楚自己对认知的解释是简版,省略了许多细节。但是我相信已经说明了其工作原理。











关于tagging的认知分析(或tagging的低认知成本是怎样使其流行起来的)
翻译:

雷声大雨点大 大学士 | Blog
对这一篇期待已久。难度很大。辛苦了,KK!
02/21/2007
KK 探花
谢谢啊!
大家觉得有用就好啊!
多亏了“雷声”的帮助啊!
不然好多时候就偏题了
02/22/2007
sandralee 童生
不错的文章。很有些参考价值,但是总感觉不够透彻。
作者提出了问题,没有给出任何可能的方向和门径。
也就是说,Tag如何克服散漫或者怎么克服面对分类一样的困境呢?如果Tag解决不了分析障碍,可能不少人还是会选择不用它。
另外,不知道大家看来,Tag的使用真正成为大部分网民的习惯了么?即便不是自己增加,会使用Tag搜索也算。
02/27/2007
lawrence 状元 | Blog
另外,KK, sandralee,你们没有听说过“私人体验”这个说法?
03/01/2007
sandralee 童生
个人看法:私人体验已经算是贴切,至少清楚表达了含意。
KK此前的困惑不在于某个单词,可能是整句话的含义不太明白。再或者是对Tag的这种东西本身的机制不是很清楚?我瞎猜的,错了的话,请KK原谅。
03/01/2007
雷声大雨点大 大学士 | Blog
感谢sandralee 和 lawrence 这两天大量认真细致的评论,也对KK虚心听取意见、进行修正致意。这么多有价值的讨论,埋没了太可惜,所以我们立刻加了浏览全部评论的功能。请点主页最新评论下的“更多”链接。或直接点这里:http://www.yeeyan.com/main/all...
03/01/2007
sandralee 童生
给雷声大雨点大提个小建议:
既然全站的评论都汇集起来了,是不是可以在每个人自己的首页上把每个人的评论汇集显示呢?
应该是个非常实用的功能。
03/02/2007
雷声大雨点大 大学士 | Blog
好建议!做好了。北京时间,今天夜里,您睡觉的时候推出 :)
03/02/2007