东拉西扯:当搜索遭遇社会
社会的概念融入软件,是一次真正的革命,它开启了一扇窗户,让技术与人、与社会的结合,展现出新的可能,也让冷冰冰的IT因此第一次有了人味儿。
近来很多人在谈论社会化搜索,但究竟什么才是社会化搜索,似乎并无定论。但很明显,以Google为代表的,以链接、关键词为核心的搜索引擎,在日益膨胀的海量信息面前,已经显得越来越力不从心。就像Ben Hunt所说,我并不想要248,000个结果,我只要一个、一个、最好的那个。
Yahoo!在社会化搜索方面用力不小,除了收购del.icio.us、Flickr、Upcoming、WebJay等有着浓厚社会化色彩的网站,还自己开发了My Web。据Yahoo!搜索产品副总裁Eckart Walther说,My Web的目的是要建立一种“社会化”的搜索引擎。它可以搜索特定群体常用和信任的网站内容,从而弥补普通海量搜索的不足。
但正如《商业周刊》所说,Yahoo!的社会搜索,是将搜索由一个被动行为变成一个互动行为,但首先要做的就是建立足够大的社区网络。这也就是麦田所说的“社会化搜索=社区”,我并不完全同意这个看法。
我们常常会遇到这样的情况,我知道某个特定的信息一定存在于某个我不知道的角落,我需要的只是借助机器和人的力量,将它找到。比如,我要找1995年比尔·盖茨那份著名的备忘邮件“互联网大潮”的全文,我知道它一定存在,但是很难被现有的搜索技术找到。就像前面Ben Hunt要找的,只是一名住得离他不远,可以帮他清理房间的清洁工人,而不是24万个结果。Hunt可能最终会求助于他的邻居、朋友,而不是一个搜索社区。
一个搜索社区,无论它有多庞大,都不可能穷尽所有已存在的信息。这样的社会化搜索,在某些专业领域可能有效,但在更大的生活领域,就会失灵。因为它不但舍弃了24万个结果,同时也舍弃了其中可能真正有用的结果。My Web的不温不火,也证明了这一点。在很多时候,My Web确实可以让我们的搜索结果变得更少,但却没有变得更好。
社会化搜索仍然要依赖算法,仍然要依赖现有的可检索数据,而不是做一个社区,利用一下人肉搜索引擎就能解决问题。搜索的社会化并不是降低了算法的重要性,恰恰相反,它让算法变得更加重要、更加复杂,因为人成为软件工作的对象,人的属性、人的行为、人的关系、以及人产生的所有数据,都成为影响搜索结果的重要因素。
任何算法,都有着不断改进优化的可能,但人们发现,越到后来,这种改进的效果越不明显。典型的例子是机器翻译,早期机器翻译过两三年,准确率就能从70%提升到80%,用户可以明显感觉到这种进步。但现在,花费同样的时间和精力,可能只能把准确率从95.1%提升到95.2%,而用户根本感受不到这种提升。这让机器翻译成为可以大规模商用产品的时间,变得遥遥无期。
Google负责工程与研究的高级副总裁Alan Eustace个人最看重的一个方向,还是机器翻译。但这里的机器翻译,不再是过去的机器翻译。它借助Google现有的海量数据,从中找出同一原文的不同译本,并加以分析。也就是说,机器翻译不再只是锲而不舍地改进自身算法,它必须从人的鲜活的工作中获得灵感,不断进化。Eustace认为,长远看,单纯某一种语言的搜索将变得没有意义,因为互联网终将打破语言的限制,就像它曾经打破地域的限制一样。其他语言的内容,将通过你熟悉的语言呈现给你。
当然,今天距离语言限制的真正打破,还有很遥远的距离,但这种“万物皆备于我”的境界,还是很令人憧憬的。但即使到那时候,Google仍然不能说,它实现了“整合全球信息,使人人皆可访问并从中受益”的使命,除非它成为一个完全可以为“我”定制的搜索引擎。
机器翻译遇到改进的瓶颈时,换一个思路又会海阔天空。搜索引擎也一样,社会化搜索可能只是让现有的搜索技术换一个思路的问题。
Trackback URL: http://www.haloscan.com/tb/geneboy/115931875719456728/
0 Comments:
Post a Comment
返回首页