大军阀完整版 资源共享:挖掘搜索2.0的线索

来源:百度文库 编辑:偶看新闻 时间:2024/04/30 23:44:05
挖掘搜索2.0的线索 关于搜索引擎大家都有或多或少的期待,因为这个在网络生活中助手级的工具,它的点滴提升都是能让所有网民都受益的好事,但是类似百度Google这些业已成熟的搜索产品,能够改进和期待的地方非常有限,更何况很多细微的内在的升级都根本都无法在搜索体验上表现出来,所以关于改变搜索产品形态、从不同角度重新解读和发展现有搜索技术的互联网产品越来越多也越有趣,这些blogbeta都有概要的翻译介绍,使用和研究这些新的所谓2.0的搜索服务以后,发现其或多或少的在某个角度发展了现有搜索引擎的,但是显然离2.0还有些距离,我希望能对于某些细节作一些补充和仔细描述,试图发现一些通往2.0的线索。

Ebrahim Ezzy写过两篇名为“Search 2.0 vs Traditional Search”的帖子,介绍了他心目中的2.0时代的搜索引擎。他认为传统的搜索引擎虽然越来越准确而且覆盖面也越来越大,但它只是简单的文本匹配,而并非人们头脑中关于这个词汇的含义,而“搜索2.0技术可以使搜索更有意义、客观和基于任务”“传统搜索引擎只对寻找信息有利,搜索2.0更善于快速发现新的信息”。

在他的定义中,传统搜索引擎是指基于信息检索技术的搜索引擎,它们的操作包括:布尔查询(boolean queries)、近似搜索(proximity searches)、文本关联(text relevance)和链接分析(link analysis),例如:Google, Yahoo, MSN, Ask。

他认为搜索2.0是他心目中的第三代搜索技术,搜索技术发展的三代划分是这样的:第一代,根据网页内容来进行网络站点评级排列,比如早期的yahoo以及Alta vista;第二代,把网络结构考虑进去,主要是依赖超链分析来评级排列,以Google和Overture为代表。第三代,是通过将现有的网络搜索引擎与新型的经过改进的关联模型进行融合设计而成的,它们看重用户的偏好、合作性、集体智慧、丰富的用户体验以及其他很多能使得信息更富有效率的特别性能,例如: Swicki, Rollyo, Clusty, Wink, Lexxe。

对于第三代,作者列举了十多个这方面的代表:Swicki、Rollyo、Clusty、Wink、Lexxe 、 Gravee 、Jookster、Otavo、 Outfoxed、Yoono、 Krugle 、Koders、LivePlasma、Truveo、 Pandora、Last.fm、Qube、ZoomInfo、ChaCha ,这些东东的确在某种程度上给我们耳目一新的感觉或者给我们打开了关于搜索引擎的新的畅想空间,但是无论从商业、产品体验等都无法给人以下一个Google的期待。

以下将从新解读各个产品来与大家讨论,并会不断补充最新涌现的类似搜索服务。

Swicki是一个社区化搜索引擎(community-driven),它允许用户对某一特定术语创建深度集中的搜索。与传统搜索相比, Swicki的搜索结果可以根据社区搜索的行为自动学习和适应,也就是说其搜索结果排序的模型的动态自我学习成长的。他与传统搜索引擎的区别在于,他引入搜索环境因素影响来改进搜索结果。把搜索者纳入到搜索的排体系中,听起来很好,很难成为一种可成长的模式,用户参与评价的驱动力是什么?如果用户分布非常偏狭,这样的用户行为也不能会对搜索结果有好的改善,更何况一旦被SPAM盯上,那将更难做到有效提升。

Rollyo是用户设定主题限定搜索站点集合的人力驱动型搜索。(可以设置包括或除外两种方式或其结合)Rollyo根据用户设定的参数决定的哪些内容哪些网址包含在他们的“SearchRoll”。用户可以创建和公开共享他们自己的个人搜索引擎。 SearchRoll不能替代传统搜索,它仅仅是一种你在特定范围内搜索你喜欢的信息工具。这与Google Coop,Yahoo个性化搜索,以及live search自定义搜索都是这种类型。 接挖掘搜索2.0的线索(1),继续介绍相关网站:

Clusty聚类式搜索引擎,他就是vivisimo的搜索服务站点,提供在搜索结果中把相关主题内容的类聚呈现,即把相似项目分组聚合。用户可以按照自己需要找寻的内容所属的主题,它超越了传统元搜索简单整合集成普通其他搜索引擎的结果,提供了对搜索结果重新进行主题类聚,大大提高了搜索结果信息的丰富程度和二次搜索的灵活体验。

Wink是people rank的典型,它能让用户给他们喜欢的结果打tag贴上标签,屏蔽阻止不相关的垃圾信息并显示最好的站点,系统根据用户手动分拣的topic特征,站点用户信任特征被屏蔽特征等形成新的排序参数,以不断优化搜索排序。Google的personalized search正在作类似的工作.

Lexxe在作的是做传统搜索引擎已经在做的,就是主攻动态摘要技术,它旨在把动态摘要摘录好的简短回答以动态页面形式直接返回给用户,代替了以住的只是寻找答案所在位置的页面。通过利用字词的层次和相关含义,它更着重于语言而非符号的处理。某种意义上是在实现问答引擎。虽然现在传统的搜索引擎已经在动态摘要和漂红策略上已经能够实现在搜索结果列表中解答用户query的问题,但是需要改进的空间依然很大。这一发展方向与其他搜索引擎所倡导的onebox策略有所相似,如创始人乔鸿亮说"lexxe引擎把用户打入文字当作语言来处理,而不是作为符号来处理。它的计算对象直接是语言,而不是一般符号,因为它具备了语言理解能力。"

Gravee有个非常有趣的商业模式,他真正试图改变搜索引擎经济的产供销关系,通过与内容所有者分享广告收益并且付报酬给它们来获得搜索结果。虽然这对于站长们来讲是一个潜在的获得收益的机会,但是从搜索引擎角度来看,对终端搜索用户没有提供任何显见的价值,与tagging、community-based ranking相比它更是个虚的概念.

Jookster是另一个社区驱动的社会化搜索工具,它基于浏览器toolbar工具栏或者button,源于用户的社交网络social network,搜索从一个用户的书签和与之相关联的有趣的站点,从本质上看,它是社交网络和搜索引擎的交叉点。有讽刺意义的是这样对于绝大多数query将会比有机的结果有更多的广告,也许当前受制于基本登陆用户(via here),数据库非常受限,它是社会化网络和搜索的混合体。其他类似的服务如Otavo; Outfoxed; Yoono

如果说传统的搜索引擎没有能解决好你的某些搜索需求,同样这些所谓的新式的搜索依然没有能根本上改变这一局面,只是他们看起来那么的有潜力要做出一些新鲜东东出来,而这些东东要改变格局,不只是需要idea,还要接受历史的考验.Krugle是为开发者设计的搜索引擎。它可以很方便的搜索到技术信息、源码并回答代码相关的技术问题。它可以从开放源码库中、存档、邮件列表、blog和网页中获得代码样本提供搜索。并且支持标签,可共享代码和搜索结果集合等。从主打优势来看,其在信息抽取上优势比较明显,这也是现在很多垂直搜索试图发展的基础,比如酷讯.他们的面向的用户群相对比较小, Krugle力图帮助程序员快速解决他们问题或获得相关信息, Koders也是这样. 专注一域也许能成就一番天地.

LivePlasma 是个提供可视音乐和电影资源搜索的引擎,可检索的资源涵盖了乐队、艺术家、电影、演员和导演等等, 界面支持多语言选择。它以基于Flash的可视化数据检索为特色,并运用了思维导图(Mind Mappin)模式,来提示信息的关联,而且它还是一个推荐式的引擎,能够发现相似的音乐和电影,给人们浏览. Truveo, Pandora, Last.fm也提供类似的服务.


Qube提供点击一次即可得到搜索结果的桌面应用,不需用浏览器/切换程序,甚至不需要输入关键字。它即时搜索已存在于屏幕上的(或手动输入的)任何文本并快速返回结果,与此同时有实时拼写检查、历史日志、字典结果等等增强搜索功能。所有这些都不会有任何操作性能损害。Qube是Ebrahim Ezzy‘s 的公司.

ZoomInfoo为人们和他们的联系信息搜捕网页(公司网址、新闻发布会、电子新闻服务、证管会申报和其它在线公共信息)。它编制有关个人公司的简明摘要,并已组织好的形式发表出来。如果你选择成为他们的客户还可以享用社会网络工具。 随着web普和增长,人的搜索引擎是一个有意义的需求,然而传统搜索引擎,比如Google,已经包含巨大的相似信息,专门的人的搜索引擎能处理这些数据并且提供一个能充分理解的格式.zoominfoo将信息采集发挥到难以想像的境界。


Collarity 称为个性化搜索引擎,是因为它会根据你的搜索习惯来给出相应的搜索结果。在Collarity中输入关键词时,搜索框下面会出现实时提示,提示类别分为个性化、社区和全球。也就是说,你可以查看符合你自己习惯的搜索结果,也可以在查看社区或大众化的搜索结果。

ChaCha提供夺图书馆实时参考咨询服务,由Scott Jones创办,人称Mr.Jones,语音邮件以及时下流行的iPod和iTunes音乐数据库中的某几项技术都和他有关。他所创建的chacha也是个搜索引擎,能提供自动化的搜索结果,同时,通过内嵌式的IM工具,能实时地向问题指导者提问进行咨询,这些所谓的问题指导者都是网站招募的“打工者”--具有特定专长经验(domain-specific experience)的人,他们会通过解答问题得到网站付给的酬劳,看来图书馆那些专业的咨询员们可以去捞点外快了。

Wondir也是类似的提供图书相关信息检索和咨询的平台,它的创始人Matthew Koll则在网络还少有人知的,上个世纪90年代初期,就开发了一套文本搜索引擎Personal Library Software(PLS)(1998年卖给了著名的AOL),90年代中期,他又第一次提出了Invisible web的概念。2004年8月创建了wondir,它的最初理念是将元搜索技术(matasearch)、深层搜索(deep search)技术以及成百上千的由图书馆员开设的AskA的数字参考服务结合起来,形成一个用matasearch搜索表层网(Open web)、用deep search搜索深层网(Invisible web)、用人(图书馆员以及志愿者)来进行实时交流,从而将表层网、深层网和人力三个方面的资源结合成一个社区(community)的知识发现、共享、交流服务。

如果你看腻了百度Google的平淡,希望新奇玩酷,也可以尝试Ms.Dewey、searchmashSnap,甚至可以换个角度看世界用倒过来的elgoog百度,依然不妨碍你的确要使用搜索引擎找东西的时候还得回到传统搜索引擎。