“如果把百度搜索引擎比做一个探照灯,在无边无际的信息宇宙中扫射,那么,那些探照灯扫射不到的区域,都是我们定义的所谓Hidden Web。目前能被搜索引擎检索到的信息只占所有信息中非常小的一部分,大部分信息存在于‘暗网’之中。”百度CTO李一男解释称,这些“暗网”之所以存在,一方面是很多人类信息并没有Web化;另一方面即使一些信息Web化了,也没有纳入到搜索引擎的检索体系。

  那么能不能挖掘出更多存在于“暗网”之中的有价值的信息,让更多人从中受益呢?这正是百度新的研发计划——“阿拉丁平台”的诞生初衷。

  “我们希望未来的搜索引擎,能像阿拉丁神灯那样,在瞬间满足用户所有的搜索需求。”李一男这样解释百度的“阿拉丁平台”,他指出,百度提出构筑“阿拉丁”平台的意义,就是为更多的“暗网”信息web化提供便利条件,同时使这些web化的信息能精准地被用户通过搜索引擎进行检索。

  在“阿拉丁计划”的支持下,搜索引擎技术可以超越现有web内容的限制,对包括“暗网”在内的所有信息进行更深一步的分析、融合、处理,确保为用户提供零成本、无障碍、无时差的精准搜索结果。

据介绍,目前百度“阿拉丁平台”的具体执行策略,在后台方面,百度主要考虑的是如何使更多暗网信息web化,如百度知道——将人脑中的信息web化,并便于搜索引擎的检索;百度图书搜索、法律搜索、百度国学——为图书馆、国学文库这样的内部数据库信息提供web化条件,并便于百度索引。

  而在前台方面,百度则主要考虑如何将搜索结果以信息融合的方式展现给用户。比如搜索“荣誉”,则需要既呈现关于“荣誉”的视频,也有关于“荣誉”的百科知识,更有各种关于“荣誉”的普通网页内容。

  “借助‘阿拉丁平台’,百度正越来越接近通过一个搜索框满足不同用户搜索请求的理想。”业内专家评价认为,百度的“阿拉丁平台”计划,已经逐渐显露成效,其“结果页内容丰富程度,比其他搜索引擎要好得多,而通过阿拉丁平台,百度在信息融合的前沿工作也成为新的搜索引擎产业标准,百度知道、百科等原属于‘暗网’的信息被越来越多其他搜索引擎纳入检索库。”

李一男透露,过多的垂直搜索会给用户带来混乱,百度希望借新平台给用户带来易用性整合服务,明年1月会推出在新平台支持下的新业务。李一男以今年汶川大地震为例说明了阿拉丁的作用,在地震消息发生后的几分钟,对汶川这个“冷僻“的地方的搜索急剧暴涨,但互联网上关于这个地方的信息并不多。而当解放军急需在汶川空降的时候,合适的空降地点很难寻找,后来根据百度贴吧的一位网友发帖提供了可供空降地点的信息,并经过诸多网友的努力传播,消息才传到指挥部,并依据这一信息完成了空降任务,而未来阿拉丁平台将能更快挖掘出这一信息,并自动提供出来。


转载本站文章请注明,转载自:神秘果

本文链接: http://www.shenmiguo.com/archives/2008/102_baidu_aladdin.html

Tags: ,

相关日志

Leave a Reply

You can use these tags: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>