ITnews 版 (精华区)

发信人: petrel (紫燕*自在飞花轻似梦*燕燕于飞), 信区: ITnews
标  题: “后Google”时代的搜索技术(下) 
发信站: 哈工大紫丁香 (Tue Mar  4 21:29:30 2003) , 转信

“后Google”时代的搜索技术(下) 
(2003.03.04)   来自:日经BP   八木 玲子  
 
 
 
  
 
  靠“快”换代的技术 

  不靠信息的质,而是通过强调“快”来换代的技术目前也在开发之中。这是向Google
不擅长的即时性较强的信息检索发起挑战的一种尝试。NTT在goo中试验性公开的“最快新
闻报道检索试验服务”。 

  进行互联网检索时,总会产生从页面收集到生成索引之间的时间延迟。要尽可能地减
少这一延迟,以便实现新闻等即时性较强的信息检索。 

  上述试验使用了NTT研究所开发的技术。不仅缩短了页面收集的时间间隔,而且还通过
使多个收集引擎协调工作,减少无谓的收集。另外,还采用了可实时进行更新的结构索引
。目前虽然只是限定在以新闻为对象的搜索上,但是“由于其原理是通用的,因此还可以
应用于其他搜索方面”(多媒体终端项目小组负责人首席研究员茨木久)。 

不存在“绝对正确的检索” 

  但是,互联网搜索无法如何也不可能得到“绝对正确的检索结果”。 

  “绝对正确的检索”是指不仅可以收集到所需的信息,而且还可得到没有“杂质”的
结果。首先是收集性问题。在永远变化的互联网中收集全部信息是不可能的。因此,“还
有其他所需的数据”的可能性是无法否认的。另外在“无杂质”方面也同样难以做到。因
为即便是同一语句的检索结果,什么样的内容是“杂质”,也大都会因人而异。“谁都不
可能知道互联网检索结果是否正确。在数量庞大的文件每天都会增加的环境中要求检索的
精度是没有意义的。因此就不可能有结果”(日本Inktomi公司产品技术部长太田佳伸)。
 

  另外,即便从商业角度来看,要想具有像Google那样的势力是非常困难。因为“在互
联网中信息越是集中,所集中的东西就越强。二流公司很难生存下去。有了Google这种一
流公司,指望成为二流公司就难以开发业务”(富士通研究所IT媒体研究所档案研究部松
井部长)。另外,还有商业模式上的限制。“仅靠广告收入很难收回搜索服务所需的规模
达数千台的设备投资。众多搜索站点越来越多地将搜索业务外包给Google的趋势也是不难
理解的”(NEC研究室互联网系统研究所信息流通主任研究员福岛俊一)。

 




--

※ 来源:.哈工大紫丁香 http://bbs.hit.edu.cn [FROM: 202.118.239.94]
[百宝箱] [返回首页] [上级目录] [根目录] [返回顶部] [刷新] [返回]
Powered by KBS BBS 2.0 (http://dev.kcn.cn)
页面执行时间:4.935毫秒