ITnews 版 (精华区)
发信人: petrel (紫燕*自在飞花轻似梦*燕燕于飞), 信区: ITnews
标 题: “后Google”时代的搜索技术(下)
发信站: 哈工大紫丁香 (Tue Mar 4 21:29:30 2003) , 转信
“后Google”时代的搜索技术(下)
(2003.03.04) 来自:日经BP 八木 玲子
靠“快”换代的技术
不靠信息的质,而是通过强调“快”来换代的技术目前也在开发之中。这是向Google
不擅长的即时性较强的信息检索发起挑战的一种尝试。NTT在goo中试验性公开的“最快新
闻报道检索试验服务”。
进行互联网检索时,总会产生从页面收集到生成索引之间的时间延迟。要尽可能地减
少这一延迟,以便实现新闻等即时性较强的信息检索。
上述试验使用了NTT研究所开发的技术。不仅缩短了页面收集的时间间隔,而且还通过
使多个收集引擎协调工作,减少无谓的收集。另外,还采用了可实时进行更新的结构索引
。目前虽然只是限定在以新闻为对象的搜索上,但是“由于其原理是通用的,因此还可以
应用于其他搜索方面”(多媒体终端项目小组负责人首席研究员茨木久)。
不存在“绝对正确的检索”
但是,互联网搜索无法如何也不可能得到“绝对正确的检索结果”。
“绝对正确的检索”是指不仅可以收集到所需的信息,而且还可得到没有“杂质”的
结果。首先是收集性问题。在永远变化的互联网中收集全部信息是不可能的。因此,“还
有其他所需的数据”的可能性是无法否认的。另外在“无杂质”方面也同样难以做到。因
为即便是同一语句的检索结果,什么样的内容是“杂质”,也大都会因人而异。“谁都不
可能知道互联网检索结果是否正确。在数量庞大的文件每天都会增加的环境中要求检索的
精度是没有意义的。因此就不可能有结果”(日本Inktomi公司产品技术部长太田佳伸)。
另外,即便从商业角度来看,要想具有像Google那样的势力是非常困难。因为“在互
联网中信息越是集中,所集中的东西就越强。二流公司很难生存下去。有了Google这种一
流公司,指望成为二流公司就难以开发业务”(富士通研究所IT媒体研究所档案研究部松
井部长)。另外,还有商业模式上的限制。“仅靠广告收入很难收回搜索服务所需的规模
达数千台的设备投资。众多搜索站点越来越多地将搜索业务外包给Google的趋势也是不难
理解的”(NEC研究室互联网系统研究所信息流通主任研究员福岛俊一)。
--
※ 来源:.哈工大紫丁香 http://bbs.hit.edu.cn [FROM: 202.118.239.94]
Powered by KBS BBS 2.0 (http://dev.kcn.cn)
页面执行时间:4.935毫秒