ITnews 版 (精华区)

发信人: petrel (紫燕*自在飞花轻似梦*燕燕于飞), 信区: ITnews
标  题: 斯坦福大学找到新方法 Google速度再提高5倍
发信站: 哈工大紫丁香 (Sat May 31 09:27:08 2003)


斯坦福大学找到新方法 Google速度再提高5倍 
(2003.05.29)   来自:计算机世界网   JAVIS编译  
 
 
 
  
 
  用户喜欢Google的原因是因为它速度足够快,但斯坦福大学的一个科研小组已经找到
了使它的速度提高5倍的方法。

  据该科研小组称,速度增加后,Google能够针对每个用户进行优化。例如,体育爱好
 者在搜索“tiger”这个词汇时,搜索结果将是与高尔夫球明星“老虎伍兹”相关的网页
,而不会出现大量的与自然界的老虎相关的网页。

  目前,Google的分类系统依赖于一种名为PageRank的方法,它根据有多少其它网站与
之相连计算Web网站的普及程度和相关程度。该大学在一份声明中表示,计算10亿Web页的
PageRank需要数天的时间,Google目前处理的网页高达30亿个,每个个性化或与主题相关
的分类也需要数天时间进行计算。

  为了加快PageRank的计算,斯坦福大学的科研人员已经开发了三种基于数字线性代数
的技术。第一种被称为BlockRank的技术的效果最显著,将计算PageRank的速度提高了3倍
,研究人员发现,大多数网站上80%以上的链接都指向相同的网站。PageRank单独计算每个
链接,而BlockRank将所有指向相同网站的链接作为一个整体进行处理。

  第二种技术利用了数学上的归纳法。研究人员称,与PageRank的遍历整个网站才能够
计算出其归类相比,归纳法的速度提高了50%。

  第三种被称为自适应PageRank的技术基于这样的事实,即排名较低的网站的计算速度
更快,通过剔除这样的网站,计算的速度能够提高50%。

  尽管这些方法各有优点,但斯坦福大学的科研人员相信,当综合应用时,它们的威力
会更大。该项目的成员之一斯藩达表示,通过综合使用这些技术,进一步提高速度是可能
的。我们初步的试验表明,综合应用这些技术,可以将PageRank的计算速度提高5倍。当然
了,还有一些问题需要解决,我们已经快要完成基于主题的PageRank计算。

  斯坦福大学科研人员的理论在目前也还仅仅是“理论”,他们与Google本身没有任何
官方的联系。Google公司的发言人表示,Google将考虑采用斯坦福大学的技术。
 

--

                    ·  一沙一世界,一花一天堂  *





※ 来源:.哈工大紫丁香 bbs.hit.edu.cn [FROM: 172.16.8.35]
[百宝箱] [返回首页] [上级目录] [根目录] [返回顶部] [刷新] [返回]
Powered by KBS BBS 2.0 (http://dev.kcn.cn)
页面执行时间:3.816毫秒