|    |    |    |    |  
 
网站首页
home
经典案例
case studies
网站建设
web design
建站优势
advantage
解决方案
solutions
域名注册
domain
虚拟主机
host
网站推广
promotion
网站改版
upgrade
软件开发
Software
 
网站建设
  简约型网页设计套餐1080
  实惠型网站建设套餐2680
  功能型网站制作套餐6880
  行业网站建设方案
  大型网站建设解决方案
  企业网站建设流程
  网站改版与网站维护
  远煌网站设计与网站制作
套餐与方案
建站FAQ
·域名常见问题解答   ·网站空间问题解答
·网站建设问题解答   ·企业邮箱问题解答
·网站推广问题解答   ·网站维护问题解答
·网站改版问题解答   ·远煌服务问题解答
网站优化
·Google(谷歌)优化   ·百度(BaiDu)优化
·雅虎(Yahoo)优化    ·Alexa排名优化   
·Google AdSense   ·DMOZ目录提交  
建站知识
·网站建设知识·网站名词解释·网站运营知识
·网络营销知识·搜索引擎知识·实用技术文摘

 
您当前的位置: 首页 >> 网站建设 >>网站优化>>谷歌(Google)优化
     谷歌(Google)优化
主 题: Google工程师详述Google的搜索结果排列算法


图书馆管理员们提出最多的问题之一是:“对于什么样的结果应该位于搜索列表的最上方,Google是如何选择的?”现在品质工程师马特-卡兹介绍了快速入门的知识,解释了Google是如何在网上爬行和索引,以及如何评定搜索结果等级的。马特也向学校图书馆管理员提出建议,告诉他们如何辅导学生。

爬行和索引

在你浏览包含了Google搜索结果的网页之前,要发生很多事情。首先是在万维网数以十亿计的网页上爬行和索引,这个工作是由Googlebot完成的,它负责与全球的网络服务器连接以收集文件。爬行不是真的在网上漫游,而是访问网络服务器返回到一个特定的网页上,接着扫描该网页建立超链接并为每一个网页编上号码。爬行可收集大量的文件,但这些文件还不能直接用于搜索。

如果没有索引,在你想查询如“civil war”(南北战争)等内容时,Google的服务器将不得不在你每次搜索时阅读每一份文件的内容。因此第二个步骤是要建立一个索引,这样就需要“转换”爬行所获得的数据。为了不必在每一份文件上扫描每一个单词,就需要在数据上做些文章,以便显示包含了特定单词的所有文件。例如,假设单词“civil”在编号为3、8、22、56、68和92的文件上出现过,而单词“war”出现编号为2、8、15、22、68和77的文件上。

一旦建立了索引,就开始对文件进行等级评定并确定它们的相关性。假如某个人上Google搜索并输入“civil war”,为呈现和评价搜索结果需要做两件事:一是查找包含了用户提问的网页;二是按照相关性排定匹配网页的位置。Google已经开发出一个有趣的技术可加速第一步骤的过程:不是将所有索引存储在一台电脑上,而是使用数百台电脑做这种工作。由于任务被分配到很多电脑上,使得查询答案更为迅速。

为更加形象地描述这个过程,可以设想下一本30页厚书的索引。如果一个人在索引中查找数页的信息,那么每一次搜索都至少需要花几秒钟的时间;但如果你将索引的每一页分给不同的人去查找呢?三十个人分别查找索引的不同部分,要比一个人独自查找快的多。同样,Google也是将数据分配到各台电脑上以便可以更快地查找文件。

如何查找包含了用户提问的网页?让我们返回到上面举的“civil war”例子。单词“civil”在编号为3、8、22、56、68和92的文件上,单词“war”在编号为2、8、15、22、68和77的文件上,我们可以在网页上显示文件并寻找包含两个单词的文件(从下表中可以看出是8、22和68号文件)。

单词civil 3 8 22 56 68 92

单词war 2 8 15 22 68 77

两个单词都出现 8 22 68

包含了一个单词的文件列表被称为“文件标识列表”,查找包含两个单词的文件被称为“文件标识列表的交集”。

评定搜索结果

有了包含用户提问的网页后,就该按照相关性评定网页了。Google使用了很多技术,其中PageRank算法是最有名的。PageRank评定的是两种事情:从网站到某一网页有多少个链接,提供链接的网站的排名。使用PageRank,来自CNN和纽约时报网站的链接的价值,是很多不太有名网站的两倍。

除了PageRank外Google还使用了很多其他技术,例如一份文件所包含的“civil”和“war”两个单词靠的很近,就比只使用了“war”单词的包含“Revolutionary War”(独立战争)的文件相关性要大的多。另外在题目中出现了“civil war”的网页,它的相关性就比题目为“19th Century American Clothing”(19世纪的美国服装)要重要的多。同样如果“civil war”在网页上出现了数次,比出现一次的网页要相关的多。

Google的目的是要找到知名度和相关性都大的网页。如果两个网页出现匹配提问的信息数量几乎一样,我们常常会选择更有名网站的链接。但如果其他方面表明一个网页更为相关,也会选择更少链接或更低排名的网页。例如,一个网页全篇都是讲“南北战争”的内容,会比只是略微提到“南北战争”的网页更为有用,即使这个网页是出现不太有名的网站上。一旦我们有了文件的列表和分值,就会选择最高分值、最匹配的文件。

Google从包含了提问单词的每一份文件中提取几句话作为摘要显示,接着将排好的URLs和摘要显示在搜索结果上。正如你所知道的运行一个搜索器需要大量的计算资源。每一次搜索需要500台以上的电脑一起工作,搜索的时间还不到半秒钟。

友情提示:我想做网站 、 解答我的建站疑虑 、 欣赏你们的网页设计作品  、 先看看你们的网站建设案例  、我要改版网站 、 我需要网站推广 、 不,我打算优化网站,提高我的站点访问量。

如果您对网站建设谷歌(Google)优化资料阅读还有疑问,
欢迎拨通我们的技术支持专线:020-38808725,方便我们可以更好的为您服务。
 本文标签:网站制作 网站建设 建网站 建站   录入: 【广州网站建设】  编辑: 广州网站建设公司【YaCoer】
【 字体: 收藏】  打印关闭】【作者:网络转载】【来源:网络转载】
  相关链接:
·企业网站建设有什么意义?·企业建站的重要性及作用
·做网站究竟有什么用?·企业自助建站跟企业网站建设有什么不同?一样吗?
·我在某某网站申请登记了会员,我有必要做一个网站吗?·什么是动态网站和什么是静态网站?有什么区别?
·网站应该做几种语言版本呢?·小企业建网站的主要作用
·做好网站建设提高市场透明度·企业建设网站免费送.CN域名
·网站建设的2.0时代——新生网站集群技术·企业网站建设市场仍将混乱下去
·中审咨询网站建设顺利完工·如何做网站的高质量内容呢?
·远煌结缘‘康大’集团大型网站建设·2007网站建设获热捧
·上海地铁“美女卖身求财”称为支援商业网站建设·网站建设的十点注意事项
·无网不胜的中小企业网站建设·企业网站建设应注意著作权问题
·WEB2.0与企业网站建设是什么关系?·黄金周的新玩法:网上搜索+拼客
·网络虚拟货币遭遇“封杀令”·面向读者 百度推出图书搜索
 
  合作伙伴:              
  主营业务: 广州网站建设   广州网页设计   广州制作网站   商城网站建设   大型网站建设   企业网站建设   行业网站建设   英文网站建设   注册域名   推广网站   改版网站
建站套餐  |  网站建设方案  |  网站策划  |  做站疑虑  |  服务订制  |  付款方式  |  人才招聘  |  服务与支持  |  关于我们  |  联系我们  |  网站地图  |  web design
远煌科技     广州网站建设公司专业网站建设网页设计网站制作公司【YaCoer】 © YaCoer.Com
电话:+86-20-38847510、38847550 传真:020 - 38808725  MSN:gzYeFor@hotmail.com
我们为您提供高品质的网站建设网站制作网站设计网页设计建设网站服务!
网站建设咨询
大型项目咨询