查看: 1262|回复: 2
打印 上一主题 下一主题

搜索引擎的几大秘密

[复制链接]
跳转到指定楼层
楼主
发表于 2008-4-16 01:19:36 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
新丰家园网,新丰百事通。
1、两个最基本的词汇:搜索引擎(SearchEngine):通过运行一个软件,该软件在网络上通过各种链接,自动获得大量站点页面的信息,并按照一定规则进行归类整理,从而形成数据库,以备查询。这样的站点(获得信息==>整理建立数据库==>提供查询)我们就称之为“搜索引擎”。而所使用的软件一般叫做“Spider”、“crawlers”等。分类目录(Directory):通过“人工方式”将站点进行分类而建立数据库,以提供查询,这样的站点叫着“分类目录”。典型的搜索引擎如AltaVista、Excite、HotBot、Inktomi等,而最重要的分类目录就是Yahoo。
实际上无论“搜索引擎”还是“分类目录”,目标都一样:获得网站资料,建立数据库提供查询。只不过使用的方法不同。
“搜索引擎”因为依靠软件自动进行,因此,其数据库的容量非常庞大,但是伴随着查询结果往往不够精确;而“分类目录”由于依靠人工分类,查询得到的信息要准确些,但收集的内容非常有限。
我们平时把这两类统称为“搜索引擎”,在下面的讨论中我们将以“自动”的搜索引擎为主,至于“人工”的如Yahoo,我将会在“中文Yahoo”中单独讨论。
2、主要的搜索引擎:

七个最主要的搜索引擎及各自包括的页面数:引擎AltaVistaNorthernLightInktomiExciteLycosInfoseekWebCrawler页面数(百万页)1501251105550452(以上数据为1999年2月1日统计值)
3、搜索引擎工作的三步:

第一步是“Spider”软件访问一个站点,并通过其中的链接阅读该站点的页面,而且“Spider”会不时的自动回访该站点以检查变化情况;
第二步是该“Spider”获得的站点信息形成一个巨大的网络信息库,如同整个网络上已经访问站点的备份,当然记录的不是所有的内容。这也就是我们所说的数据库。
第三步是查询服务。这是通过查询软件实现的,当你输入查询内容,该软件就会在其数据库中找到相关内容,然后按照“它的”规则进行排序。
4、搜索引擎在查询时是如何排名的:最主要是根据一个站点的内容与查询词的关联程度,但是一个站点的内容搜索引擎又是如何确定的呢?——标题(Title)、关键词(Keywords)、描述(Description)、页面开始部分的内容以及这些内容本身之间的关联程度。而且现在绝大部分搜索引擎都支持MetaTag。


囝囝
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏 支持 反对 微信
沙发
发表于 2008-4-17 23:05:44 | 只看该作者
比较复杂。。

丨丨
板凳
发表于 2008-4-19 12:12:13 | 只看该作者

CC

广播台

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|掌上论坛| 新丰家园网

© 2004-2018 新丰家园网. All Rights Reserved.

Powered by Discuz! X3.2 Licensed 粤ICP备2024327970号 网站联系QQ:89919308 电话:0751-2289503

快速回复 返回顶部 返回列表