爱问知识人 爱问教育 医院库

什么是搜索引擎

首页
搜索引擎关键词

什么是搜索引擎


        

提交回答
好评回答
  • 2005-11-29 22:57:34
    搜索引擎(search engines)是对互联网上的信息资源进行搜集整理,然后供你查询的系统,它包括信息搜集、信息整理和用户查询三部分。
      搜索引擎是一个为你提供信息“检索”服务的网站,它使用某些程序把因特网上的所有信息归类以帮助人们在茫茫网海中搜寻到所需要的信息。
      早期的搜索引擎是把因特网中的资源服务器的地址收集起来,由其提供的资源的类型不同而分成不同的目录,再一层层地进行分类。人们要找自己想要的信息可按他们的分类一层层进入,就能最后到达目的地,找到自己想要的信息。这其实是最原始的方式,只适用于因特网信息并不多的时候。随着因特网信息按几何式增长,出现了真正意义上的搜索引擎,这些搜索引擎知道网站上每一页的开始,随后搜索因特网上的所有超级链接,把代表超级链接的所有词汇放入一个数据库。这就是现在搜索引擎的原型。
    

    1***

    2005-11-29 22:57:34

其他答案

    2005-11-29 22:53:38
  •   一、什么叫搜索引擎?
      在Internet上有上百亿可用的公共Web页面,即使是最狂热的冲浪者也不会访问到所有的页面,而只能看到其中的一小部分,更不会在这浩瀚的Web海洋中发现你那即使精彩却渺小的一隅。当然你可以为你的存在做广告,可以用大大的字把你的URL刻在你的身体上,然后裸体穿过白宫草坪,但你得保证媒体正好在那里,并注视到了这一切。
      与其这样做,不如好好去理解搜索引擎是如何工作的?又怎样选择和使用"keywords"(关键词)等等。   本文的目的就是让众多的页面设计者在了解搜索引擎的基础上,寻求如何使自己的页面在搜索引擎索返回的列表中获得好的排列层次的方法。   "搜索引擎"这个术语一般统指真正意义上的搜索引擎(也就是全文检索搜索引擎)和目录(即目录式分类搜索引擎),其实他们是不一样的,其区别主要在于返回的搜索结果列表是如何编排的。
       二、搜索引擎是如何工作的?   搜索引擎有三个主要的基本部分。 1、搜索引擎蜘蛛   搜索引擎首先利用的是一种俗称蜘蛛(Spider)或爬虫(Crawler)的软件。搜索引擎蜘蛛访问到一个页面,读取它,然后跟随这个页面链接到这个站点的其他页面,这就是人们所说的站点被套住了或者被爬过了。
      蜘蛛会按照固定的时间不断的回来访问这个站点,如每月或每两个月,以便查看页面的变化。 2、索引   蜘蛛所找到的每一个页面放入搜索引擎的第二部分--索引。索引也可以说是目录册,就像一本巨大的书,书中包含了蜘蛛所找到的每个Web页的拷贝。如果Web页改变了,这本书当然也会更新。
      但有时蜘蛛发现了新的Web页和Web页的变化,并不是马上加到索引中去,当中间隔一段时间,就是说一个Web页被爬过了,但却不能被索引,直到这个Web页被加到了索引里才可用于搜索引擎的搜索。 3、分析软件   搜索引擎分析软件是一个搜索引擎的第三部分。
      这个程序详细审查记录在索引中的成百上亿的Web页,找出与搜索要求相匹配的那些,并按他认为最合适的相关性排列出列表,呈现在冲浪者的面前。 三、搜索引擎如何排列Web页面   用你所喜欢的搜索引擎搜索任何东西,搜索引擎几乎立刻就从他知道的几百万的页面中挑选出与你的主题相匹配的那些,呈现在你的荧屏上。
      这些网页按一定的顺序排列起来,最相关的排在最前面。   但搜索引擎并不是图书管理员,他没有能力一再地询问有关的问题来更好地定位搜索的目标,也不能依靠智力判断和过去的经验来排列网页,而人可以做到。智能化是发展的方向,但还有一段很长的路要走。   那么搜索引擎是怎样决定相关性的呢?他们依靠一套规则,主要的规则是页面中关键词出现的位置和频率,我们把这称做"位置/频率法"。
       1、位置和频率 (1)、位置   如果你到图书馆去寻找有关旅游方面的书,管理员首先会去查找题目中有"旅游"的书籍。搜索引擎也一样,关键词(即"旅游")出现在题目(Title)中的页面比那些Title中不出现关键词的页面更相关。   搜索引擎还会检查关键词是否出现在页面的顶部,如文章标题中或前面的几个段落。
      他们认为与搜索主题相关的页面在开始都会提到那些词语。 (2)、频率   频率是相关性的另外一个主要因素。搜索引擎会分析页面中关键词相对其他词语所出现的频率,频率越高,就越具相关性。 2、搜索引擎在排列网页时有一定的差异   所有的搜索引擎都有以上提到的三个基本部分,在一定程度上都符合"位置/频率法",但在具体实施上又有区别,这就是为什么我们用不同的搜索引擎做同样的搜索时会产生不同结果的原因。
         首先,有些搜索引擎会比其他搜索引擎索引到更多的Web页面,有些又会比其他引擎更新索引的频率快,所以搜索引擎索引中不可能收集完全一样的Web页面。   其次,出于某种原因,有些搜索引擎也可能给某些Web页面在排列层次上有优先权。如Excite用链接的流行度作为排列网页的一个因素,他知道在索引中哪些页面有许多指向他们的链接,他在排列时就给这些页面小小的奖励,将他们适当提前。
      这也是合理的,因为在Internet上有越多指向他们的链接,就说明这些页面更被大家看重。   另外,一些混合结构(搜索引擎和目录共存)的搜索引擎可能会把那些目录中已存在的站点的网页靠前,理由是一个站点足够好才能放到目录中,就应该有机会比那些不被列在目录中的站点的网页靠前。
         最后要强调的是,许多Web页面设计者错误地认为"Meta tags"是将Web页提到列表前列的秘密,实际上有些搜索引擎会把那些"Meta tags"中有keywords的页面靠前,有些搜索引擎根本就不读"Meta tags"。"Meta tags"是解决问题的一个方面,但并不是什么必需的绝密武器。
       四、如何提高Web页面的相关性   搜索引擎的一次搜索会返回成百上千的相关网页,一般情况下首先呈现出来的是10个最相关的页面。   任何站点都想被列在前10位,因为大多数的用户都喜欢从前10位中找到他所要的结果,排在第11位以下就意味着许多人不会访问到你的站点。
         下面就来看看如何能使你的网页排在列表前列。 1、选择合适的关键词(Keywords)   大胆地设想别人在搜索引擎的搜索框内正好输入的是你页面的Title中选择的关键词,那该多好啊!例如,如果你有一个有关邮票收藏的网页,如果你想别人任何时候在搜索框里输入"邮票收藏"时你能排在前10位,那么就为这个页面选择"邮票收藏"这个关键词吧!   网站的每一个页面都应该有反映网页内容的关键词,并且关键词至少由2个以上的字或词组成。
      通常与单个的字或词相关的网站太多太多,例如"邮票"就比"邮票收藏"所相关的网页多得多,那么竞争就激烈,网页排在前列的概率就相对低一些。所以不要怕花费时间,尽量选择2个以上的字或词组成的短语,成功的可能性会大得多。   最后,假设适当地扩展文章的涉及范围,多选几个关键词又会怎么样呢?例如,一个邮票收藏的网页可能会提到"收藏家"和"收藏",那么扩展开来,用"邮票收藏家"和"邮票收藏"增加关键词的数量也是合理的。
      可不是没有问题,因为你的网页实际上是关于邮票收藏的精典网页,应该出现在邮票收藏一类网页的前列,但你在关键词上扩展了页面的涉及范围,可能就会无意识地降低页面对于"邮票收藏"的相关性。如何决定更好,看你的想法了! 2、关键词(Keywords)出现的位置   选择好关键词后还要确保关键词出现在至关重要的位置。
      首先页面的题目(Title)是最重要的地方,忽略将关键词放进页面的题目中是许多本身具备良好相关性的网页被排在底层的原因。   其次像前面提到的,搜索引擎也看中关键词出现在页面前面的网页,所以有可能的话就把关键词作为大标题,并使得关键词出现在网页的第一段。
         特别注意的是使用表格会把网页的正文推到网页的更下面,就会造成相关性的降低。例如,画一个有两列的表格,第一列放的是对其他网页的链接,第二列才是含有关键词的正文。浏览看到的网页是这样的: -------------------------------------------------------------------------------- 主页                邮票收藏 邮票历史        邮票收藏爱好者遍布世界各地。
      每天都有成 邮票价格      千上万的人在对邮票津津乐道,并且每天的邮票 邮票展览      交易额达数百万元。点击各个栏目,你就可以得 邮票精品      到许多邮票的知识。 --------------------------------------------------------------------------------   而搜索引擎看这个页面是这样的: -------------------------------------------------------------------------------- 主页 邮票历史 邮票价格 邮票精品 邮票收藏  邮票收藏爱好者遍布世界各地。
      每天都有成千上万的人在对邮票津津乐道,并且每天的邮票交易达数百万元。点击各个栏目,你就可以得到许多邮票的知识。 --------------------------------------------------------------------------------   显然,关键词"邮票收藏"移到了下面!在这种情况下,除了使用metatags外,没有其他更好的办法。
      使用metatags对那些读metatags的搜索引擎有帮助,对其他不读metatags的搜索引擎也不是什么大不了的问题。你认为表格对你的页面很有影响,也没有必要放弃他们,喜欢的话就继续使用,不能因个别搜索引擎而破坏页面的整体性。   大量的JavaScript也和表格有一样的影响。
      搜索引擎首先读JavaScript语句,引起正常的HTML正文排后一些。这样,如有可能的话,把JavaScript语句放到页面后面一点。也可以使用metatags来帮助解决问题。 3、页面有相关的内容   如果页面没有相关的内容,即使改变页面的题目或使用metatags都不会对你在搜索引擎的位置有何帮助。
      就是说你使用的关键词要反映页面的内容。   有些页面出现的是大量的图形,看起来非常漂亮,但搜索引擎却不能读这些图形,他们就得不到文字来决定页面的相关性。有些搜索引擎也可能将ALT包含的文字和metatags结合起来索引。但为保险起见,建议尽可能用HTML文字,访问者也喜欢这些实质性的东西。
         另外,要保证HTML文字是可见的。有些页面设计者想通过用微小的字体或把字体颜色设置成和背景颜色一致的方法在正文中重复关键词。虽然浏览器是看不见了,但搜索引擎却能识破这种类似的诡计。料想浏览器都看不见的东西,搜索引擎也不应该索引到它。这些页面是搜索引擎的垃圾,应该摈弃它们。
       4、避免搜索引擎阻塞   有些搜索引擎看WEB页面,就像一个人使用非常旧的版本的浏览器一样。他们不能读图象映像(image maps),不能读框架结构(frames)。你必须考虑到这些问题,否则搜索引擎也许根本就不可能索引到你的任何页面。
      (1)、要有HTML文字链接。页面设计者经常在主页上只是用图象映像来链接子页面,那么不能跟随这种链接的搜索引擎就不能到达站点的子页面。最不幸的是,子页面常常比主页更有相关性。所以建议在主页底部加一些在文字上所做的HTML超链接来链接各个子页面,搜索引擎就会发现他们,并跟随进去。
         你也可以考虑制作一个带有文字链接的本站导航页来链接网站的所有页面。然后递交这个页面,帮助搜索引擎查找站点的其他所有网页。(2)、框架结构是致命的一击。一些主要的搜索引擎都不能跟随框架里的链接。你只好使用meta tags或另外的巧妙设计来解决它。
      (3)、动态页面的阻塞。有些搜索引擎也不可能索引由CGI或数据库所生成的动态页面,所以尽量使用静态页面。宁愿用数据库来修改页面,也不要动态生成它们。还要避免在URL上使用符号,尤其是问号"?",如( 5、使用meta tags   正如前面所提到的,metatags能帮助你解决象表格、框架等其他麻烦所带来的问题。
      metatags也帮助你能在支持metatags的搜索引擎中控制你的站点描述语言。但须记住的是:metatags并不一定就能保证站点排在前列,他们并不是改变站点排列低落状态的魔术弹。 6、杜绝搜索引擎垃圾   首先要知道,垃圾并不一定被搜索引擎接受,搜索引擎可能会发现你的这种想把垃圾网页提到前列的行为,并在列表中取缔你的网页。
         一般来说,搜索引擎垃圾是想通过加上最流行的关键词来达到排在前列的目的,这是不道德的行为。网页应该以真实的内容让搜索引擎来决定其相关性,而不是毫无道理地凭借重复关键词来击败其他网页。是金子总会发光!   我们将搜索引擎的垃圾和垃圾邮件比较一下。
      没人喜欢垃圾邮件,发送垃圾邮件的站点经常面临的是来自那些接受方的反击。制造搜索引擎垃圾的站点降低了搜索引擎返回列表的质量。随着问题的越来越严重性,这些站点也会面临和垃圾邮件所带来的一样的反击。 7、提交关键页面   大多数的搜索引擎是从你提交过去的一个页面开始索引站点的其他页面的。
      所以最好提交最能概括站点的前面2到3个页面。   也不要太信任自动提交服务程序的自动提交过程,有些是很优秀的。但那些举足轻重的搜索引擎太重要了,还是人工提交比较好,以便你能看看提交有没有何问题。   更不要怕麻烦提交2到3个页面。当搜索引擎在一个页面上遇到问题时,它还可以从另一个页面开始爬你的站点。
       8、定期检查和维护你的列表位置   一旦你的页面被搜索引擎列表,最好是每到一至两个星期监控一下列表,可能会有一些奇怪的事情发生:页面消失了;链接不对了;。。。。。。那么重新提交你的站点吧。   当你对页面做了重大改动的时候最好也要重新提交站点。
      搜索引擎本来是按固定的周期反复访问站点的,然而一些搜索引擎很灵敏,它们知道有些站点一年只做一到两次的改动,它们可能就不会经常去访问这些站点,那就发现不了站点的变化。在重大改动后重新提交将确保你的站点内容是最新的。 五、结束语   对于页面设计者来说,花一些心思和精力与搜索引擎建立起良好的关系是值得的,往往稍做一些改动就可能得到很大的好处。
      即使没有进入前10名,也在相关性上得到了一个改进。   同时,如自己的站点没有运气进入前10名,还应该考虑与排列前10名的站点进行互惠互利的链接。虽然他们是竞争对手,但你也会因此而得到许多意想不到的回报,你会发现网上指向自己站点的链接多了,这时你只要稍微注意一下关键词的使用,你就可能跑到列表前列。
      何况链接也是人们找到你的站点的最好方式之一。   最后要说的是:搜索引擎是人们寻找Web站点的主要方式,但不是唯一的方式。人们也从以下的方式获得站点,如口传、传统广告、传统媒体、新闻组、Web目录和其他站点来的链接等。有时侯,这些形式比搜索引擎更有效。
      所以千万不要被搜索引擎的排列位置所困扰,一个页面设计者更多的时间应该放在制作更好的网页上。 。

    1***

    2005-11-29 22:53:38

  • 2005-11-29 22:50:36
  •   Internet是一个巨大的信息资源宝库,几乎所有的Internet用户都希望宝库中的资源越来越丰富,使之应有尽有。的确每天都有新的主机被连接到Internet上,每天都有新的信息资源被增加到Internet中,使Internet中的信息以惊人的速度增长。
      然而Internet中的信息资源分散在无数台主机之中,如果用户想将所有主机中的信息都做一番详尽的考察,无异于大海捞针。那么用户如何在数百万个网站中快速有效地查找到想要得到的信息呢?这就要借助于Internet中的搜索引擎。 搜索引擎是Internet上的一个网站,它的主要任务是在Internet中主动搜索其他Web站点中的信息并对其自动索引,其索引内容存储在可供查询的大型数据库中。
      当用户利用关键字查询时,该网站会告诉用户包含该关键字信息的所有网址,并提供通向该网站的链接。 目前国内用户使用的搜索引擎主要有两类:即英文引擎和中文引擎。常用的英文搜索引擎包括google、Yahoo!、MSN、Infoseek等,常用的中文搜索引擎主要有:中文google、一搜、3721、百度、中搜、搜狐搜狗、网易等。
       。

    绿***

    2005-11-29 22:50:36

类似问题

换一换
  • 网络软件 相关知识

  • 电脑网络技术
  • 电脑网络

相关推荐

正在加载...
最新资料 热门专题 热点推荐
  • 1-20
  • 21-40
  • 41-60
  • 61-80
  • 81-100
  • 101-120
  • 121-140
  • 141-160
  • 161-180
  • 181-200
  • 1-20
  • 21-40
  • 41-60
  • 61-80
  • 81-100
  • 101-120
  • 121-140
  • 141-160
  • 161-180
  • 181-200
  • 1-20
  • 21-40
  • 41-60
  • 61-80
  • 81-100
  • 101-120
  • 121-140
  • 141-160
  • 161-180
  • 181-200

热点检索

  • 1-20
  • 21-40
  • 41-60
  • 61-80
  • 81-100
  • 101-120
  • 121-140
  • 141-160
  • 161-180
  • 181-200
返回
顶部
帮助 意见
反馈

确定举报此问题

举报原因(必选):