Google SEO 中的抓取、索引和搜索引擎排名是什么意思?在学习SEO之前,你必须首先了解Google搜索引擎是如何工作的。从你的网站文章发布的那一刻起,你的文章URL就会经历:被找到、被抓取(检索)、被索引,然后才能出现在Google搜索引擎中,并被添加到Google搜索结果的排名中。上面的过程,从URL被找到,到被抓取并编入索引,然后开始在Google搜索引擎中排名,这就是Google搜索引擎的工作原理。了解Google搜索引擎的工作原理非常重要,因为Google在检索、索引和搜索引擎排名的过程中拥有大量的SEO知识。例如,Google 搜索什么? Google 索引什么?当你的文章开始加入Google搜索引擎排名时,文章的初始排名是如何确定的?这涉及到很多SEO知识和排名因素。如果你还不了解SEO中抓取、索引、排名的整个流程和操作,这篇文章将为你做一个完整的介绍,让你了解Google搜索引擎的基本运行原理。
Google搜索引擎的抓取、索引和排名是怎样的?当一个新网站出现时,肯定会经历一个被“发现”的过程。所以虽然我们可以把Google搜索引擎的操作分为:检索(爬行)、索引和排名,但其实还有一个“查找URL”的过程。这里,就是找到URL、爬行(检索)、索引和排名,简单解释如下:当一个新的页面出现时,Google的爬虫肯定会先找到这个URL,把这个URL添加到URL库中,然后比较一下是否有这个URL。如果确认是新的URL,则会按照预定的时间进行检索(抓取),在Google Search Console的“覆盖”功能中,还可以清楚地看到某个URL的“发现方式”。可以从您提交的站点地图中找到,也可以从另一个链接中找到。
搜索引擎优化
Google抓取(检索) 当Google数据库中的URL库中出现新的URL时,就会安排时间进行搜索。事实上,“检索”是正式名称。熊猫老师也更喜欢用“检索”这个词,但在SEO的世界里,搜索常常被称为“爬行”,你只需要知道它们都是指Crawl。无论是爬行还是检索,都是指Crawl。在Google搜索控制台的“覆盖范围”功能中,您还可以清楚地看到有关“搜索”的信息。下面有两个重要的概念:
是否允许检索:如果显示“否”,则该网址可能会出现在robots.txt中,这意味着网站所有者不允许在robots.txt文件中检索该网址。是否允许索引:如果显示No,则说明该URL很可能带有noindex元标记,因此会出现该页面不允许被索引的消息。这里特别说明:robots.txt用于告诉搜索引擎不要抓取特定页面,noindex用于告诉搜索引擎不要对特定页面建立索引。搜索引擎优化
当爬虫程序爬取你的页面时,它会压缩整个网页的信息并存储在数据库中。在“检索”阶段,谷歌存储在数据库中的信息就像用户打开浏览器时得到的HTML网页一样。直到“索引”阶段,检索到的数据才会被淘汰,只对重要信息建立索引。 Google索引Google在索引阶段有很多事情要处理,因为Google不可能将您网页上的所有HTML源代码或各种文本存储到数据库中。这样的话,数据库就会变得太大,效率低下,所以Google“索引”阶段肯定只会索引重要的东西,而这些东西会影响你的网站以后在某个“关键词”上的排名。那么,究竟是什么呢? Google会索引的常见信息包括以下内容: 1.重要关键字:Google如何从页面中提取关键字。通常,可能会提取10个以上的关键字,以及每个提取的关键字的权重。加起来之后出来的关键词通常是不一样的,唯一可以确定的是页面的Meta标题、H1、H2一定是重点,这就是为什么很多SEO人都强调关键词出现的重要性。标题或H2。 链接和锚文本页面中的链接和锚文本也是将被索引的内容。 3. 图片替代文本图片中的替代文本也是将被提取的文本。文字大小(font-size) 根据Google最初的Pagerank文档,特别提到Google会提取关键字的大概文字大小。文本越大,重要性越高。 5、文章中的粗体字通常是或等标签,粗体字也会记录信息。 6、关键词在页面中的位置关键词在页面中出现的位置也会记录在索引数据库中。除了上面提到的信息之外,Google 还必须索引其他东西,但有很多东西我们不知道。这些用来索引的东西通常可以被视为SEO排名因素(Ranking Factor)。 Google排名:你的某个页面URL被索引后,基本上就可以出现在Google搜索引擎中并获得排名。 Google 声称拥有超过200 个SEO 排名因素。这200多个排名因素会对整个SEO关键词排名起到一定的作用。有些影响很大(例如反向链接),有些影响相对较小(例如URL中出现关键字)。
Google搜索引擎的运行原理从上面你应该已经了解了,Google搜索引擎的运行原理基本上是四个阶段:URL发现、URL抓取、URL索引、URL排名。简单来说,Google搜索引擎的运行原理有这四个阶段。
URL 被查找、爬行(也称为检索)、索引(也称为包含)、排名。从事SEO工作的人一定要对这四个阶段的各种SEO细节有很好的了解,这样才能发现一些问题,比如以下几个关键点:
如果某个URL长时间没有被检索到,是什么原因?如果某个URL长时间没有被索引,是什么原因?关于Google搜索引擎的运行原理,Matt Cutts其实在Youtube网站上有一个视频解释得很清楚。建议您观看此视频。 Matt Cutts 的这段视频清楚地解释了在Google 上抓取、索引和排名的过程。在Google搜索引擎的关键词排名过程中,除了参考Google索引中的信息外,还有Pagerank和200多个SEO排名因素(注:Google索引中的一些信息本身就是排名因素)。除了上述视频外,马特·卡茨还在另一个视频中提到了谷歌搜索引擎的操作。还建议观看以下视频。您将了解Google搜索引擎的运行原理和搜索引擎排名。更深入的了解。
Google正向索引和反向索引在Google的“索引”过程中,有一点特别重要,那就是“正向索引”和“反向索引”。如果你不是理工科出身的人,可能很难理解这两个概念。下面分别解释一下Google索引中的正向索引和反向索引。远期指数
每个URL都被分配了一个唯一的DocID,这个数据表存储了该网页的重要关键字。
反向索引
Google利用前向索引数据改变其索引方式,取而代之的是以关键字为键值的数据表。每个数据列都有一个KeywordID,每个KeywordID又包含一个重要的URL(DocID)。
当用户在Google上搜索关键字时,Google会调用反向索引中的数据,这样查询速度会更快,因为如果使用正向索引数据表,查询会变得超级慢,因为有数百个数以百万计的网页,计算时间太大,这就是为什么必须将原来的正向索引改为反向索引。
西奥