首页 » 工作记录 » 正文

【头条seo】头条收录站外信息的机制是怎样的?显示的快照日期和百度原理是否相似?

山清水秀 2019年11月14日 工作记录 1

扫一扫用手机浏览

搜索引擎蜘蛛抓取策略有四种:大站优先,宽度优先,非完全pr优先,ocip优先(在线页面重要性计算)

  刚开始的时候我以为头条搜索的抓取站外应该是大站策略,后来和朋友聊天发现,最近有的大站他们才被抓取,这种思路被否定掉。

  既然大站优先策略不是,剩下的非完全pr优先,ocip也就不是了。就只剩下宽度优先策略。

  宽度优先策略,1号网页全网抓取,抓取到有进入到2号和3号的链接,开始全网抓取2号和3号的内容,以此类推,所以才会出现有的大站最近才被头条抓到的原因。

  显示的快照日期和百度原理是否相似:观察暂时不是。全网更新时间为起点,不断累积。

  最近观察了几个页面,详情页的是根据文章发布全网更新时间为起点,不断累积。比如2019年6月20日发布,快照今天显示1天前,依次类推,不断增加。


研究结果总结:

  头条收录站外机制:全网抓取【谷先生:他们是全网抓取机制,但是目前在部分站点测试,并没有彻底执行 】

  百度快照的原理是站内有新的内容更新,理论上快照也会随之更新。

  首页观察应该是从站外抓取的那天开始算起,站内更新内容的最新日期起算。可能等他们完善了会和百度快照更新规则一样。

  可见收录与百度的结果无关,关于收录机制,就是蜘蛛在互联网到处爬嘛。既然没有提交收录的入口,那么我们需要引入今日头条的蜘蛛进入我们的网站,就需要在已经被进入头条收录的网站上建立外链。当年google判断一个网站的权重,大部分原因都需要依靠外链质量去判断。那么今日头条作为一个新建立的搜索引擎,在没有足够大的数据的支持下,外链必然是一个重要因素。


本文来自互联网,仅供学习使用!

赞(0

相关文章

发表评论