「美胜传媒」运营笔记网站收录大揭秘:网站不收录最容易忽略的原因!


「美胜传媒」运营笔记网站收录大揭秘:网站不收录最容易忽略的原因!
文章图片
关于网站收录问题 , 一直是很多站长甚至企业头疼的问题 , 很多人认为网站收录不收录是看百度吃饭 , 也就是百度决定的 , 这也就导致目前在收录问题上分为两派:
一、主动推送百度 , 就会收录 。
二、收录确实是百度决定的 。
首先我们来说说第一种观点 , 第一种观点主动推送的意思就是各种提交 , 比如熊掌号提交、主动提交、自动提交(目前已失效) , 周级提交(目前好像也失效) , MIP提交 , sitemap提交 。
目前测试的结果 , 其实主动提交、熊掌号天级提交、sitemap提交是有效的 , 最起码在数据上能显示出来 , 在这种观点基础上延伸出一个观点就是 , 只要有足够多的蜘蛛 , 网站一定会收录 。 哪怕你文章再垃圾 , 再差劲 , 只要有蜘蛛 , 100%收录 。
【「美胜传媒」运营笔记网站收录大揭秘:网站不收录最容易忽略的原因!】另外一个观点是提交只是收录的先决条件 , 提交未必100%收录 , 也就是说 , 就算蜘蛛来了 , 也未必收录 。
那么我个人是倾向于第二种的 , 为什么会这么说 , 我拿一些证据;
我之前有一个网站 , 提交熊掌号一直不收录 , 结果一直反馈给百度 , 反复提交后 , 居然收录了几条 , 过一段时间又不收录了 , 然后又提交反馈百度 , 百度回复说我提交的是熊掌号是PC资源 , 不是移动资源 , 不收录是符合预期的 , 什么意思呢?
比如我一个文章链接是www.abc.com/123.html,那么浏览器模拟手机后 , 链接变成了www.abc.com/123.html#efdfd , 在模拟手机浏览后 , #后面变成了随机数字 , 这是跟我程序本身有关系 。
大部分网站的格式是www.abc.com/123.html , 手机是m.abc.com/123.html或者www.abc.com/123.html(PC和移动已做了自适应 。 )所以这种格式提交熊掌号是没有任何问题 。 但我那种情况是极为罕见的 , 所以百度不收录 , 哪怕文章质量再好 。
但我另外一个朋友也是跟我一模一样的程序 , 也就是说 , 他的网站跟我的情况一模一样 , 但是他却收录了 。
所以我猜测 , 要么我朋友说谎 , 要么百度忽悠我 , 但我个人分析后发现 , 我朋友既没有说谎 , 百度也没有忽悠我 , 导致这种情况 , 只能用一个原因解释 , 那就是他的站 , 还没有被百度针对 , 也就是说 , 百度更新一些算法的时候 , 还没有轮到他的网站 。
为何我得出这样的结论 , 因为每次百度更新的时候 , 总会有一些网站状态没有变化 , 一些网站状态有变化 , 有变化的是可以理解为先被百度测试新算法 , 如果没问题 , 慢慢扩大到更多网站 , 这也符合互联网产品一个属性 , 先小部分测试 , 然后扩大 。
从这点来看 , 我个人分析有几个细节需要说明 , 这是我个人的一些分析:
百度搜索后台(针对百度内部员工) , 应该是机器加人工审核的 , 网站被搜索后台应该都做了标记 , 比如你的网站被特别照顾(或许也就是沙盒状态?) , 所以好像做SEO特别难搞的原因 。 从反复反馈百度这件事来看 , 他们会打开你的网站 , 去分析 , 然后符合手工点入收录库 , 从产品角度来说 , 我们来还原这个过程;
百度员工打开你提交的链接 , 符合收录标准 , 然后点加入收录库 , 这条链接就可以被site出来了 , 也就是链接的状态改变了 。 我用一个原型图来说明;(只是草图 , 别太针对 。 )
「美胜传媒」运营笔记网站收录大揭秘:网站不收录最容易忽略的原因!
文章图片
按道理 , 这些字段其实能对应的上百度站长平台后台的一些字段 , 这里只为了演示 , 所以错误字段请忽略 。
如果是这个流程的话 , 上述一切都能解释的清楚了 , 我那些链接提交不收录因为链接格式应该不对 , 所以触发一直不收录 , 而我不停的提交反馈后 , 百度分析后加入收录库了 , 接着后面的百度应该发现我的站的一些问题 , 所以直接反馈让我整改 。


推荐阅读