如何删除索引之Google索引中不需要内容的删除
您通常希望Google为尽可能多的索引网站。但是,有些时候您发现您不小心让Google索引了您不想发布的机密内容或其他信息,并且希望尽快将其删除。
从谷歌索引库中移除内容和从搜索结果中移除内容,是两个不同的概念;从索引库中移除的内容是肯定不会展示在搜索结果中,但从搜索结果中移除的内容,可能还是会存在索引库中的,这会影响到我们对网站索引量的有效统计。
可以通过以下3种途径进行处理一处Google索引中不需要的内容:
(1) 元标记
可以在页面<head>代码中添加 <meta name=”robots” content=”noindex,follow”> 防止页面被编入索引
(2) 404、410标记
404——没有发现文件、查询或URL
当蜘蛛爬取到404/410错误链接时,会在网站日志和管理员工具中的抓取错误部分体现出来,这时你便可以通过删除网址工具予以删除,且那些删除的内容也不会被编入索引。
(3) 使用robots.txt文件删除google中的索引
首先你在你的robots.txt中加上你要删除的网页(目录);然后再在管理工具中提交一下!
例如:我不希望abc.html 和 001.html 存在于Google的索引中! 那么我们的robots.txt要这样写!
User-Agent: *
Disallow: /abc.html
Disallow: /001.html
Allow: /