微萬建站詳述什么是robots.txt蜘蛛文件及使用技巧

09/09/2018

網(wǎng)站蜘蛛文件robots.txt是搜索引擎訪問網(wǎng)站時要查看的第一個文件，它告訴蜘蛛程序在服務(wù)器上什么文件是可以被查看的，什么文件是被禁止抓取的。

當(dāng)搜索蜘蛛訪問一個網(wǎng)站時，它會首先檢查該站點(diǎn)根目錄下是否存在robots.txt，如果文件存在，搜索機(jī)器人就會按照該文件中的內(nèi)容來抓取允許訪問的內(nèi)容；如果該文件不存在，所有的搜索蜘蛛將能夠訪問網(wǎng)站上所有沒有被禁止的頁面。

robots.txt必須放在網(wǎng)站的根目錄下，而且文件名必須全部小寫。

什么是robots文件

robots是站點(diǎn)與spider搜索引擎蜘蛛溝通的重要渠道，站點(diǎn)通過robots文件聲明該網(wǎng)站中不想被搜索引擎收錄的部分或者指定搜索引擎只收錄特定的部分。僅當(dāng)您的網(wǎng)站包含不希望被搜索引擎收錄的內(nèi)容時，才需要使用robots.txt文件。如果您希望搜索引擎收錄網(wǎng)站上所有內(nèi)容，請勿建立robots.txt文件。

Robots使用說明

1、robots.txt可以告訴百度等搜索引擎您網(wǎng)站的哪些頁面可以被抓取，哪些頁面不可以被抓取。

2、Robots工具目前支持48k的文件內(nèi)容檢測，請保證您的robots.txt文件不要過大，目錄最長不超過250個字符。

robots.txt使用技巧

1、避免在robots.txt文件中設(shè)置所有的文件都可以被搜索蜘蛛抓取，這樣并不會增加網(wǎng)站的收錄率。

2、在robots.txt文件里設(shè)置不要讓搜索蜘蛛索引的文件。一般網(wǎng)站中不需要蜘蛛抓取的文件有：后臺管理文件、程序腳本、附件、數(shù)據(jù)庫文件、js文件、css樣式表文件、模板文件和背景圖片等。這些文件不會增加網(wǎng)站的收錄率，還會浪費(fèi)服務(wù)器資源。

3、如果網(wǎng)站是動態(tài)網(wǎng)頁，并且為這些動態(tài)網(wǎng)頁生成了靜態(tài)頁面，以供搜索蜘蛛更容易抓取。那么需要在robots.txt文件里設(shè)置避免動態(tài)網(wǎng)頁被蜘蛛索引，以保證這些網(wǎng)頁不會被視為含重復(fù)內(nèi)容。

4、robots.txt文件里是可以直接引用sitemap網(wǎng)站地圖文件的。例如：

Sitemap: http://m.hqbet6017.com/sitemap.xml
這樣做的好處就是，搜索引擎的蜘蛛抓取robots.txt文件時，會讀取其中的sitemap路徑，從而順利抓取其中各個鏈接的網(wǎng)頁。

關(guān)于robots.txt的更多相關(guān)資料可參考：https://ziyuan.baidu.com/college/courseinfo?id=267&page=12

微萬品牌建站可為每個客戶免費(fèi)制作、檢測robots文件，以確保搜索引擎正確的抓取網(wǎng)站頁面。如需新建網(wǎng)站、網(wǎng)站改版、網(wǎng)站托管等服務(wù)，歡迎與我們聯(lián)系！

閱讀 207 更多內(nèi)容

微萬原創(chuàng)文章，未經(jīng)允許請勿擅自篡改抄襲，轉(zhuǎn)載請保留本頁鏈接。

微萬遵循行業(yè)規(guī)范，轉(zhuǎn)載的稿件會明確標(biāo)注來源，版權(quán)歸原作者所有，如內(nèi)容發(fā)布或轉(zhuǎn)載涉及侵權(quán)，請聯(lián)系刪除。

微信長按識別或掃一掃，企業(yè)網(wǎng)站建設(shè)、網(wǎng)站托管維護(hù)、企業(yè)管理系統(tǒng)開發(fā)、微信小程序制作、域名主機(jī)、網(wǎng)站備案、網(wǎng)站改版等提供專業(yè)技術(shù)解答。

如喜歡這篇文章或這篇文章對您有幫助，
那就把它分享出去讓更多人能得到幫助吧。

精彩推薦

老網(wǎng)站為什么一定要改版升級成自適應(yīng)網(wǎng)站
隨著互聯(lián)網(wǎng)的不斷發(fā)展，越來越多的企業(yè)需要有自己的獨(dú)立官網(wǎng)，而那些制作年代久遠(yuǎn)的網(wǎng)站，在微萬看來無論是頁面風(fēng)格還
杭州網(wǎng)站制作公司定制企業(yè)官網(wǎng)選擇域名需要注意的問題
杭州網(wǎng)站制作公司-微萬建站專業(yè)定制企業(yè)官網(wǎng)，今天給大家講解一下新網(wǎng)站注冊時選擇域名需要注意的一些問題，希望對大
忘記網(wǎng)站后臺地址或后臺登錄密碼了怎么辦
在網(wǎng)站建好交付之后，我們會向客戶提供后臺地址以及后臺的賬號密碼，有時候客戶忘記收藏和保存，一段時間后又忘記了，
網(wǎng)站制作費(fèi)用是一次性的還是每年都要續(xù)費(fèi)呢
做網(wǎng)站建設(shè)這么多年，經(jīng)常有客戶會問，網(wǎng)站制作費(fèi)用是一次性付好然后能永久使用的嗎，后期是否還要交錢呢？在這里微萬

微萬建站詳述什么是robots.txt蜘蛛文件及使用技巧

精彩推薦

猜你喜歡