知識庫: Linux 虛擬主機
如何使用 robots.txt 檔案來掌控搜尋引擎對我網站的存取?
發佈人 Chris Chen, lastmodifiedby 發表於 28 7月 2007 11:32 上午


我的網站平日上線人數不多,為何流量使用還是很大?
用戶的網站可能每日上站瀏覽人數不多,卻發現流量使用量增加的很快?


請進入控制台點選 Awstat,進入後點選左列之 "搜尋引擎網站的漫遊器",看看是不是搜尋引擎吃掉了您的流量。

若看到 Unknown robot (identified by 'spider'),這個也是搜尋引擎,只是沒這麼有名,Awstat 統計軟體分不出來。

要限制搜尋引擎抓取您網站上的資料有兩種方法,一是使用 robots.txt,另一個方式是使用 .htaccess

要注意的是 robots.txt 不是放了馬上就有效,一般可能須等到數星期,若有急迫的需求請使用 .htaccess 的方式。

相關網站:
http://www.robotstxt.org/

如果在您的網站根目錄放置一 robots.txt 內容如下:

User-agent: *
Disallow: /

則會禁止所有搜尋引擎蒐集網站內容,若要禁止大陸百度與搜狗,.htaccess 內容如下:

SetEnvIfNoCase User-Agent "^Baidu" bad_bot
SetEnvIfNoCase User-Agent "^sogou" bad_bot
SetEnvIfNoCase User-Agent "^Bloghoo" bad_bot
SetEnvIfNoCase User-Agent "^Scooter" bad_bot
Deny from env=bad_bot

遠振資訊

(924 votes)
非常有幫助
沒有任何幫助

遠振資訊股份有限公司 • 統一編號:28132571
服務專線:4499-343 (手機撥打請加 02)• 地址:235601 新北市中和區中正路866之7號12樓
[ 雲端主機 ] • [ 虛擬主機 ] • [ 實體主機 ] • [ SSL 憑證 ] • [ 網域申請 ] • [ cPanel 教學 ] • [ WHM 教學 ]
本公司由 鴻安法律事務所秘書 擔任常年法律顧問 • Copyright 2013-2023 All Rights Reserved