說明
- 防止搜尋引擎機器人擅自收集你的網站內容(archive)或網址(url index)。(封鎖機器人來暫存或收錄網站的內容)
原理
- 在網頁的 <head></head> 標籤內,加上下面介紹的語法之ㄧ就可以了。
- 當下次搜尋引擎機器人來的時候,辨識到你貼的禁止收錄、暫存標籤,就會自動移除掉相關的搜尋內容。
PS:你可以透過各家的工具,請他們提早來逛你的網頁,處理掉你不想讓他們收錄或暫存的內容)
主要語法
禁止被搜尋引擎機器人收錄網址
<meta name="robots" content="noindex">
- 簡單說明:noindex 代表禁止被索引、不願意被搜尋引擎機器人收錄網址,通常會用於免感或不想曝光的網頁加入此標籤。
(一般搜尋引擎氣人看到此標籤,都會自動幫你移除。)
禁止被搜尋引擎機器人暫存網頁內容
<meta name="robots" content="noarchive">
- 簡單說明:noarchive 代表禁止暫存、不願意被搜尋引擎機器人暫存任何網頁內容,通常會用於不想被任意收錄舊資料、比對或迴避舊消息的網頁(?)建議加入此標籤。
(一般搜尋引擎氣人看到此標籤,都會自動幫你移除。)
以上兩種是通用型大部分機器人都會自動迴避,對於特殊隱私需求的網頁建議兩者並用,不衝突。
只針對 Google 搜尋引擎機器人
禁止暫存網頁內容
<meta name="googlebot" content="noindex">
綜合錯雜版
<META NAME="ROBOTS" CONTENT="NONE,NOINDEX, NOFOLLOW, NOARCHIVE">
<meta name="robots" content="none,noindex,nofollow,noarchive">
<META NAME="robots" CONTENT="none,noindex, nofollow,noarchive">
<meta http-equiv="pragma" content="no-cache">
<meta name="robots" content="noindex,nofollow">
<meta name="robots" content="none">
<meta name="robots" content="noarchive">
其他方法
參考資料
已下則是本Wiki空間的廣告,不要誤會XDDD
最終更新:2010年02月17日 20:06