もうそう無界

封鎖機器人

說明

防止搜尋引擎機器人擅自收集你的網站內容(archive)或網址(url index)。（封鎖機器人來暫存或收錄網站的內容）

原理

在網頁的 <head></head> 標籤內，加上下面介紹的語法之ㄧ就可以了。
當下次搜尋引擎機器人來的時候，辨識到你貼的禁止收錄、暫存標籤，就會自動移除掉相關的搜尋內容。
ＰＳ：你可以透過各家的工具，請他們提早來逛你的網頁，處理掉你不想讓他們收錄或暫存的內容）

主要語法

禁止被搜尋引擎機器人收錄網址

<meta name="robots" content="noindex">

簡單說明：noindex 代表禁止被索引、不願意被搜尋引擎機器人收錄網址，通常會用於免感或不想曝光的網頁加入此標籤。
（一般搜尋引擎氣人看到此標籤，都會自動幫你移除。）

禁止被搜尋引擎機器人暫存網頁內容

<meta name="robots" content="noarchive">

簡單說明：noarchive 代表禁止暫存、不願意被搜尋引擎機器人暫存任何網頁內容，通常會用於不想被任意收錄舊資料、比對或迴避舊消息的網頁(?)建議加入此標籤。
（一般搜尋引擎氣人看到此標籤，都會自動幫你移除。）

以上兩種是通用型大部分機器人都會自動迴避，對於特殊隱私需求的網頁建議兩者並用，不衝突。

只針對 Google 搜尋引擎機器人

禁止暫存網頁內容

<meta name="googlebot" content="noindex">

綜合錯雜版


<META NAME="ROBOTS" CONTENT="NONE,NOINDEX, NOFOLLOW, NOARCHIVE">
<meta name="robots" content="none,noindex,nofollow,noarchive">
<META NAME="robots" CONTENT="none,noindex, nofollow,noarchive">
<meta http-equiv="pragma" content="no-cache">
<meta name="robots" content="noindex,nofollow">
<meta name="robots" content="none">
<meta name="robots" content="noarchive">

其他方法

使用 robots.txt 檔案封鎖或移除網頁

參考資料

已下則是本Ｗｉｋｉ空間的廣告，不要誤會XDDD

「封鎖機器人」をウィキ内検索

最終更新：2010年02月17日 20:06

もうそう無界

日本語學習相關資源

資源

Web teach

工具

編碼

更新履歴

封鎖機器人

說明

原理

主要語法

禁止被搜尋引擎機器人收錄網址

禁止被搜尋引擎機器人暫存網頁內容

以上兩種是通用型大部分機器人都會自動迴避，對於特殊隱私需求的網頁建議兩者並用，不衝突。

只針對 Google 搜尋引擎機器人

禁止暫存網頁內容

綜合錯雜版

其他方法

參考資料

已下則是本Ｗｉｋｉ空間的廣告，不要誤會XDDD