[ 網路 ] Yahoo 的服務 - Yahoo! Site Explorer(續)

在前一陣子提到 Yahoo! Site Explorer  的部分服務,主要是著重於查詢的部分,接下來的是比較著重於管理的部分。

這個部分的重點在於把自己的網站加到 My Sites ,讓自己可以管理 Yahoo! Search! 中自己的網站被索引的程度,以及讓 Yahoo! Search! 的機器人 ( bot ) 可以更快速的把你的網站索引,以便有興趣的朋友來搜尋。

如何把網站加到 My Sites ?

要把網站加到 My Sites 的方式不勝枚舉,比如說:

Authenticate the site 的方式

並不是把網站的 URL 填入,Yahoo! Site Explorer 就會認定這個網站的所有者是你喔,得先經過一個 Authenticate the site 的動作。

在進入 My Sites 的管理介面時,你會看到雖然你已經把網站加入了,但是右邊還是出現一個 Authenticate 的綠色按鈕,表示你得先照系統指示你的方式,來做認證的工作。

認證的方式很簡單,大概分成兩種方式

  • 上傳檔案達到認證
    這個部分,他會提示你在網站的根目錄,產生一個指定檔名的 html 檔,然後在裡面寫上特定的字串,便可以執行認證。如果你不會這個動作,也可以直接下載 Yahoo! Site Explorer 幫你準備好的 html 檔,不要做任何修改,上傳到網站的根目錄即可。
  • 增加一個 META 到網頁裡面去
    這個方式是比較麻煩的,您必須在 <HEAD> 跟 </HEAD> 這個區段裡面,放入一段指定的 META,來進行認證。現在很多的 blog 都是人家寫好的系統,要修改這個部分比較麻煩,所以建議您使用上傳檔案認證的方式。

請注意喔!

這個指定檔名且在裡面寫上特定的字串的 html 檔,如果你認證失敗,你重新進行認證時,檔名是不同的喔!

Authenticate the site

放上檔案或是改好 META 之後,就可以按下「Ready to Authenticate」等待 Yahoo! Site Explorer 來認證你的網站了,在這一段時間,你可以看到你的網站是在 Pending 的狀態

說實話, Yahoo! Site Explorer 的速度算是蠻慢的,這個 Pending 的狀態,可能得持續好長一段時間,不像是 Google 的網站管理員工具 ,在很短的時間內就可以認證完成。

Authenticate 成功之後

Authenticate 成功之後,同樣的在「Explorer URL」的「Show Details」的頁面,可以看到的東西更多了,以前大概只能看到很簡要的資訊,現在可以看到更多的資訊,包括何時機器人爬過你的網頁 ( Last crawled ),就可以大概知道你的網頁是何時被索引的。

不過,看何時機器人爬過你的網頁並不是 Authenticate 後的重點,重點在於,可以設定網頁不被  Yahoo! Search!  索引與 cache。

不要讓網頁被 cache

如果有某些網頁,並不想被 Yahoo! Search! 索引跟 cache,也是在上面所述的「Explorer URL」的「Show Details」,看到某個頁面的底下,會出現「Delete URL / path」,按下去以後系統會提示你:

You have requested to delete URL (jerome.anyday.com.tw/archives/59).

This URL and all URLs in its subdirectories will be deleted from the index.

Are you sure you want to delete all 1 URIs?

按下確定以後,這個網頁理論上就不再會被索引了,測試之後,似乎也是這樣。

提交 sitemap

上面所提到的 「Delete URL / path」與 「Show Details」也不全然是 Authenticate 後的重點。在這個時代,如何要讓搜尋引擎快速且有效的索引網站,才是重要的目的,這個時候你需要提交 sitemap

那為何要提交 sitemap 呢?

這裡我們先簡單的看一下 Google 網站管理員對於 sitemap 的敘述:

Sitemap 通訊協定可讓您通知搜尋引擎,關於您網站中有哪些可供檢索的 URL。 使用 Sitemap 通訊協定的 Sitemap 之最簡單的形式,是一份列出網站中 URL 的 XML 檔案。 通訊協定是以高可容性來撰寫,因此可以配合任何規模的網站。 它也可以讓網站管理員將每個 URL 的其他資訊 (上次更新日期、變更頻率,以及相對於網站中其他 URL 的重要性) 包含在內,以便讓搜尋引擎能更有效地檢索該網站。

對於無法透過可瀏覽介面,以存取網站中所有區域的使用者來說,Sitemap 會特別好用。 (一般來說,這是指無法以追蹤連結的方式,來存取網站中某些網頁或區域的使用者)。 例如,在只能透過搜尋表單存取特定網頁的任何網站上,建立一個 Sitemap 並提交至搜尋引擎,就會有所幫助。

請注意,Sitemap 通訊協定可以補充搜尋引擎用來尋找 URL 時的檢索機制,但無法加以取代。您可以藉由將 Sitemap (或 Sitemaps) 提交至搜尋引擎來協助搜尋器,使其在檢索您的網站時更加精準。

提交 sitemap 的方式 

在 My Sites 管理網站,按下網址 URL 前面的「Manager」會進入「Add Feed」的頁面,在這裡可以填入幾種東西:

  • 網站的 RSS
  • 網站的 Sitemaps
  • 網站的 Atom
  • 任何一個有網址列表的文字檔

在表單中填入你的 Feed (在這裡我用的是網站的 sitemap)以後,系統的狀態 ( Status ) 會提示你這是一個新的 Feed,過一陣子 Yahoo! Search! 的機器人就會去把這個檔案讀入,並透過這個檔案分析你的網站結構,方便索引了。

不過喔!在 Yahoo! Site Explorer 的顯示方式,一樣不像是 Google 的網站管理員工具 ,會告訴你 bot 最後讀取 Feed 的時間,只告訴你在何時讀過了,這是一個蠻不方便的表達方式。

這些大概是 Yahoo! Site Explorer 的主要功能,至於 sitemap 有沒有效果,以後再來討論囉!

6 thoughts on “[ 網路 ] Yahoo 的服務 - Yahoo! Site Explorer(續)

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *