神祕的 google 機器

11 七月, 2007 (23:42) | 電腦與網路

在這邊協尋會有人認領嗎 ? XD

這兩天無聊看了一下網站的流量統計,發現有一個奇怪的 host 在我的前十大來源,hostname 是 ff-in-f129.google.com;看起來像是 Google 的機器人來源是吧 ? 不過奇怪的地方就在這:它不是。在我好奇之下,我進行了以下追查:

  1. ff-in-f129.google.com 無法解出 IP,不過我可以從 awstats 的報告得知它最後是什麼時候來的,於是我就把那個時間 (準確到分) 所有來過的 IP 翻出來,一個一個查反解,終於讓我找到一個 IP 了:66.249.85.129
  2. 接下來把這個 IP 丟進 WHOIS 查查看,嗯,確實是 Google 家的沒錯。
  3. 那,為什麼 Google 要養一個有反解沒正解、然後連過來的時候 user-agent 說自己是 Firefox 的 IP 呢 ? 根據它抓的 URL 來看,實在看不出什麼規則,甚至還有 referrer 是 Google 的 query 的;如果要我猜的話,我會猜這是某一種 proxy、或者是、被有意無意用做 proxy 的一種服務。
  4. 我會這樣猜是因為,我發現有另外幾組 IP / hostname 像是 64.233.166.136 / py-out-f136.google.com72.14.252.136 / po-out-f136.google.com 這種的,它們是 Google Wireless Transcoder 所用的 proxy (為什麼我知道 ? 因為它有寫在 user-agent 裡 :p),這個服務本意是用來讓你可以在手機上透過它來看網頁,它會幫你把網頁重新排版成適合手機閱讀的大小,不過你也可以拿它來躲一些像是 GFW 之類的東西…

所以這個 ff-in-f129.google.com 到底是幹嘛的呢 ? 講了這麼多,我還是不知道 orz

Comments

Comment from ET
Date: 2007/7/12, 2:16 上午

網路上沒有相關資料…
不過為什麼那麼想要知道呢XD

我現在有個主機很奇怪,隨時都有Google bot進駐…
每天查連線紀錄全部都是Google Bot,感覺像是不明原因Bot被中斷,然後他一直回來爬…
這個情況比較煩~”~
因為很吃主機資源…
(更好玩的是,應該是phpBB Plus這個論壇系統造成的,其他網頁都不會被爬…)

Comment from Mr. M
Date: 2007/7/12, 4:48 上午

不知道你的comment會不會自動記錄IP
如果會的話 我猜我的IP會是66.249.84.67
跟你提到的那個IP在同一個NetRange/CIDR裡面
也許可以給你點猜測的依據吧
I use google accelerator. ;)

Comment from San-Yuan Chen
Date: 2007/7/12, 10:21 上午

To ET:
你可以用 robot.txt 處理一下。
可以參考本部落的robots.txt 和 Referrer Karma
*其實人有好奇心是蠻正常的啦~~~*

Comment from Vincent Huang
Date: 2007/7/12, 1:42 下午

也許是下面這個google服務?
http://www.google.com/gwt/n

我倒是常常透過那個服務在PDA上面看部落格。

Comment from VirusCamp
Date: 2007/7/14, 5:40 下午

Google Web Accelerator ?

Comment from B
Date: 2007/7/17, 4:59 上午

說不定只是某google員工是你的忠實讀者罷了 :P

Write a comment