Solr – Enterprise search 的「黑盒子」

最近因為需要做 search,於是找了 Lucene 來看,順便寫了些簡單的 index、search 的 code 摸摸看感覺。用 Lucene 的理由很多,速度快、scalability 好都是原因之一,很多大站 (digg、livejournal、CNet、Joost) 都採用也是原因,但是最重要的理由則是我對商業環境使用 Open Source 軟體的哲學…

「要用 Open Source 的玩意兒,就要用 community 最大、最 active 的」。因為這樣,白老鼠才夠多,support 才夠廣,支援度也夠好。有地雷的話,會有人先替你踩過,有問題會有人先修好 XD

廢話說完了,該來說 Solr (發音同 Solar)。話說今天下午,寫一些簡單的 code 測試 Lucene,結果在翻 documents 的時候意外翻到 Solr。看了幾下子以後開始幹聲連連… (我怎麼不早點看到這玩意兒啊?) 看來 Solr 根本把所有站內搜尋應該做的事情做完了嘛。

簡單說,Solr 是完全把 Lucene 整個包起來,藏成一個搜尋的黑盒子。你不要管 Lucene 裡面怎麼做 Tokenizer、Analyzer (雖然如果想改也可以),而只需要透過 XML/HTTP 來跟 Solr 溝通即可。要新增文件去搜尋,就用 HTTP POST 塞資料給它。要做搜尋的時候,再另外做 HTTP GET 就好。非常符合 KISS 原則 (Keep It Simple, Stupid)。

雖然還沒進行壓力測試,不過 Solr 的底層是 Lucene,又是 CNet 的人寫出來的,看起來應該是還不錯用才對。

還是那句話,我怎麼摸 Lucene 好幾天以後才看到這種好東西呢…

Economist Audio Edition

Economist 出有聲版了。對於視覺障礙的人當然是福音,不過對於忙碌得沒空翻閱、或是想省點目力的人來說,倒也是個大福音。以後只要帶著隨身聽,哪裡都可以聽有聲版的 Economist 了….

訂戶下載有聲版完全免費,如果不是訂戶,下載當期有聲版要 $8 USD,舊版的要 $10 USD。每一期的總長度大約 6 – 7 小時,如果有 special report 的話大約八小時。不過,當然是每篇文章分開一個 mp3 檔,選擇上倒是很方便。

連結在此:Audio Edition

「大麥克指數」- Big Mac Index

Economist 上禮拜編了一份很好玩的「大麥克指數」。基本上是拿各個國家麥當勞賣的 Big Mac 的售價來作比較,看看各個國家的麥當勞售價,和他們實際換算的該國匯率是否有差別。(是啊,我知道很多人都做過這種「用麥當勞售價來比較物價差異」的簡單調查 :p)

由表中可知,中國大陸 (-58%) 和香港 (-55%)、埃及 (-51%) 都似乎有匯率嚴重低估之嫌。台灣的 (-33%) 似乎也有這樣的影子。

圖表貼在後面:

big_mac_index

Source: Economist – The Big Mac Index