到底是珠玉還是糞土?

剛剛瞄到一個消息,說另一家使用工人智慧的搜尋引擎 Mahalo,募了另一輪 $20M 的 funding。所謂工人智慧是什麼意思呢?意思是說,相對於 Google 這種利用解讀大量網頁分析出規則的搜尋引擎而言,他們是使用「人」來維護 – 每一個搜尋結果都是使用者製作的。而且根據 Mahaho 的 FAQ,甚至還有人來審核使用者編輯的內容!簡單的說,希望靠網民大軍的貢獻,來提供比 Google 更準確的搜尋結果。

我是不知道這對你們來說看起來怎麼樣,可是在我看來這根本是白痴到不行的東西。這樣的東西也可以在第三 round 募 $20M 的 funding 來燒,簡直不可思議。而且 investor 當中還不乏知名創投與商界聞人,例如 Elon Musk (PayPal 創辦人)、 Mark Cuban (創辦 broadcast.com,當年以 $5.9 Billion 賣給 Yahoo)、Sequoia Capital、News Corp、CBS Corp… 是真的我眼光淺薄,看不到這些前輩看到的東西?還是他們現在已經看不清眼前的東西到底是珠玉還是糞土了呢?

話說回來,前幾天也才有另一個類似的 chacha 拿了 $10M 的 funding,看來這年頭瘋子還真不少…

我實在很想知道,投資人到底從這兩個網站看到了什麼願景?

[Update 2007/11/19: Sorry, but I was not accurate on Elon Musk being the founder of PayPal, although this is true in a way. Elon Musk founded X.com, which later acquired Confinity, and later changed its name to PayPal. But when people talk about PayPal founders, they usually refer to Max Levchin and Peter Thiel, the co-founders of Confinity, since most X.com employees (including Elon himself) left after the acquisition.]

Solr – Enterprise search 的「黑盒子」

最近因為需要做 search,於是找了 Lucene 來看,順便寫了些簡單的 index、search 的 code 摸摸看感覺。用 Lucene 的理由很多,速度快、scalability 好都是原因之一,很多大站 (digg、livejournal、CNet、Joost) 都採用也是原因,但是最重要的理由則是我對商業環境使用 Open Source 軟體的哲學…

「要用 Open Source 的玩意兒,就要用 community 最大、最 active 的」。因為這樣,白老鼠才夠多,support 才夠廣,支援度也夠好。有地雷的話,會有人先替你踩過,有問題會有人先修好 XD

廢話說完了,該來說 Solr (發音同 Solar)。話說今天下午,寫一些簡單的 code 測試 Lucene,結果在翻 documents 的時候意外翻到 Solr。看了幾下子以後開始幹聲連連… (我怎麼不早點看到這玩意兒啊?) 看來 Solr 根本把所有站內搜尋應該做的事情做完了嘛。

簡單說,Solr 是完全把 Lucene 整個包起來,藏成一個搜尋的黑盒子。你不要管 Lucene 裡面怎麼做 Tokenizer、Analyzer (雖然如果想改也可以),而只需要透過 XML/HTTP 來跟 Solr 溝通即可。要新增文件去搜尋,就用 HTTP POST 塞資料給它。要做搜尋的時候,再另外做 HTTP GET 就好。非常符合 KISS 原則 (Keep It Simple, Stupid)。

雖然還沒進行壓力測試,不過 Solr 的底層是 Lucene,又是 CNet 的人寫出來的,看起來應該是還不錯用才對。

還是那句話,我怎麼摸 Lucene 好幾天以後才看到這種好東西呢…