GMail 的 spam 狀況

大家會用 GMail 多半都是因為他比較快、用 GMail 聽起來比較 cool,或者是因為 GMail 的垃圾信真的很少。

spamchart 剛剛在這裡看到右邊這張有趣的圖,是 Google 拿來宣揚自己對抗廣告信有成的戰績。圖表看起來相當漂亮,GMail 誤判的廣告信比率始終很低,而且三年來不斷下降。

相對的,在現在 Spam Email 一天比一天更多的情況下,spammer 寄給 GMail 的廣告信反而呈現下降的趨勢 – 表示這些 spammer 或許根本就已經放棄在 GMail 發廣告信了,而轉戰其他比較容易發成功的 Email provider。

回過頭來看 Yahoo 的話,Yahoo Mail 宣布信箱容量無上限已經有一段時間了。現在的 Yahoo Mail 介面也做的炫目華麗,用很精巧的 Ajax 把整個信箱做的跟 outlook 介面差不多。但是偏偏 Yahoo 垃圾信多的跟鳥蛋一樣,判斷垃圾信的準確度大概只有 50% 而已 – 跟 GMail 這張圖所顯示出來,接近 100% 的數字顯然差異甚遠。而且,在 Yahoo Mail 點選「這是垃圾信」永遠都沒有效果!

我每個從 Yahoo Mail 跳槽 Gmail 的朋友,全部都是因為受不了太多 spam。Yahoo 顯然也知道這個問題的存在,不過什麼時候才能比較有明顯的改善呢?也許在這個問題解決以前,Yahoo Mail 都解決不了使用者流失到敵營的狀況吧。

話說回來,GMail 的 engineer 居然還配合拍了一個公關短片?實在滿好笑的 :p

當創投要你公司 20% 的股份時…

話說月初在 A VC 看到一篇很精采的文章,一直想翻譯過來,不過卻苦無時間。剛好這幾天想東西想的很累,翻譯一下好文順便讓腦袋放輕鬆也不錯…

[該文作者為 Fred Wilson,是著名創投 Union Square Ventures 和 Flatiron Partners 的 Managing Partner]

在創投事業裡面,大部分人都認定,創投為了彌補他們投入某項投資所花費的時間精力,他們必須至少抓 20% 的股份,最好能夠佔 30%。

我一天到晚都聽到這些東西:

「除非我們能夠佔 20% 股權,不然這筆生意我們不做。」
「這份協議裡面我們只佔 22% 的股份,和我們的目標 25% 有距離。」
「我們只佔少少 15% 的股份,沒辦法得到合理的回饋。」

在我看來,這些根本是放屁。你佔這些股權,不代表你必須拿這麼多。

在我管理的 Flatiron 一個投資案中,當我們投資的 comScore 上市時,Flatiron 大約擁有 14% 股份。comScore 的 14% 當時市值大約 1.2 億美金。我沒有辦法告訴你我們買入的成本是多少,也沒法子告訴你我們出脫了多少股票,但是顯然這是一筆戰果輝煌的投資。我認為這對我在 comScore 上花了八年的時間精力,是很合理的回報。而且我也可以告訴你,我在 comScore 上面投下的心血絕對不比任何其他一家公司少。

當 TACODA 賣給 AOL 的時候,Union Square Ventures 剛好也擁有大約 14% 的股權。光這筆投資案的回饋,我們回報給投資人的利潤比他們有史以來丟進這個創投的所有錢都還要多。對我來說,這算盤聽起來打的過。

這只是兩個近期的例子。但是我可以一直繼續講下去。在投資的公司裡面,我們只擁有 15% 的公司數量比我們佔 20% 公司還要多。

當然,對每家創投來說,他們追求的利潤不一樣。有的創投本身是鯨魚,他們需要大量的收益才能達到利潤目標。也因此他們希望在有前景的公司多佔一些股份。但是這基本上是創投要處理的問題,跟創業家沒什麼關係。偏偏我們現在正在把這個問題往創業家身上推。

現在我們在告訴創業家們,「我們要你公司的 20-30% 股份才能解決你的問題。」這實在沒什麼道理。我要不厭其煩的再説一次。在創投事業中,最稀少最珍貴的資源,是聰明創業家,他們有輝煌的點子,而且願意一週工作 100 小時只求夢想早日實現。錢在創投事業中並不是什麼珍貴的資源。但是我們現在卻變成我們對管錢比較在行了。

我想要盡可能的多支持一些有潛力的創業家。因此對我來說,擁有投資公司的不到 20% 是很正常的事情。甚至我們經常從不到 10% 開始出發,然後隨著時間演進、信賴逐漸建立,我們才開始增加持股。

別誤解我的意思。我當然希望佔有 25% 或更多的股份。但是我不會說這是必備的投資條件。我們必備的條件反而是,尋找最棒的創業點子,和一流的創業家合作,然後想辦法在生意蒸蒸日上的時候得到約 4 – 5 千萬美元的回報,然後抽身而退。

而且這並不需要佔 20 – 30% 的股權才能達到。我在這行已經混了 21 年了,我知道我在說些什麼。

許多人現在募資的時候,常常開口一要 funding 就是要 $5M,我上週也才聽到人說,很基本的 funding figure 是 $1M。創業家良莠不齊漫天討價獅子大開口,VC 也樂的著地還錢。這篇文章其實只是要說明,慣例上大家常見 VC 的 deal 都是抓 20 – 30% 的股份,不代表這是必備條件。

當然,也沒有什麼基本的 funding figure,你開口要 $5M 也不會讓你在 VC 的案子裡面看起來比較聰明。

孔子高不高有什麼重要的?

孔子今天看到新聞說,北大中文系的李零,又開始發表高論,說孔子在古時候是巨人。自從上次他說孔子是「喪家犬」以後,這是他第二次因為評論孔子上新聞。

不過,孔子多高干你屁事?自古以來對於孔子身高的記載多不勝數,可考有據者卻付之闕如。你今天可以根據 xxx 的記載說孔子是巨人,明天也有個人可以跳出來根據 yyy 的筆記說孔子是侏儒。這樣子算是有條理的考據嗎?這哪有什麼做學問的樣子?一個中文系的教授居然墮落到必須譁眾取寵來博取新聞版面,根本連一點人文素養都沒有。充其量只不過是炒個話題想辦法被記者採訪罷了。

孔子高不高有什麼重要性?重要的是孔子的歷史高度和道德高度。孔子之所以能為千秋萬世所景仰,是因為他上承中國文化兩千五百年而集其成,下開中國文化之新統又兩千五百年。司馬遷在《孔子世家》中也說,

「詩有之:『高山仰止,景行行止。』雖不能至,然心向往之。余讀孔氏書,想見其爲人。適魯,觀仲尼廟堂車服禮器,諸生以時習禮其家,餘祗回留之不能去雲。天下君王至於賢人衆矣,當時則榮,沒則已焉。孔子布衣,傳十餘世,學者宗之。自天子王侯,中國言六藝者折中于夫子,可謂至聖矣!」

孔子的歷史價值,在這裡一覽無遺。「至聖先師」之號,也由此而起。

史料是死的,歷史卻是活的。歷史會隨著當代的需求不斷由史者演譯解讀,當代解讀的歷史也可以窺見這個時代的晦暗與光芒。如果北大中文系居然可以放任這麼沒文化的教授不斷大放厥詞只求上新聞,那麼北大中文的素質也可以由此想見。我還真好奇,北大中文的學生會不會因為李零而羞憤休學呢。

時風有來去,聖道無古今。不管孔子高不高,如果一般大眾聽到這種新聞,能夠藉此接觸聖人之道,那也是好的。

Gimp 2.4.0 Released

gimp-2.4.0
這幾天忙著想東西都沒注意什麼新聞,今天才注意到 Gimp 出新版的 2.4.0 了。Release notes 在這裡

看起來主要是一些工具 (筆刷、selection tool 等等) 的改善、介面的改進,以及縮放的影像品質改善等等…。

另一種 captcha – Asirra

這是在逛 Microsoft Research 的時候看到的。

Asirra 也是一種用來判斷 user 到底是人還是機器人的方法,只是傳統的作法都是用字畫成圖 (大家都很熟所謂的「認證碼」吧?)。但是隨著這種作法越來越沒有效果,開始有一些人找新的方向。Asirra 是 Animal Species Image Recognition for Restricted Access 的縮寫。簡單的說,就是讓使用者由圖片來判斷這是貓是狗還是什麼動物種類,藉此來認證使用者確實是個「人」。照片則是由和微軟合作的 petfinder.com 提供。使用者玩一玩還可以選擇要不要認養這些小動物!

yahoo captcha MSN passport captcha

這個點子其實並不算新穎,兩年前在看到 PWNtcha 的時候其實就看過了。不過或許是這年頭 fuzzy OCR 等相關技術越來越成熟,導致像是 Yahoo! (左上圖)或是 MSN Passport (左下圖) 這種人幾乎都看不出來的認證碼,機器倒是可以破的行雲流水。或許是因為這種因素,讓 Asirra 這種 project 開始有更往前推展的動力。

Asirra 也有開放出來讓任何站台都可以使用,呼叫方式也非常簡單,幾乎只要拉一個 Asirra 的 javascript 來就可以了。不過對於針對大眾的網站來說有個地方不方便:Asirra 需要使用圖片,沒有辦法讓視力不好的 user 使用聲音辨識。

對我來說,主要的缺點應該是這個 captcha 花費的時間太久了。根據 Asirra 的研究,似乎大部分的 user 都能在 20 – 30 秒內解出正確答案。不過 20 – 30 秒可是很長的時間啊… 另一方面來說,不知道是不是 petfinder 提供的照片有什麼問題,有的照片根本烏漆媽黑我實在搞不清楚是狗是貓… =_=

如果真的要用 captcha,我大概還是會考慮 reCAPTCHA 吧… :p

如果對 Asirra 背後的理論有興趣,可以看他們發表的這篇 paper