剛才在Quora上偶然看到最近火遍互聯(lián)網(wǎng)的how-old.net被解密了:項目開發(fā)者來自微軟的Bing團隊。負責(zé)后端代碼的Eason Wang解釋了他們是怎么做到的,關(guān)鍵技術(shù)涉及人臉識別、年齡識別和性別識別的算法。他在回答最后提到“深度學(xué)習(xí)”的研究未來可以讓年齡識別更為準確。
  關(guān)于深度學(xué)習(xí),可以參考去年我的另一篇文章:http://app.fortunechina.com/blog/zhangmaiwen/archives/630 。Google神秘兮兮的X實驗室當(dāng)時用16,000個計算機處理器建造了一個包含10億個節(jié)點的神經(jīng)網(wǎng)絡(luò),模擬人腦去觀看1000萬隨機選擇的YouTube視頻截圖,結(jié)果利用“深度學(xué)習(xí)”算法,在沒有人工干預(yù)的前提下,這部機器開始在2萬個物體的照片中識別出包含“貓”的圖片。是的,有點荒誕,半歲大的孩子都認識貓貓;但是,就是這種機器智能讓很多IT巨擘開始大面積創(chuàng)新:比如微軟借同類技術(shù)將語音識別的錯誤率降低了30%;而蘋果在Siri中也運用了深度學(xué)習(xí)。  
  最后,也是更重要的是Eason總結(jié)的為什么一個識別年齡的小應(yīng)用會火遍社交網(wǎng)絡(luò),他提出了10個原因:  
  1. 用起來實在太簡單了。    
  2. 利用了人們的自戀情結(jié)  
  3. 算法準確時激發(fā)了人們對科技的敬畏心,不準時激發(fā)人們的自嘲心  
  4. 給了你一張值得分享的圖片  
  5. 背后有一個可以講述的故事  
  (比如,聰明點的汽車廠商可以給自己的汽車廣告加個顏齡測試,取名xx model的“年齡”和“性別”)  
  6. 機器算法反過來為人提供了具有高度“用戶黏性”的標(biāo)簽  
  7. 采用了一個很贊的、簡短的、自我解釋型的域名How-Old.net  
  8. 整個過程只做了一件事    
  9. 沒有語言障礙(自戀是沒有國界的)  
  10. 工程師們從自己的忠粉開始試驗,然后開始病毒式傳播