在許多人看來搜索引擎只是一個檢索工具,就像其他冷冰冰的科技產品一樣。實際上,搜索引擎正在成為人人依賴的智能助手。它在擁有感知環境和自我學習的能力后,隨著歲月流逝將不斷地將信息轉化為知識,再將知識沉淀為智慧,被賦予“生命”價值。
Online Learning ,讓搜索引擎“活起來” Online Learning(在線學習)便是讓搜索引擎“活起來”的關鍵技術,它讓搜索引擎擁有更強大的學習能力進而越來越聰明。 理論上來說,一個用戶使用搜索引擎越多,搜索引擎就愈發了解這個用戶和整體熱度變化,推薦精準度會越來越高。根據用戶特征不斷調整算法提高準確度就是學習過程。在Online Learning技術之前,搜索引擎的學習是離線完成的,定時進行數據模型和排序及推薦算法的更新,但不會做到在用戶每一次反饋之后都更新算法。Online Learning則讓“學習”更加具有時效性,粒度細化到每個用戶。它可以隨時根據用戶的下載、點擊、停留時間、鼠標移動這些行為去理解用戶進而動態調整排序和推薦算法,給用戶想要的。 在技術上Online Learning只需要對當前用戶相關的數據進行計算即可,增量學習的方式節省了計算資源同時增強了時效性,因為它可以一邊學習一邊預測、推薦和排序,這可以做到對推薦的動態調整進而確保推薦效果。 在這種快速迭代的基礎上,Online Learning能夠采取比離線預測更為靈活的策略,如Bandit策略,它能夠降低信息的冗余,緩解馬太效應,給了資源更多更平等的機會,可以說形成一種“百花齊放”的狀態,在短時間內迅速定位優質資源。 Online Learning 或將迎來大規模應用 在百度的搜索引擎結果中,右側知心中,App助手推薦,多媒體搜索結果中,在線學習系統已被大規模應用,相關測試表明Online Learning可大幅提升推薦點擊率和用戶滿意度。現在你搜索“雙層床”右側不會只出現相關結果,而是根據之前用戶搜索類似關鍵詞后的反饋,推薦了小戶型裝修等服務。 Online Learning即在線機器學習,目前業界只有百度進行了大規模的商業化應用。Yahoo和Google進行了一些嘗試,但集中在實驗、調研或者論文層面。Online Leaning技術與百度正在深耕的深度學習、百度大腦以及大數據業務有著千絲萬縷的聯系,接下來必將得到更大的提升和應用機會,據說百度已經在為與之相關的技術已經在申請專利。 好比一個兒童在早期說法、寫字、走路都需要有大人刻意訓練一樣,這時候它并無“在線學習”能力,而是“監督學習”;到了一定階段它可以根據環境反饋和個人經驗自己掌握一些技能,譬如在不斷跌倒和騎行過程中自學自行車,下水喝了幾次水之后自然習得游泳技術,這時候就是“在線學習”模式。可以說,人腦本身就是一個基于反饋在線學習的系統,Online-learning就是人腦接收環境和外界對于人的“反饋”,以使得人不斷調整自己行為的過程,這種學習機制是人類不斷自我進步和自我發展的源動力。 Online Learning 讓搜索引擎擁有生命 今年李彥宏曾對外透露“百度大腦”的智力水平已接近3歲嬰兒,我們尚不知道這個項目究竟做了什么看得見的東西,沒有科技媒體能夠走進這個項目深入了解它。百度對此介紹只有寥寥數字:利用計算機技術模擬人腦。百度大腦還出現在了百度推出的世界首個大數據引擎中,百度大腦發揮的作用就是讓大數據引擎能夠在數據挖掘的基礎上,形成“如何挖掘數據”的學習能力。 現在看來所有技術都是互聯互通的,百度大腦與Online Learning相似之處都是讓搜索引擎“活起來”,擁有學習能力和智力水平,最終越來越聰明。 近年來越來越多科技巨頭開始關注科技與人類和諧共處的問題,蘋果讓科技與人文和藝術更加緊密的結合,可穿戴設備讓科技穿戴或植入人體隱秘存在,Nest則讓科技具有感知環境和自我學習能力,百度則是讓搜索引擎愈發聰明,理解人,與人自然對話。未來所有這些科技都會融為一體:手機、智能硬件、物聯網、互聯網服務,無處不在的科技最終讓人們感受不到科技的存在,科技與世界已經渾然一體,水乳相融。 作者微博@互聯網阿超,微信SuperSofter |