第179部分 (第3/5頁)
童舟提示您:看後求收藏(品書網www.vodtw.tw),接著再看更方便。
加之這些打著同好智慧推送口號的推廣。實際上往往被競價排名給汙染了,做成了半吊子的注水豬肉,所以國內的網民就更不覺得這些推送演算法有什麼牛逼之處了。
但是事實上,如果可以不被塞錢加塞進來的那些垃圾資訊汙染,一個成熟的內容篩選推送演算法,對於一個內容提供方網站來說,是一種極大的提升使用者黏性助力。
比如,如果一個站的“基於深度演算法的大資料推送”實打實做好,書友是不該喊“怎麼又書荒了”,哪怕再小眾的需求,至少也應該被系統自動篩選出可以看的、喜歡看的作品。而不是直接按照分類和標籤粗暴篩選,結果弄到一堆臭不可聞的標題黨。
如果一個音樂或者影片網站在這方面做得好,理論上可以提供更契合使用者口味的書單、雲音樂歌單、影片推送列表……
資料爆炸的時代,“得到知識”這個需求已經不再有稀缺性,但是“不受知識垃圾干擾、直擊主題地找到你真心要的資料與服務”,開始變得奢侈起來。
有效率的檢索,比囤積固態知識重要得多。只有死記硬背的舊時代行將被淘汰者,才會以後一種形態做人。
想明白了這一切,加上自己本身重生時帶來的那強烈的核心價值觀,顧莫傑感覺到一陣獸血沸騰。
可汗這個專案,贊助得值。
顧莫傑目光何等敏銳,欣喜之餘,直切時弊地追問:“可是,你說的這些,靠目前影片網站的技術應該還沒法完美實現吧,很多設定都需要手動完成。很多推送之間的內部邏輯關係。都是人工設定的,並不是基於深度演算法和大資料自動統計、自動歸納的。”
可汗微微有些不好意思:“這當然還是有問題的,目前每個教學影片最後留的習題,如果被學生做錯了,具體跳轉到哪一段後續解說影片,是我手動設定的關聯。一方面。我對深度演算法肯定不夠了解,沒法基於這個應用調整出一套行之有效的演算法。
另一方面,畢竟目前為止看我的影片上課的學生最多也就十萬人級別,這個樣本容量還不夠大,真上了基於深度演算法的架構,或許也會因為‘可供深度學習的素材不夠多’,而導致其推送效果不如目前的人工設定關聯。”
對於這個說法,顧莫傑也深以為然。
鑑別一個基於雲端網路的人工智慧是否強大,演算法固然很重要。但是最重要的還是使用者量和使用者使用頻次。
這也是為什麼後世谷歌成長為龐然巨頭之後,世上再也沒有哪家公司能在人工智慧的野蠻生長上比過谷歌了——就算你投入錢再多,科研上再不擇手段,充其量給你弄出一個資料修正效率比谷歌演算法強兩三倍的演算法。
那又如何?谷歌的使用者人數和頻次乘積是你的五倍十倍,你空有三倍效率的演算法,照樣被越甩越遠。何況在沒有代差技術的情況下,也不可能有三倍效率的演算法。
顧莫傑想了想,問了可汗一個周邊的問題:“你原來做影片公開課。有接受過別的慈善捐資過麼?”
可汗想了想說:“有,原來我也做了一年半多。去年拿到的捐資是20多萬美元,我主要花在了程式方面,因為我一個人搞不定影片的全部推送架構。”
顧莫傑心裡有底了。
“那還怕什麼,你只靠二十幾萬美元一年的投入,加上你個人的無償勞動,就做出了現有的底子。今年開始你可以得到五百萬美元一年。什麼事兒辦不成。
演算法工程師不夠的,我從初音集團給你調就是了。嚴磊博士你認識吧?那是當初跟著傑夫辛頓教授帶出來的第一批深度學習演算法博士,此前地球上都沒這個專業呢。他就是一直跟著我在初音幹,眼下還有十幾個傑夫辛頓和班吉爾教授的弟子,在我那裡。都做得很好。
使用者樣本資料不夠的