您的位置:首頁>正文

播客類今日頭條誕生記:TensorFlow成共用秘方?

摘要:TensorFlow 有望成為 AI 時代的「安卓系統」。

Castbox 的創始人王小雨最近很忙, 雖然公司在國內, 但她近期基本都泡在美國洽談音訊版權合作事宜,

希望能夠進一步推進付費業務的開展。

瞄準海外市場的 Castbox 是一款音訊類聚合應用, 可以對標國內的喜馬拉雅 FM 和荔枝 FM。 從 2016 年創立到現在, Castbox 已經連續兩年在谷歌開發者大會中被評為音訊聚合類的最佳應用。

然而, 儘管在兩年間, Castbox 在全球 135 個國家的訂閱用戶已經超過了 700 萬, 是目前 Google Play 上排名第一的音訊應用, 但王小雨始終對開啟付費模式保持謹慎態度。

如果半年前沒有選擇使用 TensorFlow, 王小雨大概不會這麼早就下決心到美國洽談音樂版權問題, 並推進音訊收費專案。

變成播客類今日頭條的 Castbox

Castbox目前使用的是和今日頭條相似的AI內容推薦 圖|Castbox官網截圖

此前阻止王小雨開展收費專案的正是對用戶粘性的憂慮。 即使是在比國外音訊類聚合應用市場更為成熟的國內市場, 在付費閱讀上依然仍處於探索階段, 尚未完全伸展拳腳。

這樣的現狀正是考慮到, 在對平臺產生認同和依賴前, 為免費內容而來的遊客, 很可能因為付費模式而選擇逃離。 但如果用戶能夠形成對平臺的使用習慣,

並產生強烈的認同感, 其付費訂閱意願提升, 便會更加有利於付費模式的推進。

但如何讓遊客變成住民, 對一個平臺形成依賴呢?作為谷歌前員工, 王小雨很自然地想到了用穀歌的開源工具 TensorFlow來為 Castbox 留下更多住民。

在使用 TensorFlow 之前, 王小雨使用的是傳統的協同過濾, 可以根據使用者訂閱推薦相似內容, 但這種基於使用者訂閱所得到的推介結果的相似性和準確度不高, 推薦內容不夠貼合用戶需求, 用戶訂閱轉化率不夠高, 不足以形成Castbox推進付費模式的環境。

而通過利用 TensorFlow 提供的框架, Castbox 的開發人員開發出一款擁有內容推薦功能的 AI 系統, 解決了推薦內容的不貼合。

這一借由 TensorFlow 開發的 AI 系統選擇關注使用者的點擊通過率,

而非單純的訂閱狀況, 並通過機器演算法, 將 CTR(Click-Through-Rate 點擊通過率)高的音訊內容推薦給使用者。 這種演算法的好處在於, 它不需要考慮不同國家語言的差別, 只要根據大資料就可以掌握使用者興趣點並加以推薦, 這和今日頭條的原理是相似的。

像王小雨這樣利用 TensorFlow 開發自己應用的人並不少。 比如, 國內的遊戲廠商《列王的紛爭》也接入了 TensorFlow 中谷歌翻譯的 API, 能夠讓中外遊戲玩家進行溝通。 而清華大學自然語言處理與社會人文計算實驗室的學者也在使用 TensorFlow 加深對語言的理解。

想做 AI 時代的「安卓系統」, 從為企業節省博士開始

安卓系統在全球擁有超過20億使用者 圖視覺中國

2005 年, 安卓系統母公司被谷歌收購時還名不見經傳, 但 12 年後的今天, 它在全球已經擁有 20 億用戶。 谷歌開發出來的原生安卓系統, 無論哪國的開發者都可以使用, 開發者更可以在原始版本中進行自己的更新。 像國內的小米 MIUI、魅族 flyme都是在原生的安卓系統上進行加工的。

與原生的安卓系統相比, 穀歌開源TensorFlow平臺還不到兩年, 但穀歌對它的期許卻更高,希望它能變成 AI 時代的「安卓系統」,這也是穀歌從mobile first 到 AI first 轉向的重要一環。

儘管看起來不為人所知,但我們在日常生活中使用谷歌產品時早已和 TensorFlow 打過交道。當你使用谷歌翻譯、搜索、地圖、YouTube 時,TensorFlow 貢獻的底層架構一直在默默工作。

在穀歌的官方介紹中,TensorFlow 是採用資料流程圖(data flow graphs)、用於數值計算的開源軟體庫。這個軟體庫提供包括圖像識別、語音辨識等神經網路學習的資料基礎架構,是專門為系統開發人員準備的深度學習開源工具。

不過,TensorFlow 提供的系統庫並不是一個嚴格的「神經網路」庫。只要開發者能夠將計算表示為一個資料流程圖,就可以使用 Tensorflow。這也被很多行業人士吐槽,認為 TensorFlow 開源的底層應用太過基礎。但對 Castbox 這樣的初創企業來說,基礎性的架構至少已經幫助他們解決了一個極為關鍵的問題——減少開發 AI使用的技術人員數量。

穀歌官網對TensorFlow框架的介紹 圖|穀歌

Castbox 的 CTO 賀曉聰告訴極客公園,他們目前真正負責內容推薦 AI 開發的只有一個員工。而按王小雨的說法,如果不依靠 TensorFlow,要開發出同樣的應用,可能需要用到十幾個成熟的技術人員,而這樣的技術人員,在王小雨看來,最少也得是博士水準。

尚且不論十幾個擁有成熟技術的博士的招募成本,對於一個初創公司而言,在目前成熟技術人員都集中在穀歌、微軟、蘋果等大公司的情況下,能不能招到都是一個問題。TensorFlow 顯然為這些初創公司解決了這個大問題。

普適法則,TensorFlow 的差異化競爭路線

外媒對目前各大公司開源平臺的形象性介紹 圖|bonkersworld

事實上,現在的開源系統不止穀歌的 TensorFlow,蘋果、微軟、甲骨文在內的大公司都在開源自己的系統。上圖是外媒對各家平臺做的一次總結,雖然未必完全準確,但從某種程度上,的確反應了目前開源平臺的現狀。

相比競爭對手,TensorFlow 更注重拓展技術覆蓋面,以更大的普適性搶佔優勢地位。TensorFlow 所使用的底層技術更加注重對不同技術的優化結合,目前在專業領域的深度學習項目都可以使用 TensorFlow 平臺,規模在同類中可以達到最大。而且其靈活性也比其他的平臺更好,即使是新的研發項目也可以輕易接入到 TensorFlow。

除此之外,TensorFlow 還支援異構設備分散式運算,這意味著它能夠在各個平臺上運行模型,從電話、單個 CPU / GPU 到成百上千 GPU 卡組成的分散式系統,適用性和實用性非常強。

正是由於這種普適性,雖然起步較晚,但TensorFlow 已經擁有超過 500 位代碼貢獻者,共有超過 12000 次的代碼提交和超過 100 萬次的代碼庫下載。TensorFlow 在教程、資源、開發者和社區貢獻者的數量上均處於領先地位。

36dsj對目前各大開源工具的橫向比較 圖|36dsj請點擊此處輸入圖片描述

穀歌也很重視與使用 TensorFlow 的開發者的溝通。王小雨在開發 Castbox 的時候,就會經常和谷歌內部開發人員溝通,「我們會發郵件給他們,一般都在 24 小時內回復。」王小雨說。在穀歌內部設立有Newsletter,可以和企業開發人員進行溝通,除了在郵件中告知團隊的新進展和動態,還會針對外部開發人員發來的郵件中的問題進行釋疑。

責任編輯:雙筒獵槍

但穀歌對它的期許卻更高,希望它能變成 AI 時代的「安卓系統」,這也是穀歌從mobile first 到 AI first 轉向的重要一環。

儘管看起來不為人所知,但我們在日常生活中使用谷歌產品時早已和 TensorFlow 打過交道。當你使用谷歌翻譯、搜索、地圖、YouTube 時,TensorFlow 貢獻的底層架構一直在默默工作。

在穀歌的官方介紹中,TensorFlow 是採用資料流程圖(data flow graphs)、用於數值計算的開源軟體庫。這個軟體庫提供包括圖像識別、語音辨識等神經網路學習的資料基礎架構,是專門為系統開發人員準備的深度學習開源工具。

不過,TensorFlow 提供的系統庫並不是一個嚴格的「神經網路」庫。只要開發者能夠將計算表示為一個資料流程圖,就可以使用 Tensorflow。這也被很多行業人士吐槽,認為 TensorFlow 開源的底層應用太過基礎。但對 Castbox 這樣的初創企業來說,基礎性的架構至少已經幫助他們解決了一個極為關鍵的問題——減少開發 AI使用的技術人員數量。

穀歌官網對TensorFlow框架的介紹 圖|穀歌

Castbox 的 CTO 賀曉聰告訴極客公園,他們目前真正負責內容推薦 AI 開發的只有一個員工。而按王小雨的說法,如果不依靠 TensorFlow,要開發出同樣的應用,可能需要用到十幾個成熟的技術人員,而這樣的技術人員,在王小雨看來,最少也得是博士水準。

尚且不論十幾個擁有成熟技術的博士的招募成本,對於一個初創公司而言,在目前成熟技術人員都集中在穀歌、微軟、蘋果等大公司的情況下,能不能招到都是一個問題。TensorFlow 顯然為這些初創公司解決了這個大問題。

普適法則,TensorFlow 的差異化競爭路線

外媒對目前各大公司開源平臺的形象性介紹 圖|bonkersworld

事實上,現在的開源系統不止穀歌的 TensorFlow,蘋果、微軟、甲骨文在內的大公司都在開源自己的系統。上圖是外媒對各家平臺做的一次總結,雖然未必完全準確,但從某種程度上,的確反應了目前開源平臺的現狀。

相比競爭對手,TensorFlow 更注重拓展技術覆蓋面,以更大的普適性搶佔優勢地位。TensorFlow 所使用的底層技術更加注重對不同技術的優化結合,目前在專業領域的深度學習項目都可以使用 TensorFlow 平臺,規模在同類中可以達到最大。而且其靈活性也比其他的平臺更好,即使是新的研發項目也可以輕易接入到 TensorFlow。

除此之外,TensorFlow 還支援異構設備分散式運算,這意味著它能夠在各個平臺上運行模型,從電話、單個 CPU / GPU 到成百上千 GPU 卡組成的分散式系統,適用性和實用性非常強。

正是由於這種普適性,雖然起步較晚,但TensorFlow 已經擁有超過 500 位代碼貢獻者,共有超過 12000 次的代碼提交和超過 100 萬次的代碼庫下載。TensorFlow 在教程、資源、開發者和社區貢獻者的數量上均處於領先地位。

36dsj對目前各大開源工具的橫向比較 圖|36dsj請點擊此處輸入圖片描述

穀歌也很重視與使用 TensorFlow 的開發者的溝通。王小雨在開發 Castbox 的時候,就會經常和谷歌內部開發人員溝通,「我們會發郵件給他們,一般都在 24 小時內回復。」王小雨說。在穀歌內部設立有Newsletter,可以和企業開發人員進行溝通,除了在郵件中告知團隊的新進展和動態,還會針對外部開發人員發來的郵件中的問題進行釋疑。

責任編輯:雙筒獵槍

同類文章
Next Article
喜欢就按个赞吧!!!
点击关闭提示