深度學習是機器學習的一個子集, 都是人工智慧的子集。
機器學習與深度學習不完全屬於一個拳擊淘汰賽中, 深度學習是機器學習的一個子集, 而它們都是人工智慧(AI)的子集。 但是, 在機器學習和深度學習的定義和用例方面, 市場上存在很多混淆, 現在讓我們來澄清一下混淆。
·人工智慧(AI)是類比和模仿電腦系統和機器中的智慧人類行為的研究。
·機器學習是AI的一個子領域, 它使用演算法將AI概念應用到計算系統中。 電腦識別並根據資料模式採取行動, 隨著時間的推移學習提高其準確性, 無需明確的程式設計機器學習背後的分析,
·深度學習是機器學習的一個子領域, 是人工神經網路的另一個名稱。 深度學習電腦網路類比人類大腦感知、組織和從資料登錄的方式。 撇開天網, 深度學習今天依然是存在的。
機器學習與深度學習
通常人們對於機器學習與深度學習的想法可能會忽略一點, 如前所述, 深度學習是機器學習的一個子集。 在這一點上, 你更有可能在應用程式中使用機器學習, 而不是深度學習, 但它仍然是一個發展中的技術, 而且部署起來很昂貴。 現在有些產品已經上市了, 隨著時間的推移, 人們會發現深度學習將變得更加普遍。
我們來看兩者之間的區別和使用情況。
機器學習
作為人工智慧的一個子集, 機器學習使用演算法來解析資料, 從結果中學習, 並運用學習來做出決定或預測。 示例包括聚類、貝葉斯網路和視覺化資料映射。 例如, 在電子檔案資料查詢和合規性調查中, 熱圖和視覺集群可以將圖形搜索結果呈現給人類,
機器學習技術分為兩類:監督機器學習和無監督機器學習。 監督式學習取決於人為生成的種子集合, 教導軟體如何定義資料。 預測編碼就是一個很好的例子。 該軟體指的是將資料模式匹配到相關度百分比的種子集。 隨著時間的推移, 預測編碼工具從持續進行的審閱回饋中學習。
無監督機器學習取決於識別資料中包含的模式並將其與其他資料或搜索查詢進行比較。 機器學習演算法隨著資料集的增長和更多模式的出現而隨時間學習。 無監督機器學習包括集群、概念搜索和接近重復資料刪除。
例如, 聚類匹配文檔之間相似的文本和中繼資料,
機器學習基礎設施差異很大, 單個系統可以實現有限的集群或網路流量報告, 而大型系統則包含數十台伺服器和大規模並行處理(MPP)架構, 用於跨多個資料來源的海量資料。
深度學習
深度學習(也稱為人工神經網路)基於所有機器學習演算法。 但是, 它不使用資料分類等任務特定的演算法。 相反, 它通過識別來自非結構化輸入的代表性資料, 並輸出準確的行動和決定來類比人類的大腦結構和功能。
學習可以被監督或不受監督, 這意味著大的神經網路可以接受標記的輸入, 但不需要它。 學習程式教會神經網路如何構建不同的處理層, 當網路處理輸入時, 他們根據資料登錄和輸出創建自己的層。 這種深度學習的水準允許神經網路自動從原始資料中提取特徵而無需額外的人力輸入。
神經網路由多個簡單連接的處理器(稱為神經元)組成,這些神經元是為模仿人腦中的神經元而創建的數學函數。這些人造神經元組成了神經網路的單元。
簡單地說,每個神經元接收兩個或更多的輸入,處理它們,並輸出一個結果。一些神經元接收來自外部感測器的輸入,而另一些神經元則被來自其他活動神經元的輸入啟動。神經元可能啟動額外的神經元,或者可能通過觸發動作影響外部環境。所有活動都是在自創的隱藏層中進行的,每個連續的圖層都會輸入前一層的輸出。
實際上,神經網路攝取非結構化資料:聲音、文本、視頻和圖像。網路將資料分成資料塊併發送給單獨的神經元和層進行處理。一旦這個離散的處理完成,網路產生最後的輸出層。
大規模的可擴展性是神經網路的關鍵。神經網路的性能取決於它可以攝取、訓練和處理多少資料;資料越多意味著效果越好。這是另一個區別於更基本的機器學習,其演算法通常在一定水準上平穩。深度學習只是通過其計算資源來限制其性能。因此,神經網路的“深層”部分:計算資源越多,層次越深,產出越廣泛。儘管深度學習不是那麼快捷和容易,但更低的計算處理能力使研發工作發生了革命性的變化。
機器學習和深度學習的常用用例
重要的是要記住機器學習的用例已經在市場上了。深度學習的用例主要是現階段的發展目標,商業化程度有限。一些用例是相似的:區別在於神經網路可以增長到接近無限的學習和輸出規模。機器學習更受約束,適合具體的實際計算任務。另外請記住,它們兩個不是相互排斥的。
地區
機器學習用例
深度學習用例
行銷,合規
電子郵件和社交媒體的情緒分析使用文本線索來提醒情緒狀態。
情緒分析可以識別照片和視頻中的即時情緒。應用程式根據人的情緒反應傳送動態內容或視覺顯示。
汽車
基於感測器資訊的無人駕駛汽車。
基於視覺模式識別的無人駕駛汽車,比如立即識別消防栓和行人的區別。深度學習還可以通過檢測波形中的發動機聲音來啟動汽車缺陷檢測。
監測
監控分析系統是基於規則的,通過使用者生成的定義和規則分析饋送。
這些系統基於行為分析。它觀察詳細的視覺線索,並教導自己什麼行為是觀察對象的正常行為。聯網的深度學習系統也可以識別來自不同時間和地點的照片和視頻的相同面孔。
生命科學,醫學
使用者程式設計演算法來識別糖尿病人群中的變數並預測個體患者的風險因素。
通過識別視覺標記物識別MRI掃描中的癌症標記物,獨立于人類程式師或診斷者。
語音辨識
機器學習使語音辨識能夠隨著時間的推移向用戶學習。這個過程是訓練密集的,平均95%的準確率。
神經網路處理數十億個口語音,將語音辨識提高到接近100%的準確度,同時縮短訓練時間。語音辨識還通過關鍵字和主題對原始音訊進行分類,並識別出發言者,這對音訊監控有著廣泛的影響。
娛樂
大規模的CGI使用機器學習來説明自動化密集的視覺效果,如插入數位人群或視覺化巨大的空間爆炸。
深度學習使媒體和遊戲能夠在用戶輸入、動作和/或運算式的回應中動態地繪製動畫。
展望機器學習和深度學習的未來
你不會在每個街角都找到深度學習/人工神經網路的身影。他們普遍需要大量的標記資料進行監督學習,或大量的非結構化資料進行無監督學習。深度學習技術開發人員需要花費大量的時間標記和向神經網路輸入資料,或者需要輸入數以百萬計的非結構化物件來實現無監督學習。
在今天的資料密集型世界中,擁有足夠的資料不是問題。標記足夠的資料,或將足夠的未標記資料引入神經網路是一個挑戰。儘管處理能力不斷增加,價格也有所下降,但密集計算仍然需要對系統和支援進行大量的投資。
儘管如此,深度學習在許多不同的業務垂直領域都有很好的用例。像穀歌和Facebook這樣的公司正在投入深度學習來開發這些實際的應用程式,而其他開發者也在跟風。
這種深度學習的水準允許神經網路自動從原始資料中提取特徵而無需額外的人力輸入。神經網路由多個簡單連接的處理器(稱為神經元)組成,這些神經元是為模仿人腦中的神經元而創建的數學函數。這些人造神經元組成了神經網路的單元。
簡單地說,每個神經元接收兩個或更多的輸入,處理它們,並輸出一個結果。一些神經元接收來自外部感測器的輸入,而另一些神經元則被來自其他活動神經元的輸入啟動。神經元可能啟動額外的神經元,或者可能通過觸發動作影響外部環境。所有活動都是在自創的隱藏層中進行的,每個連續的圖層都會輸入前一層的輸出。
實際上,神經網路攝取非結構化資料:聲音、文本、視頻和圖像。網路將資料分成資料塊併發送給單獨的神經元和層進行處理。一旦這個離散的處理完成,網路產生最後的輸出層。
大規模的可擴展性是神經網路的關鍵。神經網路的性能取決於它可以攝取、訓練和處理多少資料;資料越多意味著效果越好。這是另一個區別於更基本的機器學習,其演算法通常在一定水準上平穩。深度學習只是通過其計算資源來限制其性能。因此,神經網路的“深層”部分:計算資源越多,層次越深,產出越廣泛。儘管深度學習不是那麼快捷和容易,但更低的計算處理能力使研發工作發生了革命性的變化。
機器學習和深度學習的常用用例
重要的是要記住機器學習的用例已經在市場上了。深度學習的用例主要是現階段的發展目標,商業化程度有限。一些用例是相似的:區別在於神經網路可以增長到接近無限的學習和輸出規模。機器學習更受約束,適合具體的實際計算任務。另外請記住,它們兩個不是相互排斥的。
地區
機器學習用例
深度學習用例
行銷,合規
電子郵件和社交媒體的情緒分析使用文本線索來提醒情緒狀態。
情緒分析可以識別照片和視頻中的即時情緒。應用程式根據人的情緒反應傳送動態內容或視覺顯示。
汽車
基於感測器資訊的無人駕駛汽車。
基於視覺模式識別的無人駕駛汽車,比如立即識別消防栓和行人的區別。深度學習還可以通過檢測波形中的發動機聲音來啟動汽車缺陷檢測。
監測
監控分析系統是基於規則的,通過使用者生成的定義和規則分析饋送。
這些系統基於行為分析。它觀察詳細的視覺線索,並教導自己什麼行為是觀察對象的正常行為。聯網的深度學習系統也可以識別來自不同時間和地點的照片和視頻的相同面孔。
生命科學,醫學
使用者程式設計演算法來識別糖尿病人群中的變數並預測個體患者的風險因素。
通過識別視覺標記物識別MRI掃描中的癌症標記物,獨立于人類程式師或診斷者。
語音辨識
機器學習使語音辨識能夠隨著時間的推移向用戶學習。這個過程是訓練密集的,平均95%的準確率。
神經網路處理數十億個口語音,將語音辨識提高到接近100%的準確度,同時縮短訓練時間。語音辨識還通過關鍵字和主題對原始音訊進行分類,並識別出發言者,這對音訊監控有著廣泛的影響。
娛樂
大規模的CGI使用機器學習來説明自動化密集的視覺效果,如插入數位人群或視覺化巨大的空間爆炸。
深度學習使媒體和遊戲能夠在用戶輸入、動作和/或運算式的回應中動態地繪製動畫。
展望機器學習和深度學習的未來
你不會在每個街角都找到深度學習/人工神經網路的身影。他們普遍需要大量的標記資料進行監督學習,或大量的非結構化資料進行無監督學習。深度學習技術開發人員需要花費大量的時間標記和向神經網路輸入資料,或者需要輸入數以百萬計的非結構化物件來實現無監督學習。
在今天的資料密集型世界中,擁有足夠的資料不是問題。標記足夠的資料,或將足夠的未標記資料引入神經網路是一個挑戰。儘管處理能力不斷增加,價格也有所下降,但密集計算仍然需要對系統和支援進行大量的投資。
儘管如此,深度學習在許多不同的業務垂直領域都有很好的用例。像穀歌和Facebook這樣的公司正在投入深度學習來開發這些實際的應用程式,而其他開發者也在跟風。