近日,知名人工智能學者吳恩達發(fā)表文章,闡述了他對于人工智能在傳統(tǒng)行業(yè)中應用緩慢的理解。無論是刷短視頻時的個性化推薦,還是外賣配送時的耗時預估,或者是移動支付時的人臉識別,以算法為代表的AI技術在消費互聯(lián)網(wǎng)行業(yè)被應用得“得心應手”。然而提到傳統(tǒng)行業(yè),人們卻很難快速想起非常成熟的應用人工智能的典型案例。為何AI技術在傳統(tǒng)行業(yè)的應用速度和范圍遠不如消費互聯(lián)網(wǎng)等行業(yè)?
消費互聯(lián)網(wǎng)行業(yè)應用AI更具優(yōu)勢
“AI技術的應用主要取決于數(shù)據(jù)、算力和算法。”天津大學智能與計算學部副教授朱鵬飛介紹,首先數(shù)據(jù)要達到一定的體量,這是應用的基礎,此外算力也要能支持大規(guī)模的模型訓練,而后算法方面需要達到一定的精度,端側(cè)算力也要具備一定的推理能力。
之所以目前只有消費互聯(lián)網(wǎng)公司在大規(guī)模應用AI技術,主要是在這三方面消費互聯(lián)網(wǎng)公司都更具優(yōu)勢。
前些年短視頻并沒有現(xiàn)在這么火爆,例如發(fā)展初期的淘寶,也并沒有很強的用戶黏性。而隨著推送越來越精準,用戶的體驗感也得到了極大的提升,最終呈現(xiàn)井噴式的用戶增長。
“精準推送主要依賴于算法精度的提升,而算法精度的提升又離不開海量的數(shù)據(jù)作為基礎。”朱鵬飛解釋,在這個單一的場景中,算法模型需要不斷進化,終身學習。由于不是封閉數(shù)據(jù)環(huán)境,總有新的數(shù)據(jù)加入,算法模型需要不斷通過學習進行調(diào)整、迭代升級,使其精度越來越高,形成一個良性循環(huán)。
“與此同時,雖然目前消費互聯(lián)網(wǎng)行業(yè)在算法精度上已經(jīng)上升到一定的高度,但相比一些傳統(tǒng)行業(yè)的應用場景,消費互聯(lián)網(wǎng)行業(yè)對于AI算法精度接受的閾值都比較低。比如短視頻、淘寶偏好推薦、百度熱搜關鍵詞,只需要達到用戶產(chǎn)生黏性的目的,只要有一定準確性,用戶都可以接受。”朱鵬飛表示,相比之下,在很多傳統(tǒng)行業(yè),對于技術精度的要求就高得多。比如基于視覺的AI技術在人臉識別方面的應用,在高鐵站、飛機場核實身份,1∶1的比對準確度要高達99.99%甚至更高才可以進行應用。
在算力方面,目前云端算力已經(jīng)可以支持大規(guī)模模型訓練和推理,比如短視頻、淘寶推薦等。但在大量傳統(tǒng)行業(yè)應用場景中,智能終端上的端側(cè)算力還無法滿足推理的實時性和準確性要求。
“相比于社交網(wǎng)絡和電商系統(tǒng),傳統(tǒng)行業(yè)應用場景的封閉生態(tài)系統(tǒng)使得云端算力無法得到有效應用。”朱鵬飛舉例說,以智能無人系統(tǒng)巡檢為例,電力巡檢、管道巡檢、交通巡檢、河道巡檢以及光伏巡檢等要求搭載在無人機和機器人上的算力滿足實時巡檢要求,由于視頻分析的模型復雜度較高,端側(cè)往往無法實現(xiàn)精準高效的實時推理,輕量級網(wǎng)絡在滿足實時性的同時損失了識別精度。由于算法精度達不到使用要求,使得在很多場景中無法實現(xiàn)AI技術的應用。
傳統(tǒng)行業(yè)應用AI面臨三大挑戰(zhàn)
吳恩達認為,在AI應用方面,消費互聯(lián)網(wǎng)行業(yè)之外的其他行業(yè)都面臨著三大挑戰(zhàn):數(shù)據(jù)集很小;定制化成本很高;從驗證想法到部署生產(chǎn)的過程很長。
對此,朱鵬飛也深有感觸,他以傳統(tǒng)制造業(yè)為例進行了分析。
“傳統(tǒng)制造企業(yè)在制造向智造轉(zhuǎn)型的過程中,數(shù)據(jù)是一個很突出的問題。”朱鵬飛介紹,首先在數(shù)據(jù)的獲取方面存在一定難度。傳統(tǒng)制造企業(yè)的數(shù)據(jù)是封閉的,因為很多傳統(tǒng)企業(yè)并不是新型信息化設備,沒有傳感器收集實時數(shù)據(jù),也沒有數(shù)據(jù)中心,因此數(shù)據(jù)零散,缺失嚴重,很難獲取像消費互聯(lián)網(wǎng)企業(yè)里那種海量、高質(zhì)量的數(shù)據(jù)。
其次,行業(yè)內(nèi)部各個工廠的數(shù)據(jù)很多具有商業(yè)價值,因此工廠都嚴格保密,這導致數(shù)據(jù)不流通,沒有辦法進行共享,進而形成了數(shù)據(jù)孤島效應,影響了AI算法模型的優(yōu)化。
“我們在開發(fā)一個AI算法模型的時候,因為數(shù)據(jù)的保密性,往往得到的數(shù)據(jù)都是經(jīng)過‘脫敏’的,這也嚴重地影響了我們的判斷。而傳統(tǒng)行業(yè)的企業(yè)中,又缺乏具有AI算法模型開發(fā)能力的技術人員,因此雙方在合作研發(fā)過程中也存在著很高的壁壘。”朱鵬飛說。
此外,傳統(tǒng)行業(yè)中的數(shù)據(jù)來源并不像消費互聯(lián)網(wǎng)領域那樣來自單一場景,復雜的業(yè)務場景導致數(shù)據(jù)往往很“臟”,必須進行“清洗”,去掉大量無效信息,AI算法模型才能高效率的學習以提高精度。“這就像我們教小朋友知識,只講知識點,小朋友們才能學得快,如果在知識點中夾雜著大量無用的信息,小朋友無從分辨,學習效率肯定降低。”朱鵬飛介紹,而給數(shù)據(jù)標注“知識點”的工作是巨大而繁瑣的,需要企業(yè)有專人去做,要花費很多時間精力。
“傳統(tǒng)制造業(yè)要想獲得高質(zhì)量的數(shù)據(jù),就必須對生產(chǎn)設備進行信息化、智能化的改造。”朱鵬飛表示,這種改造需要企業(yè)投入大量的時間和精力,還會增加生產(chǎn)成本,這也成為AI在傳統(tǒng)制造業(yè)中應用的壁壘。
高質(zhì)量數(shù)據(jù)是應用前提
過去這10年,大部分AI的研發(fā)和應用是“以軟件為中心”驅(qū)動的。在海量數(shù)據(jù)的支撐下,不斷優(yōu)化軟件和算法,來獲得更高的算法精度。在傳統(tǒng)行業(yè)無法提高數(shù)據(jù)質(zhì)量和數(shù)量的情況下,吳恩達認為,傳統(tǒng)行業(yè)應該采用“以數(shù)據(jù)為中心”的模式,把重點放在獲得質(zhì)量更好、匹配度更高的數(shù)據(jù)上。
“在這種思路下,傳統(tǒng)行業(yè)也涌現(xiàn)了一些不錯的應用案例。比如醫(yī)學領域的影像識別AI系統(tǒng),可以幫醫(yī)生‘看’CT影像片子,對腫瘤等病變加以識別,輔助醫(yī)生做出判斷。”朱鵬飛介紹,由于很多數(shù)據(jù)都由專業(yè)的放射科醫(yī)生在影像片子上進行了標注,因此數(shù)據(jù)比較準確,AI算法模型在學習的過程中進步很快。目前很多影像識別系統(tǒng)的準確率都能達到90%以上,由于是輔助醫(yī)生,最后還需醫(yī)生做醫(yī)療決策,但這個水平的準確率在很大程度上降低了醫(yī)生的工作強度。
“盡管傳統(tǒng)行業(yè)有了一些應用AI技術的成功案例,但是要想更好地和AI結合,還得在提高數(shù)據(jù)質(zhì)量方面下功夫。”朱鵬飛建議,首先對于已經(jīng)積累了海量數(shù)據(jù)的傳統(tǒng)行業(yè),在保證數(shù)據(jù)安全的前提下,主動開放數(shù)據(jù)。挖掘數(shù)據(jù)中蘊藏的價值,和需求關聯(lián)起來,會有很大的發(fā)展空間。其次,對于新興行業(yè),比如新能源汽車等,在構建智能工廠規(guī)劃的時候,就把獲取數(shù)據(jù)、智能化的因素考慮進去。
不過朱鵬飛強調(diào),在傳統(tǒng)行業(yè)用好AI技術的同時,也不要濫用AI技術,在應用前做好評估,如果不能提高生產(chǎn)效率,對行業(yè)整體有所提升,那么盲目強行使用AI技術,就是對資源的浪費。“比如一些應用場景需要AI算法達到99%以上的精度才可以使用,通過評估,現(xiàn)有模型算法只能達到90%的精度,那么這個場景就沒必要強行上馬AI技術了。”
“總而言之,對于AI技術的應用要數(shù)據(jù)先行,有高質(zhì)量的數(shù)據(jù)再談應用,沒有好的數(shù)據(jù)很難有好的應用。”朱鵬飛說。