您現在的位置:主頁 > 國內 >

對話英特爾AI事業部副總裁:攜手百度,推進三大領域AI落地

來源: 互聯網 發布時間:2018-07-18 點擊:

智東西(公眾號:zhidxcom)

文 | 心緣

智東西7月17日消息,在最近的百度AI開發者大會(Baidu Create 2018)上,英特爾人工智能事業部副總裁兼人工智能架構總經理Gadi Singer發表演講,披露了和百度的一系列深度合作,包括至強處理器優化PaddlePaddle深度學習框架、FPGA賦能百度工作負載加速即服務以及Movidius視覺處理器(VPU)支持百度Xeye智能攝像頭。

會后,Gadi Singer接受了智東西同少數國內媒體的專訪,就英特爾和百度的合作細節、英特爾在AI領域的前瞻性戰略布局、AI發展面臨的挑戰以及對如何做好AI芯片進行深入交流。Gadi Singer表示,英特爾將聚焦硬件、軟件和生態系統對AI展開全方位布局。

▲英特爾人工智能事業部副總裁兼人工智能架構總經理Gadi Singer

一、和百度長期合作,三個領域推進AI落地

百度和英特爾有超過十年的合作歷史。Gadi Singer表示,五年前,他們的合作邁出很一大步,兩家公司建立了面向移動互聯網的戰略聯盟,一起打造智能云手機生態環境。兩年前,雙方在AI方面有了更強的合作。

Gadi Singer重點介紹和百度合作的三款項目:至強處理器優化PaddlePaddle深度學習框架、FPGA加速工作負載和Movidius處理器助力Xeye智能攝像頭。最后,Gadi Singer特意介紹了英特爾針對神經網絡模型的開源nGragh編譯器。

1、至強處理器優化百度PaddlePaddle平臺

深度學習平臺PaddlePaddle是百度于2016年8月底開源的并行分布式全功能深度學習框架,能夠讓開發者和企業安全高效地滿足圖像識別、圖像分類、機器翻譯和自動駕駛等多領域的AI技術需求。本次百度AI開發者大會公布了PaddlePaddle 3.0版本。

PaddlePaddle在英特爾至強可擴展處理器上性能的優化,使得AI應用的運營效率進一步提高,開發者與數據科學家可以使用支持全球數據中心和云計算的硬件來不斷改進AI算法。

英特爾對PaddlePaddle的優化涵蓋計算、內存、架構、通信等不同層面,比如通過AVX Intrinsics函數、BLAS庫(例如MKL, OpenBLAS)或定制CPU函數優化數字運算的效率,以及通過MKL-DNN(面向深度神經網絡的英特爾數學核心函數庫)優化卷積神經網絡(CNN)。

Gadi Singer表示,優化AI框架有兩個非常重要的方式:其一,為框架挑選合適的庫和函數 ;其二,對每個AI工作負載進行分析,從而對它進行適合的培訓,以達到更好的效果。

2、FPGA加速百度工作負載

FPGA是指現場可編程門陣列(Field Programmable Gate Array)。2015年,英特爾以167億美元收購FPGA巨頭Altera,為未來算力的發展趨勢奠定基礎。

目前百度在其開發的異構計算平臺上部署了最新FPGA技術。這一技術的應用在定制化和配置方面更加靈活,對于要求高的工作負載可實現更高的性能和能效,還能開發低延時的應用。

據Gadi Singer稱,FPGA已經被好幾家公司所驗證,既可提供較高帶寬和較低時延,同時又支持大量數據傳輸的工作負載,對AI類應用而言是非常強有力的選擇。FPGA賦能百度云上的工作負載加速即服務,可以為百度的異構計算環境提供更多元化選擇。

3、Movidius VPU助力百度Xeye智能攝像頭

2016年,英特爾收購視覺處理初創公司Movidius。2017年7月,英特爾推出以“PC雞血神器”著稱的Movidius神經計算棒(Movidius Neural Compute Stick)U盤產品,為機器的深度學習提供超大“血包”。

▲使用Movidius神經計算棒進行車輛識別

Movidius處理器被廣泛應用于安全監控攝像頭和無人機,有專門用于計算機視覺引擎,同時兼備用于通用型推理演繹的引擎,兩者組合在一起,可以更好實現計算機視覺和設備端的演繹推理,為集計算和AI于一身的終端設備提供非常有吸引力的解決方案。Movidius研發的視覺處理單元(VPU)具備兩大優勢:一是直接在本地攝像頭運行神經網絡,縮短延遲時間,節約帶寬和成本;二是用前端算法降低能耗,實現長期續航。

百度Xeye攝像頭采用英特爾Movidius Myriad 2視覺處理單元(Movidius Myriad 2 VPU),為機器學習算法提供更低功耗的推理引擎,讓此款攝像頭能夠分析物體和手勢并識別人體,從而為零售行業用戶提供個性化的購物體驗。

▲基于Movidius? Myriad X VPU運行GoogleNet V1網絡的推理

▲Movidius芯片組和Movidius Myriad X VPU(紅色方框標注)

百度機器學習算法通過和英特爾定制化VPU解決方案強強聯合,能以更低功耗優化運營,為零售業提供高性能、低功耗的視覺智能。

4、nGraph編譯器連接PaddlePaddle平臺

最后Gadi Singer還特意介紹了nGragh。nGraph是英特爾在今年3月份開源的一款面向各種設備和框架的深度神經網絡(DNN)模型編譯器,能與多種深度學習框架進行連接。nGraph的所有輸出結果,最終都能在CPU、Movidius、FPGA和未來的Neon上運行。

百度和英特爾已將PaddlePaddle與英特爾nGraph編譯器整合。在其支持下,數據科學家可專注于數據科學研發,而無需擔心如何將 DNN 模型部署到各種不同的硬件平臺做高效訓練和運行。

二、三分戰略布局,搶灘AI市場

在智能手機時代,英特爾曾遭遇水土不服,晚一步入局移動芯片的英特爾在智能手機應用處理器領域長期舉步為艱。AI是繼移動互聯網后的下一個時代,英特爾也開始在AI領域布下重陣。

根據Gadi Singer的判斷,在下一波大的技術浪潮前,將有好幾個小的AI技術浪潮。機器學習改變整個計算世界格局,使人們用更短時間處理更多數據,而這六年只是AI在演進過程中的開頭,在這個階段大部分技術突破都發生在深度學習領域,持續學習、增強學習方面的技術也發展地很快。

他認為,如果把眼光放到宏觀層面來看,機器學習正與新的深度學習技術發生集成。現在深度學習可以進行物體識別、分類以及異常檢測,比如說識別一個人體細胞三維圖、判斷惡性細胞,這些工作都需要復雜認知能力。而隨著未來AI的進一步發展,認知能力更上一層的平臺則是理解人類世界、和人有相同的體驗。因此在智能家居、智能車、照顧老人的機器人方面,機器需要更好地理解人類的對話和請求。想要達到這樣一個目標,深度學習和機器學習能力都很重要。

面對愈發搶手的AI市場,Gadi Singer將英特爾的AI戰略發展分為三大部分:硬件、軟件和生態系統。

1、硬件

至強處理器屬于通用型處理器,是AI的基礎。Gadi Singer表示,大部分AI的演繹推理都是在至強處理器上運行。英特爾不斷豐富至強的指令集,從而實現AI工作負載的加速,并讓軟件堆棧能夠更好地加以利用。

除了通用型,英特爾還有一些專用型的芯片產品。不僅在功耗方面從幾十毫瓦到400瓦實現全面覆蓋,同時也覆蓋從終端設備邊緣到數據中心的不同計算環境。英特爾認為沒有萬能藥,不可能說用一款產品就能滿足不同的使用場景。因此,英特爾在硬件產品方面提供多元化的產品線。

2、軟件

在軟件戰略部分,針對不同硬件,英特爾提供優化的堆棧。不管是數據科學家還是編程員,英特爾對每個用戶端都提供一致的數據體驗。比如英特爾今年3月開源的nGraph編譯器,不僅能對接英特爾所有的硬件產品,還能和PaddlePaddle、Tensorflow、 caffe、MXnet等其他深度學習框架連接。這對用戶來說,是個簡化易用的體驗。

3、生態系統

英特爾在整個AI生態系統提供支撐作用。Gadi Singer認為,生態系統對計算涉及的各個領域都很重要。在他所目睹的技術變革歷史中,AI的發展變革速度史無前例,新技術的出現和廣泛使用可能只需 18-24個月的時間。因此,英特爾非常注重和AI領域的學術界以及思想領袖保持密切的聯系。英特爾在擁有自己的研究院和實驗室的同時,和許多頂級學府開展合作,與他們進行聯合研究或為他們提供資源支持。此外,為了更好的參與開源社區,英特爾還將包括nGraph在內的一些技術開源出來。

據Gadi Singer稱,英特爾也積極參與標準化組織工作。比如在去年,英特爾宣布支持由微軟和Facebook聯合發布的開放式神經網絡交換(Open Neural Network Exchange,ONNX)格式,這一格式用于表示深度學習模型的標準,方便模型在不同框架間之間進行遷移。這是邁向開放生態系統的重要一步,對業界共享好的技術很有幫助。Gadi Singer還強調到,英特爾重視和行業領先者們進行合作,完成一些概念驗證,共同打造技術解決方案。

▲中間為英特爾人工智能事業部副總裁兼人工智能架構總經理Gadi Singer

三、AI從技術到落地到最大挑戰

當被問及從企業角度看AI落地的最大挑戰,Gadi Singer談到一個具體實例,即近年來大熱的深度學習模型——生成對抗式網絡(Generative Adversarial Nets,GANs)。GANs的概念在2014年被提出,到了2016年已經廣為使用。2018年,GANs已經做到第三代,在機器學習研究方面取得了新的進展,可以直接合成新的動物圖像并從圖像中創建3D圖形。

根據Gadi Singer所言,這個技術的采納主要存在兩大障礙。

其一,找到真正有生命力有價值的新技術,而不是一次性有效的新技術。盡管新的技術想法和實驗層出不窮,真正有價值的技術生存下來的卻并不多。

其二,大量數據。很多新的技術需要大量數據才能展現價值和通用性。然而對于部分數據種類,尤其時牽扯到隱私的數據,可能會需要較長時間來完成數據采集。

四、做好AI芯片的關鍵因素

Gadi Singer認為做出好的AI芯片產品,有兩點不可或缺。

其一,弄清楚設計這個處理器究竟是為了解決什么問題。今年已經是Gadi Singer在英特爾工作的第35年,他曾經在多個部門做過不同類型的產品,因為AI領域變化太快,要解決的問題本身也在持續改變, 解決方案本身具有挑戰性。假設不久之前有人開發出針對AlexNet、GoogleNet的完美解決方案,但這個方案到了2019年、2020年可能就無法稱之為好的解決方案,因為會出現新的它無法解決的問題。因此,Gadi Singer認為,如果想要AI芯片解決方案成功,很重要的一點就是做好趨勢判斷,能夠基于這種判斷做出適度合理的猜測。

其二,AI芯片本身由不同部分組成,這些不同功能塊之間要有很好的平衡。如果芯片只是在某一功能塊(比如Tensor Multiplication)做得完美,但整體功能沒有做到均衡,并不足以解決實際場景問題。比如Movidius VPU和NNP主要是加速的作用,但不可能把它們做成只具備加速功能的芯片。所以AI處理器解決方案要注重加入不同元素,可以針對某些場景解決特定問題,但解決問題的范圍不能太過狹窄。

結語:全棧式解決方案,決勝AI時代

萬物互聯時代,英特爾正在全面進軍AI領域。目前,英特爾已經打造了一套完整的全棧式AI解決方案,包括至強處理器、Nervana神經網絡處理器等硬件,FPGA、網絡和存儲技術等技術,MKL和DAAL等用于深度學習和機器學習的數學函數庫,以及支持和優化Caffe、Neon等深度學習框架等。

在推動AI性能升級和技術大眾化的過程中,英特爾不斷和百度等企業進行深入合作。在十多年的合作史間,從智能化終端設備,基于至強可擴展處理器的大規模數據中心,到利用FPGA加速工作負載,再到優化PaddlePaddle開發平臺,英特爾為百度提供豐富的產品和技術專長,加速AI技術的進步和落地。

至于英特爾全方位AI戰略布局將如何開花結果,市場會給出最終的答案。



這篇有關于 對話英特爾AI事業部副總裁:攜手百度,推進三大領域AI落地 的文章,就為您介紹到這里,希望它對您有幫助。如果您喜歡這篇文章,請分享給您的好友。

    相關閱讀
    广东11选五中奖结果查