昇騰AI:拓寬應用邊界,縮小AI成本鴻溝
AI在深刻地變革我們的生活和生產(chǎn)方式,并在不同行業(yè)呈現(xiàn)著巨大價值。
AI在深刻地變革我們的生活和生產(chǎn)方式,并在不同行業(yè)呈現(xiàn)著巨大價值。
有顛覆性的應用場景,比如在關(guān)乎生命安全的礦山作業(yè),AI技術(shù)來代替人識別人員、設備、環(huán)境的運行狀態(tài)。實時處理、分析和上報,保證礦井生產(chǎn)安全;
有提升生活水平的應用場景,比如多模態(tài)的內(nèi)容生成、機器人應用以及自動駕駛;
有面向前沿領域的應用場景,AI與不同領域的技術(shù)進行碰撞,加速應用落地。比如藥物研發(fā),AI可以大幅度縮短藥物研發(fā)中小分子藥物篩選的周期。比如中國商飛上海飛機設計研究院聯(lián)合華為發(fā)布了業(yè)界首個工業(yè)級流體仿真大模型“東方.御風”。基于昇騰AI打造的面向大型客機翼型流場高效高精度AI仿真預測模型,在昇思MindSpore流體仿真套件的支持下,有效提高了對復雜流動的仿真能力,將仿真時間縮短至原來的二十四分之一。
科技部近日也發(fā)布《關(guān)于支持建設新一代人工智能示范應用場景的通知》,公布了首批人工智能示范應用的十大場景,首批示范應用場景包括智慧農(nóng)場、智能港口、智能礦山、智能工廠、智慧家居、智能教育、自動駕駛、智能診療、智慧法院、智能供應鏈10個場景。
但是我們看到,AI是一個包括芯片、開發(fā)在內(nèi)的軟硬件不斷迭代的過程。隨著摩爾定律的停滯,在當前技術(shù)迭代越來越貴的情況下,如何實現(xiàn)AI性能和成本的平衡,成為影響AI普及的重要因素。
昇騰AI基礎軟硬件不僅提供模塊、板卡、小站、服務器、集群等豐富的產(chǎn)品形態(tài),是面向“端、邊、云”的全場景AI基礎設施方案,同時還提供覆蓋深度學習領域訓練和推理全流程的開源AI計算框架MindSpore。因此對于人工智能技術(shù)從開發(fā)、部署到應用端到端流程都有深刻的理解。
為了了解影響AI成本有哪些因素,以及如何降低AI成本,至頂科技與華為昇騰AI領域的專家進行了交流。
算法、開發(fā)和規(guī);,AI架構(gòu)新挑戰(zhàn)
從AI架構(gòu)來看,華為昇騰AI專家認為,當前AI企業(yè)面臨三個挑戰(zhàn)。
首先是算法的創(chuàng)新。中國的AI企業(yè)主要聚集在應用層,但是一個好的AI應用,是需要最底層的算法和模型來實現(xiàn)更高效的算子,如何實現(xiàn)底層算法的創(chuàng)新是當前AI企業(yè)面臨的第一個挑戰(zhàn)。
其次是開發(fā)應用上,當前包括在金融、醫(yī)療、人工智能等領域,其算力需求是一個無底洞,使用AI成本會很高,“如果我們把算力做成了一個公共的數(shù)字基礎設施,更多的初創(chuàng)企業(yè)就可以去使用,來減少AI開發(fā)應用難的問題。”華為昇騰AI專家講道。
三是規(guī)模部署難,一些新的技術(shù)應用研發(fā)出來,但是不能很好的找到商用場景。比如說像一些中小企業(yè)可能只會在當?shù)卣疑虡I(yè)場景,如果需要跨區(qū)就沒有人力或者影響力去做這件事情。
總結(jié)來說,影響AI企業(yè)發(fā)展的三個挑戰(zhàn),一是最底層技術(shù)上的創(chuàng)新難,二是應用開發(fā)上貴,三是規(guī)模部署難。
適配、訓練和部署,AI模型新挑戰(zhàn)
如果從模型、算法角度看,華為昇騰AI專家認為,會遇到適配,訓練和部署三個挑戰(zhàn)。
適配方面,不同AI平臺的適配問題是造成AI開發(fā)和應用難的主要挑戰(zhàn)。當前國際形勢復雜,基礎軟件可獲得性的不確定因素日益增高。昇思MindSpore作為開源的國產(chǎn)AI創(chuàng)新框架,已經(jīng)實現(xiàn)了通用的AI模型適配,做到了技術(shù)安全可控。
訓練方面,大模型訓練的挑戰(zhàn)主要是需要強大的算力,通過昇思MindSpore AI框架及昇騰AI處理器的協(xié)同優(yōu)化,實現(xiàn)了運行態(tài)的高效,大大提高了計算性能;同時 昇思MindSpore原生支持大模型訓練,提供自動并行和可視化調(diào)優(yōu)等關(guān)鍵創(chuàng)新,能顯著提高模型的訓練效率。
部署方面,MindSpore提供全場景能力,可以實現(xiàn)模型零代碼跨平臺應用,做到模型一次開發(fā)全場景部署。
技術(shù)、場景、生態(tài)融合創(chuàng)新,實現(xiàn)AI成本降低
在華為昇騰AI專家看來,AI成本主要包括四個部分:
數(shù)據(jù)成本:沒有數(shù)據(jù)如同無源之水,AI就沒有辦法學習。
硬件成本:通俗講就是NPU、CPU、GPU等硬件成本。
軟件成本:包括算法、應用的開發(fā)創(chuàng)新等成本。
落地成本:包括解決方案的推廣,后續(xù)的服務等。
如何降低AI成本,從硬件層面,昇騰AI在全國布局AI人工智能計算中心,實現(xiàn)了AI的公共、普惠的獲取,改變了從原來的專有、昂貴的AI的獲取模式。目前,昇騰已上線的10多個城市人工智能計算中心,已經(jīng)累計為各地550多家企業(yè)、60多所高校、30多個科研單位提供服務,誕生了一批原創(chuàng)領先的科研成果,孵化了一批行業(yè)新應用。
其次,在針對算法創(chuàng)新上昇騰AI通過開放典型的一些場景應用的SDK開發(fā)包,來助力一些AI的開發(fā)能力較弱的中小企業(yè)來快速開發(fā)AI應用。具體而就是把不同行業(yè)的實踐經(jīng)驗通過SDK固化,實現(xiàn)運維平臺低代碼,甚至零代碼的模式,通過圖形化的操作界面去做后續(xù)的運維,降低用戶使用AI的門檻。
最后推動成立一些產(chǎn)業(yè)聯(lián)合體,比如圍繞基于昇騰AI打造的全球首個遙感影像智能解譯專用框架武漢.LuoJiaNet和業(yè)界最大遙感樣本庫武漢.LuoJiaSET成立的智能遙感開源生態(tài)聯(lián)盟,包含了像武漢大學等處于遙感領域?qū)W術(shù)前沿的高校,和非常多的應用單位及科研機構(gòu),把需求和市場以及科研前沿能力做對接,通過免費并開源越來越多的數(shù)據(jù)來降低AI獲取成本。
提升AI的效率也是降低TCO的一種方式,華為昇騰AI專家表示,在千億大模型訓練上,昇思MindSpore AI框架的通過提供自動并行和自動調(diào)優(yōu)的等能力來提升訓練效率。
“昇思MindSpore 原生支持AI大模型訓練,是業(yè)界支持并行維度最多的AI框架,支持7種維度并行,能夠?qū)崿F(xiàn)計算和通信整體迭代時間最短。同時也業(yè)界是支持模型切分結(jié)構(gòu)最全的AI框架,并行支持多模型類型切分:Transformer(稀疏/稠密)、卷積、高維稀疏等5種結(jié)構(gòu)。”華為昇騰AI專家分享了在大模型訓練上的優(yōu)勢。這樣實現(xiàn)了自動并行的并行代碼數(shù)量會相對傳統(tǒng)方式下降80%,自動調(diào)優(yōu)時間可以下降60%。
在模型部署上,昇思MindSpore提供的套件能夠?qū)崿F(xiàn)模型輕量化,通過自動剪枝、蒸餾、量化完成10倍級模型壓縮率,降低模型部署門檻。
關(guān)于AI發(fā)展未來發(fā)展趨勢,華為認為隨著算力網(wǎng)絡的建設以及AI應用的不斷拓展,AI發(fā)展從數(shù)據(jù)、算力到應用的匯聚和流通將呈現(xiàn)生態(tài)化趨勢。在這樣的趨勢下,華為將繼續(xù)發(fā)力基于昇騰AI基礎軟硬件平臺的大模型和科學計算兩個領域,為AI普及作出自己的貢獻。
本文章選自《數(shù)字化轉(zhuǎn)型方略》雜志,閱讀更多雜志內(nèi)容,請掃描下方二維碼