標準化,降低企業(yè)AI成本的終極方案
算法模型還是萬里長征的第一步,如何結(jié)合具體場景實現(xiàn)量產(chǎn)落地才是最終目標。
一間智能倉庫,物料正有條不紊地通過立體倉儲系統(tǒng)自動入庫和出庫,自主移動機器人從倉庫中領(lǐng)取物料,送到制造車間工位。中控室里,出庫、入庫、單據(jù)明細等資料顯示在物流系統(tǒng)中,并且能清楚看到設(shè)備的運行狀態(tài)。這是將人工智能(AI)技術(shù)應(yīng)用到倉儲系統(tǒng)中的典型案例。
研究機構(gòu) IDC 的一項調(diào)研顯示,幾乎所有受訪者均表示會在未來兩年內(nèi)追加對 AI 相關(guān)項目的投資;德勤發(fā)布的 2021 年度《企業(yè)人工智能應(yīng)用現(xiàn)狀報告(第 4 版)》也顯示,近 70% 的企業(yè)已經(jīng)開始著手部署AI應(yīng)用,45% 的企業(yè)全面部署的AI應(yīng)用接近6個。
曠視研究院算法量產(chǎn)負責(zé)人周而進
越來越多的企業(yè)希望能夠在業(yè)務(wù)發(fā)展和日常運營中采用 AI 技術(shù),曠視研究院算法量產(chǎn)負責(zé)人周而進觀察到,企業(yè)想要部署 AI,如果通過內(nèi)部自研解決,往往需要從 0 到 1 招募人才、建立團隊、投入高昂費用,此后經(jīng)過漫長的研發(fā)周期才有可能實現(xiàn)。此外,很多企業(yè)的 AI 需求是非常碎片化、定制化的,如果通過外部采購的渠道,現(xiàn)有的 AI 解決方案無法快速適配具體的應(yīng)用場景。要想解決這些問題,還要先找到問題的根源。
癥結(jié)所在:部署與生產(chǎn)
AI 的部署與企業(yè)的存儲系統(tǒng)、算力分布、網(wǎng)絡(luò)設(shè)施等 IT 基礎(chǔ)設(shè)施能力息息相關(guān),AI 運行依賴于大量數(shù)據(jù)的采集與傳輸,并要求系統(tǒng)快速學(xué)習(xí)、實時反饋。因而企業(yè)需要完備的IT基礎(chǔ)設(shè)施,才能保證 AI 解決方案的正常運轉(zhuǎn)。
曠視在面向消費物聯(lián)網(wǎng)、城市物聯(lián)網(wǎng)和供應(yīng)鏈物聯(lián)網(wǎng)三大核心場景上提供了完整的 AIoT 產(chǎn)品和解決方案:
消費物聯(lián)網(wǎng)領(lǐng)域,曠視以 SaaS 產(chǎn)品的形式向全球開發(fā)者及企業(yè)用戶提供數(shù)十種 AI 能力,同時為數(shù)億臺消費電子產(chǎn)品提供設(shè)備解鎖和計算攝影解決方案,為消費者提供更簡單的服務(wù)與更優(yōu)秀的美學(xué)體驗;
城市物聯(lián)網(wǎng)領(lǐng)域,曠視基于覆蓋云邊端的算法、軟件、硬件能力,持續(xù)推進城市數(shù)字化建設(shè),讓城市運行更加安全便捷、讓建筑空間更高效智能;
供應(yīng)鏈物聯(lián)網(wǎng)領(lǐng)域,曠視以人工智能賦能機器人和自動化設(shè)備,幫助企業(yè)進行倉庫、工廠的數(shù)字化及智能升級,讓生產(chǎn)制造更高效。
不論在哪個領(lǐng)域,AI 始終也離不開數(shù)據(jù)、算法和算力這“三駕馬車”。
在數(shù)據(jù)生產(chǎn)的復(fù)雜性方面,數(shù)據(jù)本身很多時候已經(jīng)很大程度上決定了最后算法生產(chǎn)的效果。訓(xùn)練數(shù)據(jù)本身是否干凈?如何能夠獲得高質(zhì)量的數(shù)據(jù)標注?如何能夠排查數(shù)據(jù)標注中的錯誤、不一致性?如何從數(shù)據(jù)中挖掘出有效的數(shù)據(jù)樣本?這些問題都是在實際生產(chǎn)過程中生產(chǎn)人員面臨的挑戰(zhàn)。
在算法模型的不確定性方面,由于計算機視覺領(lǐng)域在近幾年的飛速發(fā)展,每天都可能有新的優(yōu)秀工作出現(xiàn)。對于一個算法從業(yè)者來說,在模型上首先面臨的挑戰(zhàn)就是——什么樣的模型才是最合適的?第二個挑戰(zhàn)是,當模型生產(chǎn)出來后,要如何部署到各式各樣的硬件平臺載體上面,才能讓它高效、有序地跑起來?第三個挑戰(zhàn)是,模型落地后,對于實際發(fā)生的問題,該用什么樣的手段去迭代、調(diào)優(yōu)、提升模型的效果,這在很大程度上困擾著生產(chǎn)人員。
在硬件平臺的多樣性方面,各種算力強大的新型芯片、硬件開發(fā)板、硬件平臺在近幾年紛紛涌現(xiàn),不同芯片平臺對應(yīng)算法調(diào)用的 SDK,各自封裝的 API 都不一樣。這種不同還只是表象層面的困難,更深層次的困難在于不同芯片平臺背后體系結(jié)構(gòu)也不同,這也意味著計算單元上存在著差異。
算法決定人工智能水平的高低,在實際應(yīng)用場景中,僅靠單點的算法是不夠的,往往需要把幾個算法串在一起,構(gòu)建一個算法的流程,才能完成一個具體需求的落地,當然在這之前,還需要解決算法生產(chǎn)上的一些困難。
算法生產(chǎn)的主要困難主要還是集中在整個生產(chǎn)環(huán)節(jié)的復(fù)雜性上,具體來說,可分為三個方面:第一,數(shù)據(jù)生產(chǎn)的復(fù)雜性;第二,算法模型本身的不確定性;第三,AIoT 平臺的多樣性導(dǎo)致生產(chǎn)過程中復(fù)雜程度與成本的提升。
迎接挑戰(zhàn):推動標準化
面對這些復(fù)雜的問題,曠視也制定了對策,自主研發(fā)了新一代AI生產(chǎn)力平臺Brain++,Brain++ 由曠視自研深度學(xué)習(xí)框架 MegEngine、數(shù)據(jù)管理平臺 MegData 和計算平臺 MegCompute 構(gòu)成。基于 Brain++ 體系,曠視推出自研算法生產(chǎn)平臺—— AIS(AI Service),為算法生產(chǎn)構(gòu)建的一個從數(shù)據(jù)到模型訓(xùn)練、性能分析調(diào)優(yōu)、推理部署測試全鏈路的零代碼自動化的生產(chǎn)力工具平臺。
在實際的 AI 落地應(yīng)用過程中,曠視希望通過 AIS 將算法量產(chǎn),將 AI 生產(chǎn)過程標準化,降低算法生產(chǎn)門檻,讓更多人加入到算法生產(chǎn)的工作中,提升算法生產(chǎn)效率。周而進介紹,AIS 目前已經(jīng)支持 100 多種業(yè)務(wù)模型訓(xùn)練,最快 2 小時即可完成,模型產(chǎn)出精度指標也“遠高于業(yè)界平均水平”。
算法研發(fā)人員聯(lián)合使用 Brain++ 和 AIS 平臺,可以實現(xiàn)智能標注平均加速 30 倍,自動學(xué)習(xí)訓(xùn)練加速 4 至 20 倍。
不過對于 AI 而言,算法模型還是萬里長征的第一步,如何結(jié)合具體場景實現(xiàn)量產(chǎn)落地才是最終目標。曠視認為,標準化是解決算法生產(chǎn)難題的關(guān)鍵。這包括數(shù)據(jù)生產(chǎn)的標準化、算法模型的標準化和整個推理框架的標準化。
對于未來,曠視也將圍繞推動標準化,不斷打磨 AIS 生產(chǎn)平臺,降低算法生產(chǎn)的門檻,鼓勵更多行業(yè)技術(shù)人員參與到算法生產(chǎn)的過程,打通各行各業(yè)的知識,建設(shè)一個開放的算法生產(chǎn)生態(tài)。
本文章選自《數(shù)字化轉(zhuǎn)型方略》雜志,閱讀更多雜志內(nèi)容,請掃描下方二維碼