
小藝是怎樣煉成的?華為端側(cè)大模型交卷

在這場(chǎng)大模型競(jìng)賽中,華為走在了前列。
手機(jī)+大模型,這是當(dāng)下最火熱的技術(shù)賽道之一。各大手機(jī)廠商誰也不想掉隊(duì),紛紛推出自己的AI大模型。
比如vivo即將在開發(fā)者大會(huì)上揭曉搭載大模型的新機(jī),OPPO已經(jīng)啟動(dòng)了基于AndesGPT大模型的新小布1.0 Beta版公測(cè),小米也宣布將小愛同學(xué)升級(jí)為AI大模型,并招募測(cè)試用戶。
而在這場(chǎng)大模型競(jìng)賽中,華為顯然走在了前列。早在8月初,華為在開發(fā)者大會(huì)上發(fā)布的新一代智能操作系統(tǒng)HarmonyOS 4就接入了AI大模型,小藝成為首個(gè)具有AI大模型能力的終端語音助手。
搭上大模型,語音助手終于“智能”了
這也是目前大模型與手機(jī)結(jié)合的主要方式,圍繞著語音助手做創(chuàng)新,讓它們更加智能。這一點(diǎn),手機(jī)廠商們已經(jīng)形成共識(shí),華為率先交出了答卷。
華為在盤古L0大模型的基礎(chǔ)上,專門針對(duì)終端消費(fèi)者場(chǎng)景中涉及的數(shù)據(jù)進(jìn)行了精細(xì)的調(diào)優(yōu),構(gòu)建出一個(gè)L1層對(duì)話模型,應(yīng)用到了小藝身上。
華為形容,大模型版小藝“更聰明、更能干、更貼心”,這三個(gè)特點(diǎn)具體體現(xiàn)在以下幾個(gè)方面:
第一,智慧交互更聰明。過去,語音助手常被詬病語義理解困難、回答過于機(jī)械化。現(xiàn)在有了AI大模型的支持,小藝能夠通過自然語言對(duì)話理解并執(zhí)行用戶的指令,而無需用戶說出標(biāo)準(zhǔn)的功能名稱。對(duì)于不熟悉手機(jī)操作的老人,這種適老化的設(shè)計(jì)提供了極大的便利。
小藝還可以處理更加復(fù)雜的場(chǎng)景編排任務(wù),用戶可以一次性給出一系列指令。例如用戶說:“晚上12點(diǎn)后設(shè)置免打擾,但如果是媽媽來電讓我聽到,7點(diǎn)叫我起床,下雨則提前半小時(shí)叫醒,上午10點(diǎn)提醒我參加會(huì)議,中午12點(diǎn)到2點(diǎn)設(shè)為靜音。”小藝會(huì)經(jīng)過邏輯推理后快速創(chuàng)建相應(yīng)任務(wù)。
第二,高效工具更能干。大模型是一個(gè)提高生產(chǎn)力的工具,現(xiàn)在有了大模型的加持,小藝也可以幫助我們?cè)谄綍r(shí)的工作中提升效率。比如為用戶提供文本生成、摘要總結(jié)、多語種翻譯等功能,此前余承東就在微博分享了小藝生成的開發(fā)者大會(huì)文案。
用戶可以通過自然語言描述讓小藝快速查找文件或圖庫中的特定圖片,它還能識(shí)別圖片中的信息并提供相應(yīng)服務(wù),如識(shí)別海報(bào)上的活動(dòng)地址并進(jìn)行導(dǎo)航,或根據(jù)車輛照片識(shí)別車型。甚至,用戶給它一張表格圖片,小藝就能將數(shù)據(jù)整理為Excel文檔。
第三,私人助手更貼心。隨著小藝與用戶相處的時(shí)間越來越長(zhǎng),它就會(huì)越來越懂你,這是在語言理解能力和生產(chǎn)力之上更長(zhǎng)足的進(jìn)步。它能記錄你的瑣事和靈感,了解你的日常偏好和習(xí)慣,逐漸從通用變得專屬,成為一個(gè)真正的私人助手。
舉個(gè)例子,當(dāng)你出去旅游,如果你愛看小說,路上小藝就會(huì)給你推小說閱讀,到了地方,如果你愛吃,它會(huì)給你推當(dāng)?shù)孛朗,如果你愛逛,它給你推當(dāng)?shù)鼐包c(diǎn)。再往前一步,想象一下,如果日后小藝被應(yīng)用到華為的全屋智能場(chǎng)景中,是不是有些賈維斯入戶的意思了。
把大模型放進(jìn)手機(jī)分幾步
手機(jī)上使用大模型已經(jīng)不是什么新鮮事了,像ChatGPT、文心一言都推出了APP,相信有很多人都嘗試過,但這些應(yīng)用都是依賴云端算力。而現(xiàn)在的趨勢(shì)是,手機(jī)廠商正在努力使大模型直接在手機(jī)終端運(yùn)行。這樣做的原因是什么?
一方面,隨著設(shè)備和數(shù)據(jù)流量的快速增長(zhǎng),以及數(shù)據(jù)中心成本的攀升,云端的算力需求變得越來越大,已經(jīng)難以繼續(xù)滿足。而且,現(xiàn)代人們手機(jī)不離身,手機(jī)涉及到大量的個(gè)人信息。如果這些信息被上傳到云端,就會(huì)存在信息安全隱患。
因此,利用手機(jī)等終端的閑置算力資源,不僅可以為大模型提供更高效的運(yùn)行環(huán)境,還能確保用戶數(shù)據(jù)的安全。此外,移動(dòng)終端豐富的應(yīng)用場(chǎng)景也為大模型提供了更多的應(yīng)用可能性。
另一方面,手機(jī)終端本身也迫切需要大模型來提升用戶體驗(yàn)。華為終端BG AI與智能全場(chǎng)景業(yè)務(wù)部總裁賈永利指出,大語言模型具備泛化能力,能夠幫助手機(jī)智能助手提升理解能力。另外,大模型Plug-in的插件能力,可以在手機(jī)內(nèi)部打通各應(yīng)用之間的壁壘,借助工具拓展能力。
所以,大模型與手機(jī)終端是“雙向奔赴”。
然而,大模型以其千億級(jí)的參數(shù)量和高昂的運(yùn)行成本著稱,如何在功耗僅有幾瓦的手機(jī)上運(yùn)行這樣的模型?
第一步,端云協(xié)同的混合架構(gòu)是關(guān)鍵。模型訓(xùn)練需要大量算力,適合在云端完成,而手機(jī)端主要負(fù)責(zé)推理,只需激活模型的部分模塊和神經(jīng)元。簡(jiǎn)單任務(wù)直接在手機(jī)端完成,復(fù)雜任務(wù)則調(diào)用云端資源。這種端云協(xié)同不僅需要端側(cè)模型處理個(gè)性化數(shù)據(jù),還要考慮到端側(cè)的算力和功耗限制,從而依賴云側(cè)模型。這其中如何分配任務(wù)、協(xié)調(diào)配合、保護(hù)數(shù)據(jù)隱私等,都是對(duì)廠商技術(shù)的考驗(yàn)。
以華為為例,小藝背后的大模型擁有端側(cè)和云側(cè)兩種形態(tài),可以針對(duì)不同設(shè)備和場(chǎng)景的需求進(jìn)行處理。端側(cè)大模型會(huì)對(duì)用戶請(qǐng)求和上下文信息做預(yù)處理,然后把需求發(fā)送到云端,最大化地發(fā)揮“端側(cè)快”和“云側(cè)強(qiáng)”的優(yōu)勢(shì)。華為自研的通用大模型和自有云計(jì)算業(yè)務(wù),為端云協(xié)同提供了基礎(chǔ)支撐。
第二步,升級(jí)手機(jī)操作系統(tǒng),節(jié)能提效。大模型需要和手機(jī)操作系統(tǒng)深度結(jié)合,才能提供系統(tǒng)級(jí)的體驗(yàn)。華為從底層重構(gòu)了大模型與語音助手的協(xié)作系統(tǒng),摒棄了過去多個(gè)系統(tǒng)獨(dú)立構(gòu)建的“割裂”模式,讓大模型成為智慧系統(tǒng)的大腦,對(duì)系統(tǒng)進(jìn)行全面增強(qiáng)。
華為終端業(yè)務(wù)軟件部總裁龔體表示,“相比傳統(tǒng)的PC或者服務(wù)器,移動(dòng)終端最大的挑戰(zhàn)就是如何平衡好體驗(yàn)和能耗,這是鴻蒙內(nèi)核設(shè)計(jì)最重要的核心點(diǎn)之一。”華為在軟件系統(tǒng)上做了很多優(yōu)化和協(xié)調(diào),讓大模型在手機(jī)上運(yùn)行更高效、更節(jié)能。
第三步,壓縮模型規(guī)模,降低算力需求。通過剪枝、量化和蒸餾等模型壓縮與加速技術(shù),給大模型減重。然后再根據(jù)手機(jī)終端的特點(diǎn)和需求,讓大模型針對(duì)性學(xué)習(xí)數(shù)據(jù)和知識(shí)。比如華為就讓小藝重點(diǎn)學(xué)習(xí)了對(duì)話、設(shè)備操作、購物、生活常識(shí)等內(nèi)容。并且還對(duì)提示詞和輸出格式進(jìn)行了逐字分析和壓縮,將推理時(shí)延減少了一半。
為了讓大模型在用戶端得到廣泛應(yīng)用,除了前述這些,背后還有許多技術(shù)和產(chǎn)業(yè)層面的挑戰(zhàn)需要攻克,但華為已經(jīng)證明了它的可行性。
而且,近兩年全球智能手機(jī)市場(chǎng)低迷,大家都沒什么動(dòng)力換新機(jī)。據(jù)Counterpoint Research最新數(shù)據(jù),今年第三季度全球智能手機(jī)銷量同比下滑8%,創(chuàng)下十年來該季度的最低水平。
在這種情況下,手機(jī)廠商迫切需要一個(gè)新的賣點(diǎn)來吸引消費(fèi)者,AI大模型的崛起為廠商提供了一個(gè)絕佳的機(jī)會(huì)。
本文章選自《數(shù)字化轉(zhuǎn)型方略》雜志,閱讀更多雜志內(nèi)容,請(qǐng)掃描下方二維碼
