魔搭ModelScope開(kāi)源社區(qū)
2022年云棲大會(huì),達(dá)摩院聯(lián)合CCF開(kāi)源發(fā)展委員會(huì)共同發(fā)起了國(guó)內(nèi)首個(gè)中文Al模型開(kāi)源社區(qū)“魔搭"(ModelScope),將達(dá)摩院近五年潛心研究的600個(gè)優(yōu)質(zhì)模型,向全中國(guó)的Al研究者與團(tuán)隊(duì)開(kāi)放,共同促進(jìn)中國(guó)的Al基礎(chǔ)研究。作為發(fā)起者之一,達(dá)摩院向魔搭社區(qū)開(kāi)放了一批高質(zhì)量的初始模型,同時(shí),作為社區(qū)的一分子,達(dá)摩院更希望與學(xué)界和企業(yè)一起,通過(guò)開(kāi)源社區(qū)的共建,推動(dòng)模型應(yīng)用生態(tài)繁榮發(fā)展,豐富技術(shù)生態(tài),共同將我國(guó)的人工智能創(chuàng)新推上新的臺(tái)階。
戰(zhàn)略規(guī)劃
近年,A|研究發(fā)展迅猛,不斷拓寬以數(shù)字化、智能化推動(dòng)數(shù)實(shí)融合的空間,但Al應(yīng)用始終存在使用門檻過(guò)高、場(chǎng)景結(jié)合不足等難題。數(shù)據(jù)的復(fù)雜性和稀缺性,以及模型訓(xùn)練高難度與高成本,令模型訓(xùn)練(尤其是大模型的訓(xùn)練)在國(guó)內(nèi)仍未得到普及。另外,模型的定制化對(duì)開(kāi)發(fā)人員要求高,且目前在國(guó)內(nèi)沒(méi)有一個(gè)通用的模型交流平臺(tái),缺乏一個(gè)系統(tǒng)化的模型分享渠道。為此,魔搭ModelScope開(kāi)源社區(qū)應(yīng)運(yùn)而生,唯有開(kāi)源,才能降低大模型的研究門檻;也唯有開(kāi)源,才能推動(dòng)一系列基礎(chǔ)研究的開(kāi)拓和發(fā)展;唯有開(kāi)源,才能為數(shù)實(shí)融合注入新動(dòng)力。
業(yè)務(wù)模式
當(dāng)前,魔搭ModelScope社區(qū)上架模型超過(guò)700個(gè),覆蓋了視覺(jué)、語(yǔ)音、自然語(yǔ)言處理、多模態(tài)等Al主要領(lǐng)域,覆蓋任務(wù)超過(guò)60個(gè)。其中包含幾百個(gè)SOTA(業(yè)界領(lǐng)先)模型和幾十個(gè)預(yù)訓(xùn)練大模型,均已開(kāi)源代碼或開(kāi)放使用。ModelScope社區(qū)兼容了各種機(jī)器學(xué)習(xí)的框架,開(kāi)發(fā)者可以快速接入各種模型。目前,社區(qū)上也集合了很多來(lái)自高校,企業(yè)的優(yōu)秀模型。
技術(shù)架構(gòu)
ModelScope社區(qū)提供了一站式的模型服務(wù),包括模型的管理、下載、調(diào)優(yōu)、訓(xùn)練、部署一體化能力,社區(qū)提供非常豐富的模型以及對(duì)應(yīng)的版本管理能力。社區(qū)也提供一個(gè)在線體驗(yàn)的能力,在不開(kāi)發(fā)代碼的情況下,能夠讓眾多使用者能夠快速體驗(yàn)各種模型的效果。除了模型以外,社區(qū)同時(shí)還提供了豐富的數(shù)據(jù)集。為了構(gòu)建這些完整的平臺(tái)體驗(yàn),ModelScope提供了一個(gè)功能強(qiáng)大的開(kāi)源Python package,這個(gè)package提供了不同模型接入Model Scope生態(tài)的接口和實(shí)現(xiàn),底層能夠兼容各種機(jī)器學(xué)習(xí)框架,無(wú)縫銜接模型應(yīng)用與開(kāi)發(fā)。
轉(zhuǎn)型成效
(一)企業(yè)價(jià)值:
提供高效便捷工具,提高經(jīng)營(yíng)效率。通過(guò)模型開(kāi)源的方式,給阿里巴巴集團(tuán)內(nèi)部提供了全套模型即服務(wù)的工具,讓集團(tuán)各個(gè)部門能夠更加高效便捷地研發(fā)、使用新技術(shù),通過(guò)人工智能創(chuàng)新和變革工作模式,包括生產(chǎn)經(jīng)營(yíng)成本下降、協(xié)同效率提升、產(chǎn)品質(zhì)量提升、流程優(yōu)化、經(jīng)濟(jì)效益增加。通過(guò)提供基礎(chǔ)模型,讓人工智能算法架構(gòu)趨于統(tǒng)一,統(tǒng)一底層算法架構(gòu)為下一代通用人工智能系統(tǒng)提供了條件。
(二)社會(huì)價(jià)值:
共享技術(shù)紅利,實(shí)現(xiàn)綠色節(jié)能。魔搭ModelScope社區(qū)為科研工作者提供了最前沿的開(kāi)源模型,豐富數(shù)據(jù)集以及共享交流的平臺(tái),對(duì)開(kāi)發(fā)者提供了一系列開(kāi)發(fā)者支持計(jì)劃,開(kāi)發(fā)者可以免費(fèi)獲取算力、Al教程,可以快速上手進(jìn)行學(xué)習(xí)和實(shí)踐。魔搭社區(qū)開(kāi)源了一系列預(yù)訓(xùn)練大模型,讓廣大企業(yè)尤其是中小企業(yè),不需要在基礎(chǔ)模型訓(xùn)練上投入大規(guī)模算力和數(shù)據(jù),而是基于預(yù)訓(xùn)練模型,用小規(guī)模算力和數(shù)據(jù)訓(xùn)練下游任務(wù),豐富場(chǎng)景運(yùn)用的實(shí)例,在全社會(huì)層面減少算力損耗,實(shí)現(xiàn)綠色節(jié)能。
魔搭模型開(kāi)源社區(qū)的主要發(fā)起方,阿里巴巴集團(tuán)達(dá)摩院,一直致力于通過(guò)技術(shù)的應(yīng)用和研發(fā),提高智能產(chǎn)品的滲透率,通過(guò)開(kāi)源共享的技術(shù),推動(dòng)產(chǎn)業(yè)智能化升級(jí)。在人工智能技術(shù)方面,達(dá)摩院建設(shè)了完整的基礎(chǔ)Al能力:深度學(xué)習(xí)、語(yǔ)音、 NLP、視覺(jué)、優(yōu)化等,并通過(guò)開(kāi)源社區(qū)魔搭ModelScope社區(qū)開(kāi)源開(kāi)放了760個(gè)各種模態(tài)的模型,覆蓋視覺(jué),語(yǔ)音,自然語(yǔ)言處理,多模態(tài),Al for Science等,在主要的Al技術(shù)賽道上達(dá)到世界先進(jìn)水平。
本文章選自中國(guó)上市公司協(xié)會(huì)發(fā)布的《中國(guó)上市公司數(shù)字化轉(zhuǎn)型典型案例》