東數(shù)西算正在成為各行業(yè)的普遍機遇,對于運營商來說也是如此。
東數(shù)西算帶來了全新的算力網(wǎng)絡(luò)建設(shè)需求,以及各行業(yè)普遍的網(wǎng)絡(luò)升級需求。在這一大背景下,運營商還需要一系列細分的價值節(jié)點來推動業(yè)務(wù)進步,打開市場空間。換言之,東數(shù)西算的路有了,運營商接下來更需要關(guān)注路上跑哪些車。
在東數(shù)西算的整體架構(gòu)中,AI預(yù)訓(xùn)練大模型的價值值得關(guān)注。近年來,大模型可謂AI領(lǐng)域最受關(guān)注的方向。高魯棒性的模型效果,卓越的數(shù)據(jù)集表現(xiàn),以及跨模態(tài)等領(lǐng)域的不可替代性,讓大模型成為產(chǎn)業(yè)界與學(xué)界共同關(guān)注的對象。一時間,“煉大模型”成為了AI產(chǎn)業(yè)的共同需求,為此也衍生出配套產(chǎn)業(yè)的全新機遇。
大模型的算力要求非常嚴苛,并且需要一系列軟硬件基礎(chǔ)設(shè)施的支撐,比如基于昇騰AI的人工智能計算中心。不過,單個的計算中心之間算力供給存在差異,因此在東數(shù)西算的背景下,將東部算力需求有序引導(dǎo)到西部,優(yōu)化數(shù)據(jù)中心建設(shè)布局,促進東西部協(xié)同聯(lián)動,能更好地促進大模型產(chǎn)業(yè)發(fā)展。
對于運營商來說大模型帶來了一系列全新的AI市場空間。運營商幫助大模型進行跨地域訓(xùn)練,完成算力資源適配,構(gòu)成了新的服務(wù)機會;而運營商本身運用大模型,也可以提升服務(wù)能力與產(chǎn)業(yè)效率。
01
運營商的新賽道:
大模型訓(xùn)練帶來的市場想象
OpenAI在2018年發(fā)布了一份著名的調(diào)查報告,從2012年開始,全球AI算力在六年間增長了30萬倍,并且還在持續(xù)增長。而當(dāng)大模型時代正式到來,全球AI算力需求進一步加大。AI算力成為了限制產(chǎn)業(yè)智能化發(fā)展的主要挑戰(zhàn)。
2018年,谷歌發(fā)布了NLP領(lǐng)域的預(yù)訓(xùn)練模型Bert,其優(yōu)越的能力快速得到業(yè)界認可。OpenAI打造的GPT-3在多項任務(wù)中實現(xiàn)了跨越級的表現(xiàn),推動全球大模型迎來了爆發(fā)式的發(fā)展,模型參數(shù)呈現(xiàn)了指數(shù)級的增長?!按髷?shù)據(jù)+大模型”成為了AI產(chǎn)業(yè)最受重視的發(fā)展之路。
但在實踐過程里,我們卻可以發(fā)現(xiàn)大模型在訓(xùn)練與部署中存在著諸多挑戰(zhàn)。比如部署場景中存在的模型性能不足問題;不同場景下大模型的泛化能力不強;預(yù)訓(xùn)練大模型參數(shù)多、計算量大,訓(xùn)練成本高企等等。其中,如何低成本、高效率地完成大模型訓(xùn)練,成為首先需要解決的問題。在這種背景下,將大模型在東數(shù)西算背景體系下進行模型訓(xùn)練,正在成為越來越多企業(yè)與學(xué)術(shù)機構(gòu)的選擇。
比如中國科學(xué)院自動化研究所在 2021 世界人工智能大會上發(fā)布了跨模態(tài)通用人工智能平臺——“紫東.太初”。其依托面向超大規(guī)模的高效分布式訓(xùn)練框架,構(gòu)建了具有性能優(yōu)良的中文預(yù)訓(xùn)練模型、語音預(yù)訓(xùn)練模型和視覺預(yù)訓(xùn)練模型,并開拓性地通過跨模態(tài)語義關(guān)聯(lián)實現(xiàn)了“視覺-文本-語音”三模態(tài)統(tǒng)一表示,構(gòu)建了三模態(tài)預(yù)訓(xùn)練大模型,賦予跨模態(tài)通用人工智能平臺多種核心能力。從應(yīng)用層面上看,“紫東.太初”兼具跨模態(tài)理解和生成能力,在“以圖生音”和“以音生圖”等方向上具有廣泛的應(yīng)用空間,可以實現(xiàn)AI為視頻配音、AI語音播報、AI海報創(chuàng)作等應(yīng)用場景。
2022年,千博信息基于昇騰AI和昇思MindSpore AI框架,利用“紫東.太初”三模態(tài)大模型,打造了手語教考一體機,開創(chuàng)性地實現(xiàn)手語動作與示意圖片和文字的聯(lián)動。目前,該一體機已在湖南數(shù)十個學(xué)校陸續(xù)上線,一定程度上緩解了手語師資短缺問題,帶來了重要的社會價值。
而在“紫東.太初”大模型的訓(xùn)練過程中,就非常能夠展現(xiàn)出東數(shù)西算背景下,大模型進行“東數(shù)西訓(xùn)”的典型邏輯。這一模型由中科院自動化所相關(guān)團隊主導(dǎo),基于昇騰AI基礎(chǔ)軟硬件平臺,在武漢人工智能計算中心完成訓(xùn)練??梢哉f提前替更多大模型嘗試了“東部數(shù)據(jù)-中西部算力訓(xùn)練-東部應(yīng)用”的產(chǎn)學(xué)研結(jié)合方式。
以此為案例,我們可以看到運營商的AI新市場正在快速打開。而能夠讓運營商服務(wù)大模型的新市場打開,產(chǎn)業(yè)底座的完善性至關(guān)重要。
02
昇騰底座:
為運營商AI賽道保駕護航
大模型走上“東數(shù)西訓(xùn)”之路,有幾個必要的產(chǎn)業(yè)條件:算法、數(shù)據(jù)、算力、訓(xùn)練所需的軟硬件基礎(chǔ)設(shè)施、算力網(wǎng)絡(luò)。
從目前階段來看,大模型的訓(xùn)練算法已經(jīng)日益完善,國際與國內(nèi)的大模型訓(xùn)練基礎(chǔ)門檻不斷降低。接下來是數(shù)據(jù),東部地區(qū)的企業(yè)、高校、科研機構(gòu)積累了豐富的數(shù)據(jù),可以有效投入大模型的訓(xùn)練當(dāng)中。這也是中國在大模型之路上雖然后起,卻能夠奮起直追的原因。
接下來是算力,隨著各地人工智能計算中心拔地而起,以集群化、集中化的AI算力來完成大模型訓(xùn)練,已經(jīng)成為可能。昇騰AI提供的AI算力體系,既可以作為人工智能計算中心的建設(shè)基礎(chǔ),也可以通過多種方式賦能產(chǎn)學(xué)研各界,帶來充沛、完整的AI算力供給。
而在軟硬件配套設(shè)施層面,昇騰AI基礎(chǔ)軟硬件平臺,包括Atlas系列硬件和伙伴硬件、異構(gòu)計算架構(gòu)CANN、全場景AI框架昇思MindSpore、昇騰應(yīng)用使能MindX、全流程開發(fā)工具鏈MindStudio 和一站式AI開發(fā)平臺ModelArts等。為了能夠滿足越來越多企業(yè)與學(xué)術(shù)機構(gòu)的大模型訓(xùn)練需求,昇騰AI已經(jīng)打造了大模型的全流程使能體系。該體系包含從大模型規(guī)劃、大模型開發(fā)到大模型產(chǎn)業(yè)化的全流程,可以實現(xiàn)端到端加速大模型產(chǎn)業(yè)落地。
我們可以看到,在大模型的需求與基礎(chǔ)技術(shù)崛起后,以昇騰AI為代表的規(guī)模化、產(chǎn)業(yè)化AI基座已經(jīng)走向完善。大模型不但是能訓(xùn),更加走上了簡單、高效、低門檻可訓(xùn)的新周期。
大模型的最后一個關(guān)鍵需求就是網(wǎng)絡(luò)與網(wǎng)絡(luò)配套服務(wù),而這可以成為運營商的重大機遇??梢哉f,昇騰為運營商的AI賽道起到了保駕護航的價值。
03
以AI拓展未來:
運營商創(chuàng)新正當(dāng)時
AI技術(shù)在運營商業(yè)務(wù)版圖中的重要性正在不斷上升。早在2020年,Omdia的ICT-Enterprise Insights就公布了一項調(diào)查數(shù)據(jù),有近80%的全新運營商認為使用AI技術(shù)是一項“重要”或“非常重要”的IT項目,其中近60%的運營商計劃增加對AI工具的投資。
我們可以看到,如今在運營商使用AI、應(yīng)用AI的場景與價值已經(jīng)非常廣泛。比如面對5G網(wǎng)絡(luò)復(fù)雜的運維管理需求,主流運營商都已經(jīng)使用AI技術(shù)來實現(xiàn)網(wǎng)絡(luò)的智能分析、實時預(yù)測和自動化運維。在智能客服與智能外呼平臺中,NLP與多輪對話技術(shù)已經(jīng)成為提升運營商服務(wù)觸達效率的關(guān)鍵。AI技術(shù)也是運營商專網(wǎng)服務(wù)等新模式的重要助力,比如在冬奧期間,中國聯(lián)通就通過AI、云計算、區(qū)塊鏈技術(shù)與5G結(jié)合,護航智慧冬奧。與此同時,運營商在AI技術(shù)上的投入與建設(shè)水準也在不斷加強。
在這個大背景下,用好AI技術(shù),以及服務(wù)客戶用好AI技術(shù)都成為運營商的關(guān)鍵需求。而昇騰底座恰好可以為運營商帶來廣泛且關(guān)鍵的支撐作用。比如說,浙江移動就依托九天平臺+昇騰底座,構(gòu)建了全棧自主創(chuàng)新的行業(yè)AI賦能試驗平臺,提供面向行業(yè)的人工智能基礎(chǔ)設(shè)施,可實現(xiàn)數(shù)據(jù)賦能、算法賦能、應(yīng)用賦能。該平臺預(yù)置了900+算法和800+預(yù)訓(xùn)練模型,可快速定制算法模型,以滿足城市多樣化的場景應(yīng)用需求。通過開放標準化接口,模塊化方案組合,為城市管理提供多場景的AI服務(wù),全力推進算力成為像水電一樣“一點接入,即用即取”的公共服務(wù)。
面向未來,我們可以看到更行業(yè)、產(chǎn)學(xué)研各界都在涌現(xiàn)出大模型的訓(xùn)練與部署需求。進一步來看,大模型屬于產(chǎn)業(yè)級AI能力與應(yīng)用的一部分。除了一般意義上的預(yù)訓(xùn)練大模型,還有更多重度AI模型、AI能力需要踐行跨地域的訓(xùn)練。
與此同時,運營商本身也是大模型與重型AI能力的需求主體。5月16日,浙江移動在電信日發(fā)布的 “杭小憶”就是基于“紫東.太初”,疊加杭州特色景點——南宋御街的場景,進行高效的本地化增量訓(xùn)練打造而成的文旅數(shù)智人。
面向未來,會有越來越多的大模型踏上東數(shù)西算之路。不久之前,“中國算力網(wǎng)-智算網(wǎng)絡(luò)”正式上線,這是中國算力網(wǎng)絡(luò)建設(shè)邁出的重要一步。接下來,會有包括大模型在內(nèi)的大量AI任務(wù)在算力網(wǎng)絡(luò)中完成訓(xùn)練與部署。而運營商可以在算力網(wǎng)絡(luò)的基礎(chǔ)上,共同參與建設(shè)算力網(wǎng)絡(luò)統(tǒng)一大市場,實現(xiàn)全程全網(wǎng)的社會級算力服務(wù),這對于運營商來說是一個巨大機遇。運營商既可以成為算力網(wǎng)絡(luò)建設(shè)的主力軍,也將從AI帶來的網(wǎng)絡(luò)增量中主要獲益。
這些趨勢與變化,正在構(gòu)成運營商的全新賽道。大模型訓(xùn)練帶來網(wǎng)絡(luò)需求增加,配套網(wǎng)絡(luò)服務(wù)更加復(fù)雜。這些特點都可以為運營商帶來極高的價值增量,并且助力打開東數(shù)西算大背景下的連續(xù)性市場空間。
大模型的產(chǎn)業(yè)紀元面前,運營商手中掌握著大模型產(chǎn)業(yè)化的最后一塊拼圖。運營商關(guān)注、發(fā)力這一市場,也有助于大模型走向規(guī)模化應(yīng)用與產(chǎn)業(yè)級繁榮。
未來,大模型訓(xùn)練者、昇騰AI、運營商與產(chǎn)業(yè)需求的“四方聯(lián)動”,將構(gòu)成一個高效率、低門檻的產(chǎn)業(yè)范式,推動AI黃金時代的到來。