作者/琳玉
前腳臺(tái)積電遭施壓,后腳對(duì)華半導(dǎo)體出口又遇“緊箍咒”。
近期,國(guó)際芯片局勢(shì)再收緊,12月3日,中國(guó)半導(dǎo)體行業(yè)協(xié)會(huì)等四大協(xié)會(huì)發(fā)布聲明,呼吁或建議國(guó)內(nèi)企業(yè)審慎選擇采購(gòu)美國(guó)芯片。
隨著AI浪潮和數(shù)字經(jīng)濟(jì)的高速發(fā)展,作為關(guān)鍵基礎(chǔ)設(shè)施,AI芯片及相關(guān)算力產(chǎn)業(yè)已經(jīng)成為全球數(shù)字化、智能化轉(zhuǎn)型的金鑰匙。算盤(pán)一打,更讓人眼前一亮:據(jù)中國(guó)信通院測(cè)算,每投入1元算力,就能拉動(dòng)3-4元的GDP增長(zhǎng),經(jīng)濟(jì)引擎效應(yīng)不言而喻。
在此背景下,國(guó)內(nèi)人工智能行業(yè)雖屢屢受挫,卻也借此東風(fēng)加速踏上了自主化征途。近年來(lái),我國(guó)算力水平實(shí)現(xiàn)了高速發(fā)展,當(dāng)前總規(guī)模已達(dá)246 EFLOPS,躋身全球前列。預(yù)計(jì)到2025年,算力核心產(chǎn)業(yè)規(guī)模將膨脹至4.4萬(wàn)億,聯(lián)動(dòng)產(chǎn)業(yè)規(guī)模更將突破24萬(wàn)億大關(guān)。
眼下,國(guó)內(nèi)大范圍的“算力荒”局面顯著改觀,但國(guó)產(chǎn)算力中心在蓬勃興起之時(shí),亦步入了新的挑戰(zhàn)期:供需不匹配、算力閑置、利用率低等難題正慢慢浮出水面……
隨之,市場(chǎng)對(duì)“算力運(yùn)營(yíng)”的也需求開(kāi)始躍升。
IDC數(shù)據(jù)顯示,2023年“中國(guó)智算服務(wù)市場(chǎng)”規(guī)模已近200億,且未來(lái)五年,將保持18.9%的年復(fù)合增長(zhǎng)率,2027年有望觸及3075億規(guī)模。
全球市場(chǎng)不確定性加劇,國(guó)產(chǎn)芯片商業(yè)化落地需求愈發(fā)迫切。當(dāng)前,算力運(yùn)營(yíng)”已經(jīng)成為潛在的千億藍(lán)海市場(chǎng),且已有不少前瞻企業(yè)正在積極探索算力的規(guī)劃與運(yùn)營(yíng),推動(dòng)國(guó)內(nèi)芯片核心產(chǎn)業(yè)實(shí)現(xiàn)高質(zhì)量的自主可控發(fā)展。如何激活閑置算力,使國(guó)產(chǎn)算力物盡其用?又如何以算力為依托,進(jìn)一步盤(pán)活人工智能市場(chǎng)?
針對(duì)這些問(wèn)題,本期第一新聲采訪并引用了無(wú)錫數(shù)據(jù)集團(tuán)戰(zhàn)略發(fā)展部兼無(wú)錫市數(shù)字新基建公司負(fù)責(zé)人孫榮鋒、原IDC 圈分析師金磊、英諾天使基金合伙人王晟、第一新聲創(chuàng)始人兼CEO姚毅、北電數(shù)智戰(zhàn)略與市場(chǎng)負(fù)責(zé)人楊震、北電數(shù)智產(chǎn)業(yè)生態(tài)部負(fù)責(zé)人吳岳、中國(guó)信通院云計(jì)算與大數(shù)據(jù)研究所總工程師郭亮、螞蟻數(shù)科AI科技技術(shù)負(fù)責(zé)人李哲等行業(yè)大咖的最新觀點(diǎn),共同探討算力新時(shí)代下的“新機(jī)會(huì)”和“新解法”。
01
算力喊“閑”?
算力“建設(shè)”熱潮下,“消納”寒意漸顯。
大模型爆發(fā)帶動(dòng)了算力的井噴式增長(zhǎng),這股熱潮下,地方政府、運(yùn)營(yíng)商、互聯(lián)網(wǎng)大廠紛紛按下加速鍵,大規(guī)模興建智算中心,試圖加入這場(chǎng)算力的盛宴。數(shù)據(jù)顯示,2023年全國(guó)的智算中心數(shù)量還在30個(gè)左右,而截至今年上半年,國(guó)內(nèi)建成和正在建設(shè)的智算中心已經(jīng)超過(guò)250個(gè)。
當(dāng)算力洪流洶涌而至,算力市場(chǎng)出現(xiàn)了哪些新變化?從智算中心、大模型企業(yè)等供需兩端的動(dòng)態(tài)中,我們可以直觀地感知到。
首先,智算中心已經(jīng)拉響了“算力閑置”的警報(bào)。
在密集的智算中心建設(shè)熱潮下,市場(chǎng)端愕然發(fā)現(xiàn):這些新增的算力似乎并未如預(yù)期那般,在推動(dòng)實(shí)際應(yīng)用落地、助力地方產(chǎn)業(yè)升級(jí)等方面大放異彩。“現(xiàn)在全國(guó)90%的智算中心算力規(guī)模低于1000P,對(duì)大模型訓(xùn)練作用有限,未來(lái)使用效率存疑。”中國(guó)信通院云計(jì)算與大數(shù)據(jù)研究所總工程師郭亮對(duì)龐大的智算中心建設(shè)數(shù)量表示擔(dān)憂(yōu)。
自2024年下半年以來(lái),算力中心的機(jī)架空置問(wèn)題開(kāi)始凸顯;過(guò)去一年間,北京一家算力運(yùn)營(yíng)商在與眾多建設(shè)智算中心的政府及企業(yè)客戶(hù)進(jìn)行了深入交流后,明顯感受到“市場(chǎng)對(duì)算力消納的需求越來(lái)越迫切”。
某大型智算中心相關(guān)負(fù)責(zé)人向第一新聲談到:“從2024年開(kāi)始,采購(gòu)和租用算力設(shè)備的企業(yè)明顯減少;到了現(xiàn)階段,甚至單純的拼低價(jià),都已經(jīng)難以有效消納市場(chǎng)上的存量算力……”
眼下,多數(shù)智算中心仍主要寄希望于手握大模型訓(xùn)練的“算力消耗大戶(hù)”,但現(xiàn)實(shí)困境是:大客戶(hù)資源越來(lái)越稀缺,而智算中心又無(wú)法給出更精細(xì)化的策略、更具吸引力的價(jià)格來(lái)服務(wù)中小型客戶(hù)。由此,算力消納陷入僵局。
“B端需求方傾向于選擇熟悉的合作伙伴,成功交易往往還是局限于良好的合作關(guān)系之間,或具備較強(qiáng)綜合實(shí)力的供應(yīng)商。”上海潤(rùn)六尺科技有限公司總經(jīng)理張亞洲說(shuō)到。算力大客戶(hù)早被鎖定,難以撬動(dòng),這也進(jìn)一步考驗(yàn)了新建智算中心尋找客戶(hù)的能力。
其次,當(dāng)前大模型訓(xùn)練需求顯著下滑,而推理需求的增長(zhǎng)是一個(gè)循序漸進(jìn)的過(guò)程,整體而言,算力采購(gòu)市場(chǎng)也正經(jīng)歷明顯的冷卻期。
狂飆兩年后,大模型的發(fā)展開(kāi)始從狂熱回歸到冷靜。國(guó)外方面,OpenAI、Anthropic相繼推遲了最新模型的計(jì)劃發(fā)布時(shí)間;國(guó)內(nèi)大模型公司則開(kāi)始出現(xiàn)“做減法”的趨勢(shì)。
一方面,GPT5的發(fā)布一再推遲,市場(chǎng)技術(shù)引領(lǐng)缺失,導(dǎo)致整個(gè)行業(yè)大模型的開(kāi)發(fā)和訓(xùn)練活躍程度徘徊在低位。加之高昂的訓(xùn)練成本與持續(xù)的開(kāi)源風(fēng)險(xiǎn),業(yè)界普遍將目光投向下一代大模型的誕生,以期新的技術(shù)框架重新激活市場(chǎng)活力。
網(wǎng)信辦數(shù)據(jù)顯示,截至2024年10月,已有188個(gè)大模型通過(guò)生成式AI備案,但其中超三成的大模型在備案后并未進(jìn)一步公開(kāi)進(jìn)展,只有約10%的大模型在加速訓(xùn)練。
另一方面,當(dāng)前業(yè)內(nèi)開(kāi)始形成的共識(shí)是:“大模型并非參數(shù)越多越好”,原IDC圈分析師金磊分析到:“一些大模型廠商在基礎(chǔ)模型達(dá)到百億參數(shù)量后,便轉(zhuǎn)向了行業(yè)應(yīng)用的發(fā)展,不再盲目追求模型千億、萬(wàn)億參數(shù)規(guī)模的排名。”
而在應(yīng)用方面,大模型企業(yè)在經(jīng)歷了商業(yè)化征途上的廣泛試水后,也開(kāi)始回歸到各自更擅長(zhǎng)的領(lǐng)域,打法上更加聚焦。例如,今年9月,月之暗面決定停止兩款出海產(chǎn)品Ohai和Noise的嘗試,專(zhuān)注Kimi的開(kāi)發(fā)。百川智能創(chuàng)始人王小川則表示將全面投入AI醫(yī)療。
“大模型企業(yè)采取聚焦行業(yè)、精簡(jiǎn)規(guī)模等措施,本質(zhì)原因還是期望通過(guò)成本的控制來(lái)實(shí)現(xiàn)真正的商業(yè)化落地。當(dāng)前國(guó)內(nèi)大模型賽道的燒錢(qián)戰(zhàn)已經(jīng)告一段落,為避免高昂的后期使用成本,‘做減法’成為多方選擇。”第一新聲創(chuàng)始人兼CEO姚毅說(shuō)到。
同時(shí),當(dāng)前資方對(duì)部分市場(chǎng)大模型的投資轉(zhuǎn)為理性。此番風(fēng)向轉(zhuǎn)變預(yù)示著,在基礎(chǔ)大模型風(fēng)潮過(guò)后、推理需求尚未形成較大規(guī)模之前,算力市場(chǎng)將短期承壓。
此外,當(dāng)前大模型的發(fā)展也正面臨著安全可信的高質(zhì)量數(shù)據(jù)短缺問(wèn)題。“未來(lái)的AI應(yīng)用需要大量稀缺且難以獲取的長(zhǎng)尾數(shù)據(jù),如自動(dòng)駕駛中的極端天氣與極端路況數(shù)據(jù)、具身智能訓(xùn)練所需要的復(fù)雜場(chǎng)景數(shù)據(jù)等。”螞蟻數(shù)科AI科技技術(shù)負(fù)責(zé)人、螞蟻天璣實(shí)驗(yàn)室主任李哲說(shuō)到。
近年來(lái),伴隨著大模型技術(shù)的發(fā)展,機(jī)器學(xué)習(xí)正從“以模型為中心”轉(zhuǎn)向“以數(shù)據(jù)為中心”,高質(zhì)量數(shù)據(jù)可以更好地提升模型的準(zhǔn)確性和穩(wěn)定性,但到當(dāng)前階段,數(shù)據(jù)短缺已經(jīng)成為制約模型發(fā)展的關(guān)鍵。據(jù)Gartner預(yù)計(jì),2024年,60%的AI數(shù)據(jù)將是合成數(shù)據(jù);Epoch AI Research研究團(tuán)隊(duì)更是大膽預(yù)測(cè)“到 2026 年,現(xiàn)存的用于AI模型訓(xùn)練的高質(zhì)量語(yǔ)言數(shù)據(jù)將耗盡。”
“垂類(lèi)模型深耕細(xì)分行業(yè),精準(zhǔn)掌握特定領(lǐng)域的知識(shí)模式,其高度專(zhuān)業(yè)化讓任務(wù)執(zhí)行更精準(zhǔn)、更高效。但目前缺少安全可信、高質(zhì)量的數(shù)據(jù)支撐,很難在實(shí)際應(yīng)用中大規(guī)模的開(kāi)展起來(lái)。”一位行業(yè)人士對(duì)第一新聲坦言。
算力需求走低,牽引著其上下游產(chǎn)業(yè)也步入降價(jià)通道。“曾經(jīng)一卡難求的算力GPU也出現(xiàn)了明顯的降價(jià)趨勢(shì)。具體而言,熱門(mén)芯片英偉達(dá)***的八卡整機(jī)價(jià)格,已經(jīng)從去年的360萬(wàn)巔峰下降到230萬(wàn)。這也說(shuō)明,當(dāng)前階段市場(chǎng)算力是足夠的,主要是需求在下滑。”英諾天使基金合伙人王晟說(shuō)到。
02
“買(mǎi)”、“賣(mài)”兩難,
市場(chǎng)深陷“低效利用”迷局
“智算中心的利用率普遍徘徊在低位,而眾多中小企業(yè)卻仍然難以負(fù)擔(dān)高昂的算力成本。”是算力市場(chǎng)在新環(huán)境下面臨的尷尬局面。
IDC今年的調(diào)研數(shù)據(jù)顯示,以企業(yè)為主要用戶(hù)的算力中心,其利用率普遍徘徊在10%-15%的低位。而根據(jù)推算,想要帶來(lái)顯著的經(jīng)濟(jì)效益,算力中心的理想利用率目標(biāo)至少為80%。當(dāng)大量算力資源陷入“沉睡危機(jī)”時(shí),算力需求方卻難以在市場(chǎng)上找到合適的算力。“即使今年以來(lái)算力價(jià)格有所下滑,但對(duì)于眾多中小企業(yè)而言,仍然是很貴的。”北電數(shù)智戰(zhàn)略與市場(chǎng)負(fù)責(zé)人楊震說(shuō)到,供需雙方間似乎存在一層無(wú)形的壁壘,難以跨越。
“算力閑置的重要原因是一方‘買(mǎi)不起’、一方‘賣(mài)不掉’”金磊剖析道,而這一困境背后又有多重因素交織:其一,進(jìn)口芯片難以買(mǎi)到,國(guó)產(chǎn)芯片性能存在代差導(dǎo)致市場(chǎng)使用積極性欠佳;其二,眾多智算中心采用的單卡集群模式,難以支撐當(dāng)?shù)禺a(chǎn)業(yè)多元化場(chǎng)景需求;其三,傳統(tǒng)的租賃、包銷(xiāo)模式束縛智算中心,難以拓展多元客戶(hù)群。
進(jìn)口芯片使用受限的情況下,國(guó)產(chǎn)芯片性能參差不齊,缺乏實(shí)際使用場(chǎng)景的集群數(shù)據(jù),導(dǎo)致市場(chǎng)難以做出采購(gòu)選擇,是算力難以高效利用的重要原因。
當(dāng)前國(guó)外芯片“限供”問(wèn)題造成的市場(chǎng)缺口,需要國(guó)產(chǎn)芯片來(lái)填補(bǔ)。加之政策層面的積極鼓勵(lì),國(guó)產(chǎn)算力在整體算力中的占比持續(xù)攀升。然而,據(jù)張亞洲觀察,當(dāng)前國(guó)產(chǎn)算力市場(chǎng)的參與者眾多,電腦設(shè)備廠商、ICT通訊廠商紛紛‘卷’進(jìn)來(lái),但真正做成、做好的不多。正如中國(guó)工程院院士劉韻潔在2024年中國(guó)算力大會(huì)上所指出的問(wèn)題:“國(guó)產(chǎn)算力已具備一定規(guī)模,但利用率不算十分理想。”
“目前,國(guó)產(chǎn)GPU/AI算力芯片公司的落地難度非常高,國(guó)產(chǎn)芯片想進(jìn)智算中心,必須幫智算中心找到最終買(mǎi)單此芯片和設(shè)備的客戶(hù)公司。從芯片公司、智算中心、模型公司,再到最終的業(yè)務(wù)客戶(hù),整個(gè)鏈條緊密耦合。”北電數(shù)智產(chǎn)業(yè)生態(tài)部負(fù)責(zé)人吳岳進(jìn)一步分析到。
同時(shí),單卡集群應(yīng)用場(chǎng)景少,尤其是對(duì)豐富的AI場(chǎng)景支撐性不足,加劇了算力利用率低的問(wèn)題。楊震作比喻說(shuō)到:“單卡集群像是單打獨(dú)斗的士兵,而非協(xié)同作戰(zhàn)的精銳部隊(duì)。全能芯片英偉達(dá)的單卡集群,就像一位十項(xiàng)全能的運(yùn)動(dòng)員,但你的任務(wù)可能只需要他的一兩項(xiàng)技能,剩下的就是昂貴的資源浪費(fèi)。反觀國(guó)產(chǎn)芯片的單卡集群,芯片之間各有專(zhuān)長(zhǎng)與短板,但使用起來(lái)要規(guī)避短板也較為繁瑣。”
此外,當(dāng)前算力供給三大模式的局限性,又進(jìn)一步導(dǎo)致市場(chǎng)供需難以精準(zhǔn)匹配。
目前市場(chǎng)上主流的算力供應(yīng)模式有三種:一是政府、央國(guó)企投建的算力中心,用于招商引資或產(chǎn)業(yè)引導(dǎo);二是大模型公司自有的算力中心,以自身需求為主,富余算力則通過(guò)云服務(wù)租賃給市場(chǎng)其他需求方;三是運(yùn)營(yíng)商建設(shè)的公共算力中心,通過(guò)匯總市場(chǎng)上的閑置算力,根據(jù)客戶(hù)需求匹配算力。
“這三種模式的共同特點(diǎn)是:它們的核心銷(xiāo)售方式大部分為“獨(dú)占式”的租賃、包銷(xiāo)模式,不論是以卡、匹、時(shí)或臺(tái)為單位計(jì)費(fèi),都意味著,在非全天候使用的情況下,即使并未實(shí)際使用,費(fèi)用仍在持續(xù)產(chǎn)生。獨(dú)占模式往往導(dǎo)致資源利用不足、冗余及浪費(fèi)現(xiàn)象頻發(fā)。”姚毅認(rèn)為,這種模式適合大參數(shù)量的模型訓(xùn)練,但不適用于公共算力服務(wù)。
“算力需求還是很大,只是現(xiàn)有供給類(lèi)型無(wú)法滿(mǎn)足用戶(hù)需求。無(wú)論是適配方面還是性?xún)r(jià)比角度,都達(dá)不到客戶(hù)的預(yù)期。”IDC中國(guó)分析師杜昀龍總結(jié)到。在當(dāng)前AI企業(yè)深受算力成本高昂之困、中小開(kāi)發(fā)者與創(chuàng)業(yè)公司在算力租賃上尤感壓力的背景下,提高算力利用率,讓中小企業(yè)與個(gè)人開(kāi)發(fā)者能夠更方便地使用算力、以更低的成本實(shí)現(xiàn)開(kāi)發(fā)和應(yīng)用,對(duì)產(chǎn)業(yè)的發(fā)展至關(guān)重要。
03
打通“算力、算法、數(shù)據(jù)”孤島,
是破題點(diǎn)
眼下,算力基礎(chǔ)設(shè)施雖然已經(jīng)不斷被補(bǔ)齊,但這些算力資源就像一根根林立的“煙囪”,孤立而建,彼此之間缺乏聯(lián)通與協(xié)作的橋梁,因此難以被產(chǎn)業(yè)上下游有效利用,資源浪費(fèi)嚴(yán)重。
近日,在百度智能云技術(shù)論壇上,“大模型訓(xùn)練中算力有效利用率不足50%。”的話(huà)題受到廣泛關(guān)注,致使“如何提高算力的有效利用率”再次引發(fā)行業(yè)探討。
當(dāng)前,算力市場(chǎng)的“煙囪困境”,受制于AI產(chǎn)業(yè)上下游、國(guó)家環(huán)境等多維度因素。“要解決算力煙囪問(wèn)題,本質(zhì)上來(lái)說(shuō),還是要落到產(chǎn)業(yè)層面。”楊震講到。人工智能三要素:算力、算法、數(shù)據(jù)之間環(huán)環(huán)相扣、互為支撐,破解之道在于三管齊下、打破供需隔閡,為行業(yè)提供能夠疏通算力流通梗阻、促進(jìn)資源精準(zhǔn)對(duì)接的創(chuàng)新型算力消納方案。
算力方面,針對(duì)國(guó)產(chǎn)芯片性能瓶頸及單卡集群的局限性問(wèn)題,業(yè)界提出了“混元異構(gòu)集群”的解決方案。
目前,國(guó)產(chǎn)芯片與國(guó)外芯片之間存在代差,使用單一品牌芯片集群存在固定的、無(wú)法解決的弱項(xiàng)。“通過(guò)混合強(qiáng)弱芯片形成混元集群,再采用算法適配使整體接近高性能芯片,就能夠打破單一集群限制,實(shí)現(xiàn)高效協(xié)同。”金磊表示。
然而,構(gòu)建高效能的多卡集群需要解決技術(shù)復(fù)雜性、資源分散、生態(tài)支持等一系列問(wèn)題,盡管市場(chǎng)上眾多廠商標(biāo)榜具備多集群管理能力,但行之有效的并不多。“真正實(shí)現(xiàn)跨多集群協(xié)同的廠商極少,許多異構(gòu)計(jì)算僅限于兩個(gè)集群間。”楊震表示,北電數(shù)智針對(duì)性推出的算力管理平臺(tái)“前進(jìn)·AI異構(gòu)計(jì)算平臺(tái)”,致力于實(shí)現(xiàn)多集群合作,當(dāng)前已搭建包含三個(gè)國(guó)產(chǎn)混元集群,達(dá)產(chǎn)后將形成2000PFLOPS的智能算力供給。
“打破算力延遲,讓不同算力集群能夠?qū)崿F(xiàn)高效協(xié)同作戰(zhàn),是下一階段必然的發(fā)展趨勢(shì)。”吳岳說(shuō)到,其中涉及到很多細(xì)碎的功夫是必須要去做的,包括算子庫(kù)的補(bǔ)齊、通信庫(kù)的補(bǔ)齊等等。只有把每個(gè)細(xì)節(jié)都做好,才能讓芯片無(wú)差別地支撐各種不同的底座大模型。
同時(shí),相對(duì)算力供給包銷(xiāo)、租賃模式的局限性,按token定價(jià)的模式則大幅降低了算力的使用成本。“算力中心的運(yùn)營(yíng)目標(biāo)應(yīng)該是為企業(yè)提供像水電一樣的基礎(chǔ)算力設(shè)施,用戶(hù)使用了算力或模型服務(wù)才開(kāi)始計(jì)費(fèi),即插即用。”吳岳分析到,當(dāng)前按token計(jì)費(fèi)的模式,主要是幫助中小企業(yè)解決普遍存在的算力應(yīng)用難題,在面對(duì)像醫(yī)院這一類(lèi)傳統(tǒng)客戶(hù)的垂類(lèi)模型訓(xùn)練時(shí),成本甚至可以降到原來(lái)的1/10左右。
算法方面,在構(gòu)建好的芯片混元集群基礎(chǔ)上,運(yùn)用專(zhuān)業(yè)算法實(shí)現(xiàn)芯片的異構(gòu)調(diào)度,能夠保證跨集群訓(xùn)練的穩(wěn)定性,可以解決算力和模型之間的連接問(wèn)題。
目前,各模型配有相應(yīng)的上下游生態(tài)系統(tǒng)、適配芯片及開(kāi)發(fā)框架,這就導(dǎo)致了一定程度的封閉性。企業(yè)因此面臨生態(tài)體系差異大、模型難遷移至其他算力芯片等狀況。若要實(shí)現(xiàn)遷移,既關(guān)乎性能差異,也涉及高昂的成本,可能遭遇模型不兼容、調(diào)試?yán)щy等問(wèn)題,試錯(cuò)成本太大,這也是許多客戶(hù)對(duì)國(guó)產(chǎn)算力望而卻步的原因之一。
北電數(shù)智的核心產(chǎn)品“寶塔·模型適配平臺(tái)”通過(guò)算法搭建類(lèi)似操作系統(tǒng)的適配層,為不同硬件提供統(tǒng)一接口,確保與英偉達(dá)等主流產(chǎn)品的兼容性。“向下適配不同芯片,向上適配不同開(kāi)發(fā)框架,這種普適地解決方案本質(zhì)上是把芯片、模型和開(kāi)發(fā)框架幾個(gè)層面完全打通。在這個(gè)平臺(tái)下,任何一類(lèi)芯片、模型都可以不受阻礙地部署、開(kāi)發(fā)。客戶(hù)不用考慮底層的硬件細(xì)節(jié),始終面對(duì)一致的接口,從本質(zhì)上解決市場(chǎng)上存在的算力利用率低的問(wèn)題。”楊震說(shuō)到。
這種混池策略,將多種算力實(shí)現(xiàn)混合調(diào)配,對(duì)模型的訓(xùn)練與推理任務(wù)都能夠帶來(lái)大幅的效率提升。“在訓(xùn)練任務(wù)中,混池技術(shù)能夠解決不同算力之間的遷移問(wèn)題和協(xié)同使用問(wèn)題。在推理任務(wù)中,混池技術(shù)可以根據(jù)算力需求調(diào)整使用方式,例如用高性能卡處理模型的首token,低性能卡處理后續(xù)內(nèi)容,以此在節(jié)省算力的同時(shí),保證推理的速度大幅領(lǐng)先。”金磊說(shuō)到。
根據(jù)測(cè)算數(shù)據(jù),在現(xiàn)有的智算中心上,布局“前進(jìn)”和“寶塔”后,能夠?qū)崿F(xiàn)運(yùn)營(yíng)效率至少翻倍,針對(duì)純推理需求,效率提升甚至可達(dá)300%以上。“同時(shí),我們通過(guò)軟件加速優(yōu)化提升國(guó)產(chǎn)芯片性能并延長(zhǎng)其壽命。若模型不支持用戶(hù)框架,還可以幫助嫁接開(kāi)源模型庫(kù),讓用戶(hù)以‘0代碼’或‘低代碼’的方式快速開(kāi)發(fā)應(yīng)用,類(lèi)似于搭建了一個(gè)任何人都可以輕松使用的AI工廠。”楊震說(shuō)到。
數(shù)據(jù)方面,當(dāng)前,數(shù)據(jù)采集、高效利用以及數(shù)據(jù)可信等難題凸顯,成為阻礙大模型進(jìn)一步發(fā)展的重要瓶頸。因此,破解數(shù)據(jù)難題,是提升模型訓(xùn)練質(zhì)量,從而進(jìn)一步提升算力利用率的前提。
近期,中國(guó)信息通信研究院院長(zhǎng)余曉暉在數(shù)博會(huì)上著重強(qiáng)調(diào)了建立“數(shù)據(jù)空間” 發(fā)揮數(shù)據(jù)要素的重要性。在當(dāng)前的數(shù)據(jù)難題中,流通問(wèn)題是關(guān)鍵。報(bào)告顯示,國(guó)內(nèi)約70%的高質(zhì)量數(shù)據(jù)掌握在政企手中。而這些數(shù)據(jù)的有效利用面臨多重挑戰(zhàn):首先,出于對(duì)數(shù)據(jù)安全、信創(chuàng)合規(guī)性等方面存在較深顧慮,部分?jǐn)?shù)據(jù)難以對(duì)外提供;再者,缺乏有效機(jī)制及平臺(tái)以保障數(shù)據(jù)的安全和價(jià)值利益。這些因素共同導(dǎo)致市場(chǎng)上的交易量極為有限。
當(dāng)流通難題傳導(dǎo)至中小模型廠商、開(kāi)發(fā)者團(tuán)隊(duì)等數(shù)據(jù)需求方,就形成了模型難以找到合適的訓(xùn)練場(chǎng)景、新興技術(shù)難以落地賦能的困境。因此,構(gòu)建一個(gè)保障數(shù)據(jù)安全、合法、可信交換的數(shù)字化基礎(chǔ)設(shè)施——“可信數(shù)據(jù)空間”已經(jīng)迫在眉睫。
“現(xiàn)階段在無(wú)錫市的數(shù)據(jù)交易中,能夠?yàn)槿斯ぶ悄芴峁┓⻊?wù)的并不多。”無(wú)錫數(shù)據(jù)集團(tuán)戰(zhàn)略發(fā)展部兼無(wú)錫市數(shù)字新基建公司負(fù)責(zé)人孫榮鋒分享了無(wú)錫市當(dāng)前的數(shù)據(jù)交易情況:目前無(wú)錫的數(shù)據(jù)交易為人工智能產(chǎn)業(yè)提供服務(wù)仍處于探索階段。作為工業(yè)大市,無(wú)錫在制造業(yè)AI大模型的數(shù)據(jù)提供方面,受數(shù)據(jù)確權(quán)和數(shù)據(jù)前期治理、清洗、定標(biāo)等復(fù)雜準(zhǔn)備工作的影響,企業(yè)的參與度不高。
為了深度挖掘本地?cái)?shù)據(jù)潛能、賦能地方產(chǎn)業(yè)升級(jí),無(wú)錫大數(shù)據(jù)集團(tuán)承擔(dān)起當(dāng)?shù)厍邪贅I(yè)的公共數(shù)據(jù)資源“開(kāi)發(fā)”和“運(yùn)營(yíng)”責(zé)任。積極構(gòu)建數(shù)據(jù)交易生態(tài)圈,促進(jìn)數(shù)據(jù)要素市場(chǎng)化流通,搭建了無(wú)錫市公共數(shù)據(jù)交易平臺(tái)——錫數(shù)交。“目前我們主動(dòng)和上海數(shù)據(jù)交易所、深證數(shù)據(jù)交易所等一線城市的數(shù)據(jù)交易平臺(tái)合作,并服務(wù)第三方機(jī)構(gòu)開(kāi)展無(wú)錫公共數(shù)據(jù)加工和數(shù)據(jù)產(chǎn)品的開(kāi)發(fā),助力數(shù)據(jù)資源融入全省、全國(guó)的數(shù)據(jù)交易市場(chǎng)。”孫榮鋒講到。
以往,場(chǎng)外數(shù)據(jù)交易平臺(tái)或數(shù)交所多采用API接口直供或線下審批使用等模式來(lái)經(jīng)營(yíng)未經(jīng)必要安全處理的裸數(shù)據(jù),安全合規(guī)存在較大漏洞,且耗時(shí)費(fèi)力,同時(shí)數(shù)據(jù)價(jià)值也不能充分被挖掘。北電數(shù)智打造的紅湖·可信數(shù)據(jù)空間針對(duì)交易壁壘,重點(diǎn)保證數(shù)據(jù)安全、確保雙方利益,為供需雙方提供多層次解決方案和長(zhǎng)期可持續(xù)的模式,并形成完整的商業(yè)閉環(huán)。
“以具身智能應(yīng)用為例,在可信數(shù)據(jù)空間的加持下,數(shù)據(jù)可以投入訓(xùn)練場(chǎng)、融入模型,甚至內(nèi)置于一體機(jī)。隨著數(shù)據(jù)場(chǎng)景增多、新數(shù)據(jù)不斷引入,可信數(shù)據(jù)空間能夠?yàn)閿?shù)據(jù)提供方帶來(lái)穩(wěn)定收益,為數(shù)據(jù)使用方提升模型質(zhì)量、精準(zhǔn)度和其他多樣性的應(yīng)用場(chǎng)景。”楊震分析道,這種模式在數(shù)據(jù)交易市場(chǎng)的進(jìn)一步成熟后可以得到更廣泛的發(fā)展。
04
市場(chǎng)呼喚“產(chǎn)業(yè)生態(tài)”,
行業(yè)需要“串珠人”
“人工智能市場(chǎng)的算力、算法、數(shù)據(jù)幾個(gè)方面就如同散落的珠子,而行業(yè)需要一個(gè)‘串珠人’的角色,將產(chǎn)業(yè)鏈上已有的珠子串上、拉緊,如果沒(méi)有的話(huà),就把它造出來(lái)。”在楊震看來(lái),智算中心作為重資產(chǎn)行業(yè),卻僅能獲取微薄的利潤(rùn),核心原因在于智算中心距離最終的業(yè)務(wù)場(chǎng)景太遠(yuǎn),在產(chǎn)業(yè)鏈的話(huà)語(yǔ)權(quán)較低。
若未來(lái)智算中心要實(shí)現(xiàn)突破并尋求更深層次的發(fā)展,吳岳認(rèn)為有兩條路徑:一是構(gòu)建生態(tài),以全棧能力服務(wù)更多中小企業(yè)客戶(hù),二是做萬(wàn)匹以上的超大規(guī)模,定向服務(wù)少數(shù)客戶(hù)。
市場(chǎng)的本質(zhì)需求是整體解決方案,而非單一產(chǎn)品或年度訂閱服務(wù);智算中心的運(yùn)營(yíng),本質(zhì)上是人工智能產(chǎn)業(yè)鏈的運(yùn)營(yíng)。從健康的業(yè)務(wù)模式來(lái)說(shuō),智算中心想要獲取更多的市場(chǎng)份額和行業(yè)利潤(rùn),則需要深耕算力產(chǎn)業(yè),實(shí)現(xiàn)算力服務(wù)化:既能鎖定大客戶(hù),也能滿(mǎn)足長(zhǎng)尾中小客戶(hù),同時(shí),還需要提供一系列能夠助力業(yè)務(wù)精準(zhǔn)落地的增值服務(wù)與個(gè)性化解決方案。
“對(duì)于大部分中小智算中心而言,加入產(chǎn)業(yè)生態(tài)戰(zhàn)略是唯一的解法。”金磊表示。
因此,構(gòu)建健全的產(chǎn)業(yè)生態(tài)成為推動(dòng)算力市場(chǎng)持續(xù)健康發(fā)展的關(guān)鍵所在。那么,未來(lái),市場(chǎng)需要將建成什么樣的算力生態(tài),怎么樣的生態(tài)能夠促進(jìn)AI產(chǎn)業(yè)的持續(xù)發(fā)展呢?
楊震認(rèn)為,“串珠人”的角色需要算力運(yùn)營(yíng)商來(lái)充當(dāng),通過(guò)匯總閑置算力,匹配客戶(hù)需求,提供量身定制的解決方案。
當(dāng)然,構(gòu)建一個(gè)能夠高效鏈接算力行業(yè)乃至整個(gè)人工智能市場(chǎng)各方的“中轉(zhuǎn)棧”極具挑戰(zhàn)。算力運(yùn)營(yíng)商需要精準(zhǔn)審視算力、算法、數(shù)據(jù)和場(chǎng)景四層中的壁壘,并通過(guò)AI全棧布局突破障礙,幫助智算中心結(jié)合當(dāng)?shù)厮懔┬枨闆r和產(chǎn)業(yè)結(jié)構(gòu),形成具有地方特色的人工智能產(chǎn)業(yè)鏈運(yùn)營(yíng)中心。如此,才能實(shí)現(xiàn)閑置算力的有效消納,并真正發(fā)揮AI基礎(chǔ)設(shè)施的產(chǎn)業(yè)賦能作用。
現(xiàn)階段,各地智算中心正陸續(xù)意識(shí)到產(chǎn)業(yè)生態(tài)的關(guān)鍵性,并積極布局探索。其中,北電數(shù)智旗下的星火·智算擁有從芯片層、算法層再到可信數(shù)據(jù)空間層的全棧布局。同時(shí),星火·智算的標(biāo)桿項(xiàng)目——北京市數(shù)字經(jīng)濟(jì)算力中心還打破傳統(tǒng)形態(tài),將算力展廳、算力劇場(chǎng)、聯(lián)合實(shí)驗(yàn)室以及產(chǎn)投孵化平臺(tái)等功能空間搬進(jìn)智算中心,通過(guò)打開(kāi)產(chǎn)業(yè)場(chǎng)景、聚集產(chǎn)業(yè)要素,最終實(shí)現(xiàn)技術(shù)攻關(guān)以及生態(tài)的良性循環(huán)發(fā)展。
“星火·智算不是簡(jiǎn)單的建筑,而是“智算中心”和“產(chǎn)業(yè)生態(tài)”的共生體,通過(guò)強(qiáng)大的算力支撐、通用的算法體系、高質(zhì)量的數(shù)據(jù)工具,再加上開(kāi)放的生態(tài)思維,能夠幫助智算中心實(shí)現(xiàn)從工具層到生態(tài)層,甚至是客戶(hù)需求方的全面賦能升級(jí)。”楊震說(shuō)到,截止目前,北電數(shù)智已經(jīng)建聯(lián)了近1000家生態(tài)伙伴,目前有3到4個(gè)星火·智算中心在規(guī)劃或建設(shè)中,正與多地政府接洽,將進(jìn)一步規(guī)劃更大范圍的落地。
孫榮鋒對(duì)這一生態(tài)模式表示了肯定:“構(gòu)建產(chǎn)業(yè)生態(tài)是解決當(dāng)前眾多城市算力供需矛盾的有效途徑,尤其對(duì)于無(wú)錫等中小城市而言,是一個(gè)理想的解決方案。它通過(guò)多元化算力供給,能夠整合并解決無(wú)錫算力資源規(guī)模小且分散的問(wèn)題。”
針對(duì)具體的產(chǎn)業(yè)模式,楊震提出了兩方向:一是政府、央國(guó)企通過(guò)公共智算中心的建設(shè)及運(yùn)營(yíng),賦能地方產(chǎn)業(yè)、實(shí)現(xiàn)數(shù)字化的高效轉(zhuǎn)型;二是中小企業(yè)通過(guò)深度融入算力產(chǎn)業(yè)生態(tài),實(shí)現(xiàn)效益最大化,并進(jìn)一步推動(dòng)構(gòu)建健康可持續(xù)的人工智能發(fā)展生態(tài)。
一方面,當(dāng)前政府采用的算力券、招商政策等短期措施難以根本解決當(dāng)?shù)刂撬阒行牡南{問(wèn)題。
有效的解題之道,在于追本溯源。目前,大量智算中心項(xiàng)目都由地方政府、城投平臺(tái)主導(dǎo),所以,建設(shè)AI生態(tài)可以?xún)?yōu)先在政府層面開(kāi)放數(shù)據(jù)、打開(kāi)場(chǎng)景。比如,國(guó)有企業(yè)可以通過(guò)開(kāi)發(fā)垂類(lèi)模型釋放算力應(yīng)用場(chǎng)景,形成第一輪增長(zhǎng)點(diǎn)。然后再通過(guò)算力、算法、數(shù)據(jù)層的工具對(duì)算力中心做精細(xì)化運(yùn)營(yíng),把算力利用率提上去、成本降下來(lái)。在此基礎(chǔ)上,鏈接供需兩端,結(jié)合當(dāng)?shù)禺a(chǎn)業(yè)結(jié)構(gòu)實(shí)現(xiàn)人工智能轉(zhuǎn)型,推動(dòng)區(qū)域人工智能產(chǎn)業(yè)特色發(fā)展,形成第二輪增長(zhǎng)點(diǎn)。
部分前瞻城市已敏銳洞察先機(jī),率先邁出了探索與實(shí)踐的步伐。孫榮鋒在談及此話(huà)題時(shí)透露:“無(wú)錫數(shù)據(jù)交易平臺(tái)上豐富的數(shù)據(jù)資源,其中有相當(dāng)一部分能夠?yàn)槿斯ぶ悄艽竽P偷挠?xùn)練提供助力。以此為依托,無(wú)錫大數(shù)據(jù)集團(tuán)承建了無(wú)錫市的政務(wù)大模型項(xiàng)目,正積極探索垂類(lèi)大模型開(kāi)發(fā)。”
另一方面,當(dāng)前很多AI垂類(lèi)領(lǐng)域在產(chǎn)業(yè)鏈上存在斷點(diǎn)和卡點(diǎn),導(dǎo)致市場(chǎng)上眾多極具潛力的AI應(yīng)用公司尚未探索出商業(yè)閉環(huán)便悄然消失。
以具身智能為例,大量行業(yè)上下游中小型企業(yè)和個(gè)人開(kāi)發(fā)者群體,填補(bǔ)了大企業(yè)不愿涉足的細(xì)分領(lǐng)域,但它們?cè)陂_(kāi)發(fā)訓(xùn)練的過(guò)程中,卻遭遇算力成本、數(shù)據(jù)搜集成本高昂的雙重阻礙,這也進(jìn)一步成為制約整個(gè)產(chǎn)業(yè)鏈落地的最后一道難關(guān)。國(guó)產(chǎn)算力芯片同樣如此,近年來(lái),雖然整體發(fā)展迅猛,但由于缺乏全面的應(yīng)用場(chǎng)景展示和切實(shí)有效的評(píng)測(cè)機(jī)制,很多算力應(yīng)用方對(duì)國(guó)產(chǎn)算力的能力認(rèn)知不夠清晰。
在北電數(shù)智看來(lái),算力及人工智能產(chǎn)業(yè)生態(tài)的構(gòu)建能夠解決這個(gè)急迫問(wèn)題,通過(guò)生態(tài)的搭建提供普惠和適配的算力、嫁接海量AI應(yīng)用場(chǎng)景,幫助中小型應(yīng)用公司、個(gè)人開(kāi)發(fā)者順利完成開(kāi)發(fā),加速產(chǎn)品的商業(yè)化落地、實(shí)現(xiàn)效益的最大化,同時(shí)也推動(dòng)智能科技的前沿應(yīng)用。
為了填補(bǔ)國(guó)產(chǎn)算力全面的應(yīng)用場(chǎng)景展示、切實(shí)有效的評(píng)測(cè)機(jī)制缺失等問(wèn)題,北電數(shù)智打造的“首個(gè)國(guó)產(chǎn)算力PoC平臺(tái)”已正式開(kāi)放。該平臺(tái)依托前進(jìn)·AI異構(gòu)計(jì)算平臺(tái),是全國(guó)首個(gè)在生產(chǎn)環(huán)境下可實(shí)現(xiàn)規(guī)模化測(cè)試的全棧迭代驗(yàn)證平臺(tái),創(chuàng)新‘以評(píng)促用’模式,為國(guó)產(chǎn)算力集群提供垂類(lèi)場(chǎng)景評(píng)測(cè)、適配與驗(yàn)證服務(wù)的同時(shí),能夠?yàn)榻鹑、政?wù)、工業(yè)、醫(yī)療、具身智能等各行業(yè)的AI垂類(lèi)場(chǎng)景應(yīng)用開(kāi)發(fā)提供多種算力適配試驗(yàn)空間,最終打通底層算力至業(yè)務(wù)場(chǎng)景的雙向鏈路,加速?lài)?guó)產(chǎn)算力從“可用”邁向“好用”,推動(dòng)場(chǎng)景化應(yīng)用與商業(yè)化落地。
“AI產(chǎn)業(yè)要快速發(fā)展,肯定是大家綁在一起、吊起膀子來(lái)干。尤其在人工智能重塑科技產(chǎn)業(yè)鏈的時(shí)候,團(tuán)結(jié),才能更快地找出突破性道路。”正如楊震所言,當(dāng)人工智能產(chǎn)業(yè)躍升成為全球戰(zhàn)略性高地、當(dāng)大模型的發(fā)展步入“后訓(xùn)練”時(shí)代,國(guó)內(nèi)人工智能行業(yè)更應(yīng)圍爐共商,共同見(jiàn)證并塑造下一個(gè)智能新時(shí)代。
榜單收錄、高管收錄、融資收錄、活動(dòng)收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報(bào)生成中...