在高喊“要做中國版OpenAI”之后的第136天,王慧文把光年之外賣給了美團(tuán)。
2023年6月29日,美團(tuán)在港交所發(fā)布公告,于2023年6月29日全資收購「光年之外」100%的股權(quán),收購總代價(jià)包括:2.33673億美元現(xiàn)金+承擔(dān)3.66924億元人民幣債務(wù)+1元人民幣,合計(jì)大約20.65億元人民幣。
很難想象,國內(nèi)*家由大佬入局創(chuàng)辦的大模型初創(chuàng)公司會以這種方式收尾,這一結(jié)局給市場留下了無數(shù)的疑問和猜測。
從整體商業(yè)視角看,光年之外被美團(tuán)收購只是企業(yè)間常見的收購動作。但對于國內(nèi)AI行業(yè)來說,這筆收購似乎預(yù)示著僅火熱半年的AI大模型創(chuàng)業(yè)潮正在降溫。
資本市場對行業(yè)水溫的感知更加直觀。自6月26日開始,科大訊飛、昆侖萬維、360等AI概念股集體大跌。
不只是國內(nèi),人們甚至對曾經(jīng)趨之若鶩的ChatGPT也不再追捧。
根據(jù)網(wǎng)站數(shù)據(jù)分析工具SimilarWeb數(shù)據(jù),前期ChatGPT的訪問量增長率驚人,1月份的環(huán)比增長率為131.6%,2月份為62.5%,3月份為55.8%,在4月份明顯放緩,環(huán)比增長率為12.6%,到了5月,這個(gè)數(shù)字只剩2.8%。
當(dāng)大模型的熱度不再,人們很容易想到一個(gè)問題:大模型到底是不是創(chuàng)業(yè)的好機(jī)會?
這個(gè)問題顯然沒有標(biāo)準(zhǔn)答案,甚至連大佬之間的看法都大相徑庭。就在前幾天,獵豹移動董事長兼CEO傅盛和金沙江創(chuàng)業(yè)投資基金董事總經(jīng)理朱嘯虎為此在朋友圈“吵”了起來。
大模型的認(rèn)知矛盾并不只集中在個(gè)體身上。當(dāng)創(chuàng)業(yè)者、投資人與需求方都存在認(rèn)知偏差的時(shí)候,對于大模型的“謹(jǐn)慎與保守”,就成了絕大多數(shù)玩家的普遍狀態(tài)。
在6月16日召開的2023年華映資本年度大會上,華映資本投資人與被投的硬科技及消費(fèi)科技企業(yè)之間,對產(chǎn)業(yè)如何擁抱大模型與AIGC的問題也曾展開過激烈的探討。
在「甲子光年」看來,大模型市場急需理性的聲音,創(chuàng)新的腳步不能停,諸多問題尚待厘清——大模型究竟能不能投?如何投?入局大模型有哪些問題?大模型未來的商業(yè)化前景到底是否會重蹈此前AI行業(yè)的覆轍?
無論人們多憂慮,產(chǎn)業(yè)擁抱大模型幾乎是既定結(jié)局——問題是,以什么樣的姿態(tài)擁抱。
1.謹(jǐn)慎的投資人們
百川智能、銜遠(yuǎn)科技、聆心智能、西湖心辰、MiniMax……從2023年初至今,國內(nèi)大模型創(chuàng)業(yè)公司層出不窮,每一位創(chuàng)業(yè)者的背景都足夠光鮮,每一家企業(yè)的實(shí)力都備受資本方認(rèn)可。
那段時(shí)間,某某明星企業(yè)家離職創(chuàng)業(yè)入局大模型獲得巨額融資的消息屢見不鮮。
例如6月1日,有消息稱國內(nèi)大模型初創(chuàng)公司MiniMax即將完成一輪超過2.5億美元的融資,公司估值超過12億美元;
而剛剛被美團(tuán)收購的光年之外的融資消息在當(dāng)時(shí)更是撲朔迷離,王慧文曾一度否認(rèn)公司獲得了包括源碼、騰訊、五源以及宿華的2.3億美元融資,但這筆融資最終也因?yàn)槊缊F(tuán)發(fā)布的收購公告而坐實(shí)。
這種投資人追捧創(chuàng)業(yè)者的浪潮,讓人們一度以為大模型將要激活國內(nèi)整個(gè)AI創(chuàng)投圈,但事實(shí)卻并非如此。實(shí)際上,除了自帶光環(huán)的明星團(tuán)隊(duì),投資人對大模型創(chuàng)業(yè)更多是觀望和審視,真正拿出真金白銀的人是少數(shù)。
早在今年初ChatGPT浪潮席卷全球時(shí),「甲子光年」便*時(shí)間和部分投資人們交流看法。那段時(shí)間,幾乎所有人都在快速學(xué)習(xí),邀請專家對公司內(nèi)部進(jìn)行科普。
當(dāng)時(shí),AI領(lǐng)域熱烈討論著一個(gè)問題:ChatGPT是不是人工智能界的iPhone時(shí)刻?對此,險(xiǎn)峰給出的答案是不急于下定論。“我們暫時(shí)還不能確定這個(gè)影響到底有多大,但我們認(rèn)為它(大模型)肯定會改變一些東西。”險(xiǎn)峰副總裁李抗說。
但也有投資機(jī)構(gòu)對大模型表現(xiàn)了擔(dān)憂。某一級市場投資人對「甲子光年」表示,很擔(dān)心中國的反應(yīng)過熱。ChatGPT爆發(fā)后,國內(nèi)的AI概念股被引爆。“我們的一二級市場都必須考慮注入的相關(guān)投資能否產(chǎn)生相應(yīng)的回報(bào)。如果都是為了短期利益,這種投資到最后很容易打水漂,因?yàn)槟銢]有真正去促進(jìn)技術(shù)的發(fā)展,而是一個(gè)概念性投資。”
在他看來,投資人的關(guān)注點(diǎn)要聚焦,去探索更多對人類未來有影響力的基礎(chǔ)科學(xué),這才是真正深藏潛在市場價(jià)值的科技力量。“既要和市場動態(tài)結(jié)合,也要和市場價(jià)值以及真正的、未來的社會進(jìn)步結(jié)合,不能盲從,我們要清醒認(rèn)識到哪些東西能改變未來,不能去蹭熱點(diǎn),一窩蜂做這件事兒,我們不應(yīng)該成為一個(gè)浪潮中的泡沫。”
不過,一位FA從業(yè)者向「甲子光年」表示:“最近慢慢開始有投資人出手大模型項(xiàng)目了,但手筆都不大。”
“本質(zhì)問題還是認(rèn)知不夠。”對于投資人們的謹(jǐn)慎態(tài)度,華映資本管理合伙人章高男給出了自己的理解。他進(jìn)一步表示:“幾乎沒有人能清晰地定義大模型,我們要先把大模型的邊界定義清楚再來討論,你說的大模型與我說的大模型,很有可能都不是一件事情。”
在一些人看來,投資人的謹(jǐn)慎對大模型創(chuàng)業(yè)而言或許是一種負(fù)面信號,是在給大模型潑冷水。但客觀來看,謹(jǐn)慎不代表拒絕,經(jīng)過深刻思考后的理性擁抱更為珍貴。
無論投資者還是創(chuàng)業(yè)者,又或是希望借助大模型將自身業(yè)務(wù)轉(zhuǎn)型升級的傳統(tǒng)企業(yè),在真正投身大模型市場前都需要厘清兩個(gè)問題——大模型的能力邊界是什么,以及自身是否有必要引入大模型?
2.擁抱大模型前,厘清兩個(gè)問題
當(dāng)一項(xiàng)新技術(shù)出現(xiàn)時(shí),商業(yè)世界最核心的問題就是:這項(xiàng)技術(shù)能用在哪,怎么用?
這對大模型來說尤其重要,也是當(dāng)前還未真正入局大模型的企業(yè)都應(yīng)謹(jǐn)慎考慮的問題。
要回答這個(gè)問題,首先需要劃定大模型的能力邊界。
大模型的特殊之處在于,其內(nèi)部的模型算法是一個(gè)巨大的黑箱,大模型的生成過程不可解釋且不可預(yù)測,因此很難界定其能力邊界。但可以確定的是,通用大模型不是*的。
智源研究院副院長、總工程師林詠華曾在一次分享中提到,從產(chǎn)業(yè)落地角度來看,“大模型+提示學(xué)習(xí)”無法代替一切。
她進(jìn)一步提到,對于許多特定任務(wù)或新任務(wù),提示學(xué)習(xí)或許能通過多輪提示prompt,讓大模型輸出需要的結(jié)果,但大模型“記不住”這個(gè)過程,而如果開發(fā)者把整個(gè)提示prompt都加到每一次的調(diào)用中,一方面有可能使得prompt越加越長而超過了大模型的上下文能力,另一方面勢必導(dǎo)致每次的推理開銷增大、效果也會難以控制。在投入了真金白銀的產(chǎn)品落地環(huán)節(jié),這種不穩(wěn)定性更為致命。
國家語音創(chuàng)新中心首席專家張熠天也在2023年華映資本的年會上表示:“大模型是一個(gè)生成邏輯,他給出的只是一個(gè)*的詞匯梯次聚類,答案和問題之間并無因果。我們得到的東西只是一個(gè)'result',需要鑒別,而不是'answer'。所以大模型是否能夠直接在教育、醫(yī)療、司法等嚴(yán)肅領(lǐng)域應(yīng)用,可能都是一個(gè)問題。但是它在輔助決策上,是有意義的。在直接生成結(jié)果上,如果要商業(yè)化、產(chǎn)品化,我們認(rèn)為還是有很長的路要走的。”
因此,一個(gè)在業(yè)內(nèi)基本形成的共識是,未來每個(gè)行業(yè)都會有一個(gè)自己的垂直大模型,重點(diǎn)在于如何將通用大模型的能力與企業(yè)自身的行業(yè)數(shù)據(jù)很好地融合起來。
但在真正考慮大模型工程落地前,創(chuàng)業(yè)者們還需要考慮一個(gè)更加重要卻很容易被忽視的問題——大模型是否是企業(yè)的“剛需”?
對此,國內(nèi)一家多模態(tài)大模型團(tuán)隊(duì)曾對「甲子光年」表示,大模型是否是企業(yè)的“剛需”需要多角度來理解。對于一些企業(yè)而言,沒有引入大模型,就相當(dāng)于在市場競爭中失去了一把利刃,他們不得不上大模型來獲取客戶青睞——這也是一種“剛需”。
但某種程度上,這更多是新興技術(shù)在發(fā)展初期的一種市場情緒。長遠(yuǎn)來看,新興技術(shù)的產(chǎn)業(yè)化發(fā)展,本質(zhì)還是要靠業(yè)務(wù)需求驅(qū)動。這時(shí),企業(yè)究竟是否需要大模型就需要考慮多重因素。
除了具體的工程落地問題外,企業(yè)還需要考慮數(shù)據(jù)安全問題,以及大模型對原有市場格局的影響。
這兩大問題在信息化、數(shù)字化時(shí)代已經(jīng)頻頻出現(xiàn)且無法根除,智能化時(shí)代,這些問題則可能以一種更隱晦的方式出現(xiàn)。
“很多消費(fèi)型、或者是平臺型的企業(yè),如果毫無保留地去擁抱大模型,那大模型對行業(yè)的反噬能力是很強(qiáng)的,因?yàn)檫@意味著從產(chǎn)業(yè)端很輕易地就交出了行業(yè)的進(jìn)入門檻和認(rèn)知鑰匙。”張熠天表示。
在數(shù)字化轉(zhuǎn)型的大背景下,大多數(shù)行業(yè)都通過大數(shù)據(jù)、云計(jì)算等技術(shù)實(shí)現(xiàn)了數(shù)字化轉(zhuǎn)型升級。但與此同時(shí),傳統(tǒng)企業(yè)也向數(shù)字化技術(shù)廠商交出了大量的行業(yè)數(shù)據(jù),數(shù)字化技術(shù)的提供商成為產(chǎn)業(yè)中一個(gè)不可忽視的主體,原有的市場格局被改變。
但工業(yè)、建筑等行業(yè)由于數(shù)據(jù)量小,且各業(yè)務(wù)線之間的數(shù)據(jù)難以打通,傳統(tǒng)企業(yè)至今仍保持著較高的競爭壁壘。
張熠天表示:“目前,建筑業(yè)是在數(shù)字化背景下被保護(hù)得*的行業(yè),F(xiàn)在建筑業(yè)的信息化,除了一個(gè)廣聯(lián)達(dá)可以做預(yù)算以外,沒有一家巨頭能夠切入。為什么?因?yàn)榻ㄖ性O(shè)計(jì)圖、施工圖、維修圖、規(guī)劃圖、備案圖等八張圖,所有的圖之間相互都是打不通的,政府部門都不是互認(rèn)的,打通整個(gè)建筑的這八張圖的成本足夠高,所以建筑業(yè)才保持了這種競爭主體的多元化。我們通常認(rèn)為競爭主體的多元化是產(chǎn)業(yè)發(fā)展活力和動力之源。”
因此,在大模型浪潮下,對于行業(yè)標(biāo)準(zhǔn)、競爭優(yōu)勢尚不完善的企業(yè),是否要無條件擁抱大模型,是每一家都需要慎重考慮的問題。
3.大模型的工程化落地沒有標(biāo)準(zhǔn)答案
對于已經(jīng)將真金白銀投入大模型市場的入局者而言,接下來要做的是解決實(shí)際的工程落地問題。
對此,業(yè)內(nèi)已經(jīng)逐漸形成一個(gè)共識——未來,在產(chǎn)業(yè)落地環(huán)節(jié),大模型和小模型將會相輔相成。
林詠華曾表示,對精度要求高、對泛化能力要求低的窄域場景更合適“小模型+遷移學(xué)習(xí)”的范式。比如工業(yè)檢測、工業(yè)質(zhì)檢、醫(yī)療影像分析等等。
此外,華院計(jì)算創(chuàng)始人宣曉華也曾表示,未來AI企業(yè)的商業(yè)模式,是將大數(shù)據(jù)驅(qū)動的通用大模型和以知識驅(qū)動的面向垂直行業(yè)的小數(shù)據(jù)模型相融合,實(shí)現(xiàn)雙輪驅(qū)動。
章高男也對「甲子光年」表示:“企業(yè)在做自己的模型優(yōu)化或訓(xùn)練垂類模型時(shí),可以和大模型有所結(jié)合。不需要大模型那么高維的數(shù)據(jù),也不需要完全套用大模型的訓(xùn)練方法,但可以將大模型技術(shù)和其他技術(shù)耦合,形成低算力要求的行業(yè)垂直模型,這是有啟示作用的,絕不是簡單套用大模型。”
例如,對于大模型屢遭詬病的“幻覺”問題,短期內(nèi)可能還需結(jié)合上一代AI技術(shù)來解決。
“產(chǎn)生幻覺的原因很多,可能是因?yàn)閿?shù)據(jù)在某個(gè)領(lǐng)域相對稀疏和不足。在這種情況下,我們需要為模型提供更多數(shù)據(jù)來進(jìn)行訓(xùn)練。此外,在用戶提問時(shí),清楚地向模型提供更多背景信息也是減少幻覺的一種方法,或者降低‘溫度’。有時(shí)候幻覺的產(chǎn)生是因?yàn)閱栴}提得不夠完整,缺乏背景和前提。因此,問題的提出也非常重要,prompt engineering是關(guān)鍵。另外,如果用戶真的想要百分之百解決準(zhǔn)確的問題,可能還是需要用到知識圖譜。知識圖譜能夠保證邏輯推理的準(zhǔn)確性,以及包括Meta AI的負(fù)責(zé)人Yann Lecun提出的‘世界模型’等更新的技術(shù)。”金柚網(wǎng)CTO鄔學(xué)寧表示。
除和上一代AI技術(shù)相結(jié)合之外,將大模型的訓(xùn)練過程與高質(zhì)量的行業(yè)數(shù)據(jù)結(jié)合也是很重要的部分。
例如,作為一家為AI PaaS平臺服務(wù)的混布型數(shù)據(jù)庫,天云數(shù)據(jù)已經(jīng)走過了十余年,如今已經(jīng)走到了和大模型結(jié)合的階段。
天云數(shù)據(jù)副總裁李從武表示,將從兩個(gè)方面考慮自身與大模型的結(jié)合——首先是如何將私域數(shù)據(jù)與大型模型結(jié)合使用。例如天云數(shù)據(jù)為證監(jiān)會完成了一個(gè)類似政策解讀的項(xiàng)目,通過結(jié)合法規(guī)、判例和解釋等各種數(shù)據(jù),天云數(shù)據(jù)生成了對違規(guī)行為的解讀,類似于法院判罰的過程,可以通過綜合各種數(shù)據(jù)來解讀違規(guī)行為的原因。
其次,天云數(shù)據(jù)一直在研發(fā)混布式數(shù)據(jù)庫,是國內(nèi)最早的幾家之一。早在2018年左右,天云數(shù)據(jù)就提出了AI native數(shù)據(jù)庫的概念,其實(shí)就類似今天支持大型模型的向量數(shù)據(jù)庫,天云數(shù)據(jù)已經(jīng)發(fā)布了自研向量數(shù)據(jù)庫,并應(yīng)用于自己的模型。
總的來看,大模型的工程化落地問題沒有標(biāo)準(zhǔn)答案。
在人工智能這條路上,中國一定會走出一條不同于別國的道路。兩條路很難有優(yōu)劣之分,更多是基于不同國情下的現(xiàn)實(shí)選擇。
險(xiǎn)峰副總裁李抗曾在訪談中向「甲子光年」做了一個(gè)類比,如今看來依然適用:“借OpenAI的成功去說國內(nèi)創(chuàng)業(yè)者的諸多問題是不公平的,就像兩個(gè)人打牌,牌風(fēng)不同,對方突然玩了一把大的,胡出了同花順,你就說人家打牌好,我太謹(jǐn)慎了,但我贏的時(shí)候你怎么不說?”
張熠天分享道,從中央的判斷來看,大模型,包括人工智能的問題,是贏得全球競爭主動權(quán)的重要戰(zhàn)略抓手,是推動我國科技跨越發(fā)展,產(chǎn)業(yè)化優(yōu)化升級,生產(chǎn)力總體躍升的重要戰(zhàn)略資源。
“二十大報(bào)告談產(chǎn)業(yè)問題的時(shí)候,將人工智能從新一代信息技術(shù)中單獨(dú)提出。所以從政策上來看,發(fā)展人工智能、大模型,不僅僅是技術(shù)問題與產(chǎn)業(yè)問題,還是一個(gè)國家經(jīng)濟(jì)核心競爭力的問題,從更深遠(yuǎn)上看,更是一個(gè)政治問題,大家要從更高的角度來認(rèn)識這個(gè)問題。”
如果將視野跳出中國,將技術(shù)發(fā)展的時(shí)間線拉長,ChatGPT引發(fā)的軒然大波或許只是人工智能技術(shù)發(fā)展歷史上的一個(gè)點(diǎn),現(xiàn)在一切判斷都可能為之過早。
畢竟,即使是長期浸淫人工智能研究一線的技術(shù)人員,現(xiàn)在并未對人工智能的未來形成共識,并深陷于一種不安情緒中。
在近期爆火的《為什么偉大不能被計(jì)劃》一書中,肯尼斯·斯坦利、喬爾·雷曼兩位作者寫道:“我們不得不面對這樣一個(gè)令人不安的事實(shí),即我們無法確定任何經(jīng)驗(yàn)法則能否成為追求實(shí)現(xiàn)人工智能目標(biāo)的可靠指南。”
在前不久落幕的2023北京智源大會上,智源研究院院長黃鐵軍也有著極度相似的不安。他直接用“無法閉幕”4個(gè)字作為閉幕式的演講標(biāo)題。他說:“我們處在一個(gè)不能確定的狀態(tài),這樣的Near AGI它比我們強(qiáng)嗎?它超過我們的智能了嗎?還是它在什么時(shí)候能超過我們呢?我不知道,我們處在一個(gè)完全無法把控的狀態(tài)里。”
在閉幕致辭的最后,他用這樣一句話收尾:“如果我們能夠用投資大模型一樣的熱情去應(yīng)對風(fēng)險(xiǎn),至少有一定可能把握未來。但是,你相信人類能做到嗎?我不知道。”
放眼所有技術(shù)與產(chǎn)業(yè),這種來自一線核心技術(shù)人員的“失控感”在其他領(lǐng)域并不常見,F(xiàn)在,幾乎所有人都在摸著石頭過河。如今入場的每一家企業(yè),都有可能成為技術(shù)處女地的拓荒者。
而時(shí)間,是證明一切的*憑證。
榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報(bào)生成中...