7月7日消息,在2023世界人工智能大會(WAIC)啟明創(chuàng)投論壇“生成式AI與大模型:變革與創(chuàng)新”上,啟明創(chuàng)投攜手未盡研究,共同發(fā)布報告《生成式AI》| State of Generative AI 2023。
2022年和2023年,是生成式人工智能技術取得突破的兩年,過去半年最重要的研究方向,是破解和理解大模型神秘而又令人興奮的智能“涌現(xiàn)”。大模型既需要超越對下一個詞的預測能力,也需要一個更豐富、更復雜的“慢思考”深層機制,來監(jiān)督“快思考”預測下一個詞的機制。長期來看,人才對人工智能未來的影響,超過了算力。
基于研究,報告對未來一至三年的大語言模型、多模態(tài)模型和商業(yè)競爭態(tài)勢,做出了十點前瞻:
大語言模型
1. 2024年中國將出現(xiàn)比肩GPT-4的多語言通用大模型;
2. 超長上下文(Long Context)將引領下一次LLM技術突破;
3. 在出現(xiàn)更有前景的大語言模型之前,為實現(xiàn)垂直領域更好的效果,以下三種方式將共存:
I)在不改變數(shù)據(jù)分布的情況下,利用更多通用數(shù)據(jù)進行通用大模型預訓練,不特別引入行業(yè)數(shù)據(jù),
ii)利用行業(yè)專屬數(shù)據(jù)微調(diào)(Fine-Tuning)通用大模型,
iii)利用行業(yè)數(shù)據(jù)占比更高的數(shù)據(jù)集進行垂直模型預訓練。
多模態(tài)模型
4. 當前CLIP + Diffusion的文生圖模型是過渡態(tài),未來2年內(nèi)將出現(xiàn)一體化的模型結構;
5. 下一代Text-to-Image模型將具備更強的可控性,它將結合底層模型能力和前端控制方式,對模型的設計將注重與控制方式的結合;
6. 2025年之前,Video和3D等模態(tài)將迎來里程碑式的模型,大幅提高生成效果;
7. 以PALM-E為代表的具身智能(Embodied AI)展現(xiàn)出在機器人的感知、理解和決策等方向上的巨大潛力,但當前訓練和可靠性存在較大挑戰(zhàn);
8. 短期內(nèi)Transformer正成為多個模態(tài)的主流網(wǎng)絡結構,但壓縮整個數(shù)字世界的通用方法尚未出現(xiàn),Transformer并不是人工智能技術的終點。
商業(yè)機會
9. 3年內(nèi),顛覆式的AI應用的核心驅(qū)動力來自于底層模型的創(chuàng)新,兩者無法解耦,模型的作用將大于產(chǎn)品設計的作用;
10. 當前生成式AI市場處于技術主導的早期階段,存在千億美元市值的平臺性企業(yè)的機會。
榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報生成中...