隨著以ChatGPT為首的應(yīng)用工具一夜爆火,人工智能似乎找到了應(yīng)用層面的合適出口,讓大眾、用戶和產(chǎn)業(yè),看到了大模型人工智能所具備的應(yīng)用潛力。
大模型能為企業(yè)和開(kāi)發(fā)者帶來(lái)什么?
企業(yè)如何借力和追趕大模型創(chuàng)造出實(shí)際價(jià)值?ChatGPT 所卷起的 AI 大模型熱潮將如何影響開(kāi)發(fā)者和企業(yè)?
ChatGPT 背后的倫理挑戰(zhàn)和風(fēng)險(xiǎn)問(wèn)題又該如何應(yīng)對(duì)?
……
在InfoQ《極客有約》直播間,明略科技集團(tuán)CTO郝杰針對(duì)以上問(wèn)題表達(dá)了自己的觀點(diǎn)和洞察。
社會(huì)和企業(yè)如何受益于通用大模型?
以ChatGPT為代表的大模型,是一種不太顯式的,區(qū)別于知識(shí)庫(kù)和知識(shí)圖譜一樣的新型知識(shí)表示方式,它是一個(gè)巨大的隱式知識(shí)庫(kù),包含了地球上的各種知識(shí),類似一個(gè)包羅萬(wàn)象的百科全書(shū),用戶可以使用這個(gè)模型,通過(guò)平臺(tái)并與它交互,以聊天、對(duì)話或多輪問(wèn)答形式展開(kāi)。
在面對(duì)大型模型和通用人工智能的沖擊時(shí),行業(yè)之間的差異應(yīng)該是相對(duì)平等的。在科學(xué)領(lǐng)域中,大型模型原生應(yīng)用的場(chǎng)景也包括各種科學(xué)領(lǐng)域,例如超導(dǎo)材料、生命科學(xué)、醫(yī)學(xué)和生物醫(yī)療等領(lǐng)域,這些領(lǐng)域很可能是大型模型大顯身手的場(chǎng)景。很多公司都在做著很了不起的事情,要將地球上所有的知識(shí)都裝入一個(gè)模型中,要將其效果惠及全人類。未來(lái),它的發(fā)展方向應(yīng)該是惠及所有行業(yè),讓設(shè)計(jì)師、廚師和化妝師等從業(yè)人員更強(qiáng)大,更輕松地修煉到大師級(jí)別。
而針對(duì)打造國(guó)內(nèi)的中文大模型,有以下幾種路徑。第一種是依靠大型企業(yè)或國(guó)內(nèi)頂尖大學(xué),他們擁有強(qiáng)大的算力和資源,可以在他們的肩膀上訓(xùn)練行業(yè)大模型。第二種是垂直領(lǐng)域的AI獨(dú)角獸企業(yè),例如明略科技,從垂直領(lǐng)域入手去打造專屬的行業(yè)大模型。第三條路徑是通過(guò)突破工程難題,利用摩爾定律來(lái)降低大型模型的訓(xùn)練成本。雖然這是一個(gè)挑戰(zhàn),但是已經(jīng)有一些公司正在致力于解決這個(gè)問(wèn)題,相信隨著時(shí)間的推移,訓(xùn)練成本會(huì)逐漸降低。
ChatGPT真正的最大價(jià)值是什么?
ChatGPT在四個(gè)方面具有強(qiáng)大的通用性:產(chǎn)品方面,它是個(gè)chatbot、是個(gè)聊天方式的人機(jī)交互,幾乎所有人類都可與其交互,用戶使用它沒(méi)有任何門(mén)檻,是一款很通用的ToC產(chǎn)品;模型方面,它是個(gè)通用的大模型,包含了地球上所有的知識(shí),幾乎無(wú)所不知,所以具備知識(shí)領(lǐng)域的通用性;任務(wù)方面,它具有很強(qiáng)的泛化性,具備跨任務(wù)的通用性;還有與人類對(duì)齊方面的通用性,通過(guò)RLHF算法可以對(duì)齊到人類的各種價(jià)值觀、倫理、偏好等,而不是僅僅對(duì)齊到少數(shù)算法工程師設(shè)定的準(zhǔn)則。這四大通用性,以往的AI是不具備的,這是ChatGPT的價(jià)值所在,它是開(kāi)創(chuàng)性的,所以一出世就吸引了這么多的關(guān)注,因?yàn)樗椒矫婷娴耐ㄓ眯蕴珡?qiáng)大了。
大模型的效果要如何評(píng)判?
在選擇和評(píng)估方面,我提一個(gè)“四大一小”的評(píng)估標(biāo)準(zhǔn)。“四大”指的就是上面說(shuō)的四個(gè)方面的通用性,它的通用性是否足夠大。“一小”是指運(yùn)用辯證法,追求參數(shù)少的模型。如果在“四大”的維度上,大模型的表現(xiàn)都差不多、展現(xiàn)出相似的召準(zhǔn)率、精準(zhǔn)度等等,反而可以選擇參數(shù)較小的模型,因?yàn)檫@意味著部署成本更低,維護(hù)和迭代也更容易。在學(xué)術(shù)界中,將其稱之為“參數(shù)效率”。參數(shù)效率是評(píng)價(jià)大型語(yǔ)言模型的一個(gè)重要原則。清華大學(xué)孫茂松老師團(tuán)隊(duì)剛發(fā)表的重要論文的標(biāo)題里就有這個(gè)參數(shù)效率、Parameter efficient。參數(shù)效率,類似汽車發(fā)動(dòng)機(jī)的單位升功率,不是排量越大越好,那意味著太費(fèi)油,或者費(fèi)電費(fèi)卡費(fèi)數(shù)據(jù)。
企業(yè)追趕大模型浪潮,如何打出差異化?
在大模型涌現(xiàn)后,企業(yè)希望使用這類工具來(lái)提升自身效率和服務(wù)質(zhì)量,但同時(shí)也表達(dá)了一些擔(dān)憂。例如,輸出質(zhì)量是否穩(wěn)定,在自身垂直領(lǐng)域中引入這樣的技術(shù)后,可能會(huì)導(dǎo)致出現(xiàn)偏激或誤導(dǎo)性質(zhì)的內(nèi)容,面對(duì)這樣的情況要如何處理?此外,因?yàn)槟壳坝行┐竽P蜕胁荒芩接谢渴,企業(yè)自己的知識(shí)上傳到大模型平臺(tái)上,是否會(huì)降低他們?cè)械拈T(mén)檻?
這正是在AI應(yīng)用技術(shù)落地的沖擊下,明略科技能夠幫助客戶提升競(jìng)爭(zhēng)力的地方。明略科技作為客戶和大模型之間的橋梁,既要確保這條道路安全可靠,又要符合客戶的實(shí)際需求。借鑒通用大模型訓(xùn)練的優(yōu)秀算法,以17年來(lái)沉淀的大量行業(yè)數(shù)據(jù)為基礎(chǔ),從客戶實(shí)際需求出發(fā),定制垂直領(lǐng)域大模型,滿足多樣化的任務(wù)和場(chǎng)景需求。
通用大模型的出現(xiàn),固然讓企業(yè)無(wú)差別地享受到了便利,但是便利之下的真實(shí)需求是如何用好大模型,真正能夠“殺出重圍”的則是企業(yè)和行業(yè)自身的數(shù)據(jù),每個(gè)企業(yè)都有自己特色的知識(shí)沉淀,可能是一個(gè)數(shù)據(jù)庫(kù)、一個(gè)標(biāo)簽庫(kù)或一個(gè)知識(shí)圖譜,而在行業(yè)端,明略科技憑借17年來(lái)的行業(yè)探索累積了大量的知識(shí)圖譜豐富經(jīng)驗(yàn),特別是在消費(fèi)類行業(yè),如美妝、3C、汽車、大健康等領(lǐng)域,知識(shí)圖譜的知識(shí)表達(dá)形式更加高級(jí),具有實(shí)體和連接,并且可以進(jìn)行邏輯推理。圖譜中的實(shí)體和關(guān)系決定了基于圖譜生成的文章或圖片的真實(shí)性、專業(yè)性和邏輯性。明略科技可以幫助客戶將私有知識(shí)與大模型進(jìn)行互搏,類似微軟的普羅米修斯架構(gòu),從而使客戶的數(shù)據(jù)飛輪更好地運(yùn)轉(zhuǎn)。對(duì)于營(yíng)銷類短文的生成,明略科技離不開(kāi)知識(shí)圖譜,它能夠保證文章的真實(shí)性、可解釋性、專業(yè)性。在生成之后也會(huì)使用大模型進(jìn)行潤(rùn)色,以滿足客戶的多重需求,包括風(fēng)格修改和客戶特殊要求等。這種方法不僅兼顧了多個(gè)維度的需求,讓客戶放心使用。
與其說(shuō)ChatGPT正帶動(dòng)新一輪人工智能的爆發(fā),更應(yīng)該說(shuō)是自然語(yǔ)言大模型方面帶來(lái)了量變到質(zhì)變的轉(zhuǎn)化。明略科技作為深耕數(shù)據(jù)智能17年的企業(yè),充分挖掘數(shù)據(jù)價(jià)值,為不同的領(lǐng)域制作行業(yè)大模型,并不斷更新和維護(hù)領(lǐng)域知識(shí)庫(kù)從而提供更精準(zhǔn)、智能的技術(shù)和服務(wù),能以明顯更高的精度完成自然語(yǔ)言處理的任務(wù)。
大模型應(yīng)用落地之路要怎么走?
在當(dāng)前生態(tài)環(huán)境下,完全依靠神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)解決所有問(wèn)題是很困難的。例如,由于敏感信息是動(dòng)態(tài)變化的,每天都會(huì)有新的敏感詞出現(xiàn),因此可以將這個(gè)模塊集成到搜索引擎或者客戶的數(shù)據(jù)平臺(tái)中,采用規(guī)則和詞表進(jìn)行處理,而不必依賴于完全連接主義的大型模型。問(wèn)題可能是多邊形的,需要因地制宜地選擇解決方案。
關(guān)于大語(yǔ)言模型和垂直領(lǐng)域模型的結(jié)合,有多種方法進(jìn)行耦合或配合。其中一種方法是利用兩個(gè)核心算法(指令微調(diào)和RLHF)進(jìn)行有監(jiān)督的微調(diào),但可能需要更多數(shù)據(jù)。另一種方法是將客戶的知識(shí)庫(kù)嵌入到大模型中,因?yàn)榇竽P涂梢蕴幚砀鞣N不同類型的知識(shí),只要它們被嵌入到相同的連續(xù)向量空間中。我們還可以嵌入多模態(tài)、跨領(lǐng)域和跨語(yǔ)言的知識(shí),只要它們被約定嵌入到相同的語(yǔ)義空間中即可。
國(guó)內(nèi)的許多行業(yè)都要求把大型模型、營(yíng)銷、銷售和服務(wù)系統(tǒng)等都進(jìn)行私有化部署,這是由于它們行業(yè)自身的特性所決定的。但大模型資源消耗量大,會(huì)導(dǎo)致這種項(xiàng)目利潤(rùn)率非常低,因此對(duì)于這類客戶,明略科技提供的策略是一個(gè)靈活的、自適應(yīng)的模型訓(xùn)練服務(wù),以幫助他們充分利用自身積累的數(shù)據(jù),訓(xùn)練適合他們的模型。
除了將大型模型應(yīng)用于傳統(tǒng)的業(yè)務(wù)產(chǎn)品之外,也會(huì)出現(xiàn)一些基于大型模型的 native 應(yīng)用產(chǎn)品和服務(wù)。目前,我們已經(jīng)看到了像AIGC以Midjourney為代表的一類圖像生成應(yīng)用產(chǎn)品的興起,未來(lái)還將出現(xiàn)一些視覺(jué)視頻生成的應(yīng)用產(chǎn)品。ChatGPT的出現(xiàn)也帶動(dòng)了許多文本生成公司的涌現(xiàn),這些公司可能以前根本不存在,而現(xiàn)在它們的業(yè)務(wù)完全圍繞著大型模型展開(kāi)。這些公司的共同特點(diǎn)是它們能夠生成內(nèi)容,這可能包括生成、創(chuàng)意甚至心理咨詢等方面的內(nèi)容。
以ChatGPT為首的大模型工具讓人類對(duì)于通用人工智能重燃信心,但在不同領(lǐng)域的應(yīng)用落地之路仍需探索。明略科技將發(fā)揮自身優(yōu)勢(shì),讓客戶的行業(yè)知識(shí)和數(shù)據(jù)與大模型互相助力,真正利用好大模型,提升營(yíng)銷智能和營(yíng)運(yùn)智能Copilot產(chǎn)品的效果。
榜單收錄、高管收錄、融資收錄、活動(dòng)收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報(bào)生成中...