近兩三個(gè)月出現(xiàn)各種AI Agent項(xiàng)目,谷歌Deepmind推出了robotic agent,利用機(jī)械臂自動(dòng)執(zhí)行各種工作;亞馬遜推出了Amazon Bedrock Agents,可以自動(dòng)分解企業(yè)AI應(yīng)用開(kāi)發(fā)任務(wù);AI獨(dú)角獸Inflection也在開(kāi)發(fā)私人AI助理,可以幫助你完成訂酒店等私人任務(wù);哥倫比亞大學(xué)最近也公布了用于科研的AI Agent項(xiàng)目GPT Researcher。
有人說(shuō),至少有100個(gè)項(xiàng)目正致力于將AI代理商業(yè)化,近10萬(wàn)名開(kāi)發(fā)人員正在構(gòu)建自主Agent。這一輪的熱潮離不開(kāi)OpenAI,有兩位關(guān)鍵人物發(fā)揮了重要作用。
簡(jiǎn)單說(shuō),AI聊天機(jī)器人主要靠“說(shuō)”來(lái)回答你的問(wèn)題,而AI Agent則會(huì)“動(dòng)”起來(lái)完成具體的任務(wù),就像人類(lèi)助理一樣,在你忙不過(guò)來(lái)的時(shí)候替你完成一些工作,區(qū)別就是用AI來(lái)驅(qū)動(dòng)而不是人腦驅(qū)動(dòng)。
在國(guó)內(nèi),雖然AutoGPT早在4月份就與國(guó)外同步火了,但限于大部分人對(duì)其背后的AI Agent缺少了解,開(kāi)始的反響并不是太熱烈。直到7月初OpenAI應(yīng)用人工智能研究負(fù)責(zé)人Lilian Weng那篇關(guān)于AI Agent的博文刷爆AI圈后,媒體圈、學(xué)研界、投資領(lǐng)域才真正開(kāi)始熱烈討論AI Agent。
由此國(guó)內(nèi)真正開(kāi)啟了探索與研究AI Agent的熱潮,并且也有一些廠商開(kāi)始以AI Agent模式重構(gòu)產(chǎn)品架構(gòu)與商業(yè)模式。隨著AI Agent原理、模式以及構(gòu)建方式越發(fā)明朗,很多受困于技術(shù)、模式、生態(tài)乃至政策的創(chuàng)業(yè)者都是眼前一亮。
國(guó)內(nèi)已推出的AI Agent
(內(nèi)容引用自:王吉偉)
經(jīng)過(guò)持續(xù)探索與嘗試,國(guó)內(nèi)AI智能體相關(guān)的產(chǎn)品也開(kāi)始嶄露頭角,下面介紹五款產(chǎn)品。
1、阿里云ModelScopeGPT
阿里云Mota社區(qū)推出的國(guó)內(nèi)首個(gè)大型模型調(diào)用工具魔搭GPT(ModelScopeGPT),通過(guò)這一款工具,使用者們可以通過(guò)一鍵發(fā)送指令調(diào)用Mota社區(qū)中的其他人工智能模型,從而實(shí)現(xiàn)大大小小的模型共同協(xié)作,進(jìn)而完成復(fù)雜的任務(wù)。
ModelScopeGPT基于開(kāi)源大語(yǔ)言模型(LLM)的AI Agent(智能體)開(kāi)發(fā)框架ModelScope-Agent。這是一個(gè)通用的、可定制的Agent框架,用于實(shí)際應(yīng)用程序,其基于開(kāi)源的大語(yǔ)言模型 (LLMs) 作為核心,包含記憶控制、工具使用等模塊。
開(kāi)源 LLM 主要負(fù)責(zé)任務(wù)規(guī)劃、調(diào)度以及回復(fù)生成;記憶控制模塊,主要包含知識(shí)檢索以及 prompt (提示詞)管理;工具使用模塊,包含工具庫(kù)以及工具檢索和工具可定制化。
2、實(shí)在智能TARS-RPA-Agent
實(shí)在智能在超自動(dòng)化領(lǐng)域首發(fā)的TARS-RPA-Agent,是一個(gè)基于“TARS+ISSUT(智能屏幕語(yǔ)義理解)”雙模引擎、有“大腦”,更有“眼睛和手腳”的超自動(dòng)化智能體,是能夠自主拆解任務(wù)、感知當(dāng)前環(huán)境、執(zhí)行并且反饋、記憶歷史經(jīng)驗(yàn)的RPA全新模式產(chǎn)品。
TARS-RPA-Agent采用以TARS大模型和ISSUT智能屏幕語(yǔ)義理解為基座的技術(shù)框架。該技術(shù)框架分為兩層結(jié)構(gòu):底層是包括通用基礎(chǔ)模型和各個(gè)垂直行業(yè)基礎(chǔ)模型在內(nèi)的TARS系列大模型和智能屏幕語(yǔ)義理解技術(shù);上層是依托這兩項(xiàng)關(guān)鍵技術(shù)完成全面升級(jí)和改造的超自動(dòng)化產(chǎn)品。
TARS-RPA-Agent的核心LLM是實(shí)在智能基于通用大模型基座的自研垂直“塔斯(TARS)”大模型,TARS大模型具備優(yōu)異的文本生成、語(yǔ)言理解、知識(shí)問(wèn)答、邏輯推理等主流能力。
3、OmBot歐姆智能體
2023 世界人工智能大會(huì)上,聯(lián)匯科技發(fā)布了基于大模型能力的自主智能體(Auto AI Agent )——OmBot 歐姆智能體,并針對(duì)典型場(chǎng)景需求推出了首批應(yīng)用。
聯(lián)匯自主智能體包含了認(rèn)知、記憶、思考、行動(dòng)四大核心能力,作為一種自動(dòng)、自主的智能體,它以最簡(jiǎn)單的形式中在循環(huán)中運(yùn)行,每次迭代時(shí),它們都會(huì)生成自我導(dǎo)向的指令和操作。因此,它不依賴人類(lèi)來(lái)指導(dǎo)命令,具備高度可擴(kuò)展性。
4、瀾碼科技Ask XBot
瀾碼科技構(gòu)建的Agent平臺(tái)“Ask XBot”,平臺(tái)分兩層:第一層是專(zhuān)家賦能,專(zhuān)家通過(guò)拖、拉、拽以及對(duì)話交互的方式定義工作流程,教給機(jī)器,從而協(xié)助一線員工構(gòu)建更高效工作的方法論;第二層是員工使用Agent,一線員工可以通過(guò)自然語(yǔ)言和Agent溝通并下達(dá)指令,讓Agent協(xié)助完成數(shù)據(jù)分析、資料調(diào)取等工作。
該公司計(jì)劃將Ask XBo打造成一個(gè)兼具通用性和易用性的平臺(tái),把這些API和Agent做好管理,讓Agent包裝不同的API,不同模型的Agent能夠在上面更好地協(xié)作,讓它們可以在平臺(tái)上更有效率、更智能地服務(wù)好客戶。
5、ChatDev
由清華大學(xué)、北京郵電大學(xué)、布朗大學(xué)聯(lián)合研究團(tuán)隊(duì)推出的ChatDev,是一個(gè)生成式智能體。它基于聊天的端到端軟件開(kāi)發(fā)框架,能夠利用大型語(yǔ)言模型(LLMs)促進(jìn)軟件開(kāi)發(fā)過(guò)程中多角色(ChatGPT 的 “gpt3.5-turbo-16k” 版本)之間的有效溝通和協(xié)作。
ChatDev的主要目的是通過(guò)聊天來(lái)進(jìn)行游戲開(kāi)發(fā)。用戶只需提出想法,從設(shè)計(jì)到測(cè)試的整個(gè)流程都由AI完成,整個(gè)過(guò)程只需七分鐘即可完成。
AI Agent不僅讓大家看到了大語(yǔ)言模型(LLM,Large language Model)落地的方向,讓更多創(chuàng)業(yè)者進(jìn)一步燃起了LLM創(chuàng)業(yè)的希望,也讓廣大企業(yè)看到了高效應(yīng)用LLM的未來(lái)趨勢(shì)。
榜單收錄、高管收錄、融資收錄、活動(dòng)收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報(bào)生成中...