最新四色米奇影视777在线看_暴躁少女csgo视频一_中文字幕乱码中文乱码_有什么好看的小说推荐_亚洲一卡2卡三卡4卡高清_国产成人精品无码免费看_成人免费120分钟啪啪_两性午夜刺激爽爽视频_国产成人av在线免播放app

首頁 > 資訊 > 評論

AI Agent 的「GPT 時刻」,Manus 炸醒整個 AI 圈

2025/03/06 14:42      微信公眾號:極客公園 shiyun 張勇毅 編輯|靖宇


  2025 年是 AI Agent 元年——這句話,在北京時間 3 月 6 日凌晨,得到了應(yīng)驗。

  「DeepSeek 之后,又一個科技圈的不眠之夜。」

  不少用戶在社交媒體上如此點評。

  所有人徹夜蹲守,只為該產(chǎn)品的一個使用邀請碼——它就是 Monica.im 研發(fā)的全球* AI Agent 產(chǎn)品「Manus」。

  據(jù)團隊介紹,「Manus」是一個真正自主的 AI 代理,能夠解決各類復(fù)雜多變的任務(wù)。與傳統(tǒng) AI 助手不同,Manus 不僅能提供建議或答案,還能直接交付完整的任務(wù)成果。

  Manus 的介紹視頻只有短短的 4 分鐘,卻威力驚人|圖片來源:Monica.im

  正如「Manus」的名字寓意,它在拉丁文里象征著「手」。也就是說,知識不僅要在腦子里,還要能用手執(zhí)行。這正是 Agent 和 AI Bot(聊天機器人)產(chǎn)品的本質(zhì)進階。

  Manus 牛在哪里?最直觀的是看官方網(wǎng)站展示、以及用戶自發(fā)展示的使用用例,極客公園部分整理如下:

  旅行規(guī)劃:不僅整合旅行信息,還為用戶創(chuàng)建定制旅行手冊。例如,為用戶規(guī)劃日本四月旅行,提供個性化的旅行建議和詳細手冊。

  股票分析:進行深入的股票分析,設(shè)計視覺上吸引人的儀表盤展示全面的股票洞察。例如,對特斯拉股票進行深度分析,創(chuàng)建可視化儀表盤。

  教育內(nèi)容創(chuàng)建:為中學(xué)教師創(chuàng)建視頻演示材料,解釋動量定理等復(fù)雜概念,幫助教師更有效地教學(xué)。

  保險政策比較:創(chuàng)建清晰的保險政策比較表,提供*決策建議,幫助用戶選擇最適合的保險產(chǎn)品。

  供應(yīng)商采購:在整個網(wǎng)絡(luò)中進行深入研究,找到最適合用戶需求的供應(yīng)商,作為真正公平的代理為用戶服務(wù)。

  財務(wù)報告分析:通過研究和數(shù)據(jù)分析捕捉市場對特定公司(如亞馬遜)的情緒變化,提供過去四個季度的市場情緒分析。

  創(chuàng)業(yè)公司列表整理:訪問相關(guān)網(wǎng)站識別符合條件的公司,并將其整理成表格。例如,整理 YC W25 批次的所有 B2B 公司列表。

  在線商店運營分析:分析亞馬遜商店銷售數(shù)據(jù),提供可操作的洞察、詳細可視化和定制策略,幫助提升銷售業(yè)績。

  當(dāng) Agent 通過一長串思維鏈和工具調(diào)用,最終輸出一個無比完整、專業(yè)的結(jié)果時,用戶們開始感嘆「真的能幫人類做事了」。

  根據(jù)官方網(wǎng)站信息,在GAIA基準測試(評估通用AI助手解決真實世界問題的能力)中,Manus在所有三個難度級別上都取得了新的*進 (SOTA) 表現(xiàn)。

  總結(jié)成一句話——Manus 更想做的,是你在數(shù)字世界中,字面意義上的「代理人」。而它做到了。

  就像你想的一樣,凌晨推出的 Manus,一下子把所有 AI 圈的人都炸醒了!

  01

  Manus,你的「數(shù)字代理人」

  首先,Manus 在體驗上與此前 LLM *的不同:

  它強調(diào)直接交付最終結(jié)果的能力,而不只是給出一個單純的「答案」。

  Manus 目前采用 Multiple Agent 架構(gòu),運行方式與此前 Anthropic 發(fā)布的 Computer Use 類似,完全運行在獨立虛擬機中。同時可以在虛擬環(huán)境中調(diào)用各類工具——編寫和執(zhí)行代碼、瀏覽網(wǎng)頁、操作應(yīng)用等,直接交付完整成果。

  在官方發(fā)布的視頻中,介紹了三個 Manus 在實際使用場景中所完成的工作案例:

  *個任務(wù)是篩選簡歷。

  從 15 份簡歷中,為強化學(xué)習(xí)算法工程師職位推薦合適的候選人,并根據(jù)其強化學(xué)習(xí)專業(yè)知識對候選人進行排名。

  在這個演示中,你甚至不需要給壓縮文件解壓、將其中的簡歷文件一份份手動上傳。Manus 這時候就已經(jīng)展現(xiàn)出了像人類「實習(xí)生」的一面,手動解壓縮文件,并逐頁瀏覽每一份簡歷,同時記錄其中的重要信息。

  Manus 像實習(xí)生一樣,自動理解「解壓老板扔過來的打包文件」這個隱藏指令 | 圖片來源:極客公園

  在 Manus 給出的結(jié)果中,不僅有自動生成的排名建議,它還會根據(jù)工作經(jīng)驗等重要維度,將候選人分為不同等級。在接受到用戶更希望以 Excel 表格的方式呈現(xiàn)后,Manus 還能自動將這些內(nèi)容通過現(xiàn)場編寫 Python 腳本的方式,來生成對應(yīng)的表格。

  Manus 甚至還能通過記憶能力,在這個實踐過程中記錄下「用戶更喜歡通過表格的方式接受結(jié)果」這樣的信息,下一次處理類似的任務(wù)結(jié)果時,會優(yōu)先使用表格的形式來呈現(xiàn)。

  Manus 能記住用戶在內(nèi)容生成流程中的偏好 | 圖片來源:極客公園

  第二個案例,更為國人量身打造,就是遴選房產(chǎn)。

  案例中用戶希望在紐約購買房產(chǎn),輸入的要求是希望同時有安全的社區(qū)環(huán)境、低犯罪率,以及優(yōu)質(zhì)的中小學(xué)教育資源—— 當(dāng)然還包括最重要的預(yù)算,足夠在每月固定收入的情況下負擔(dān)的起。

  在這個需求中,Manus AI 將復(fù)雜任務(wù)分解為待辦事項列表,包括研究安全社區(qū)、識別優(yōu)質(zhì)學(xué)校、計算預(yù)算、搜索房產(chǎn)等。并通過網(wǎng)絡(luò)搜索,仔細閱讀有關(guān)紐約最安全社區(qū)的文章,收集相關(guān)信息。

  其次,Manus 通過編寫一個 Python 程序,根據(jù)用戶收入計算可負擔(dān)的房產(chǎn)預(yù)算。結(jié)合房地產(chǎn)網(wǎng)站上相關(guān)的房價信息,根據(jù)預(yù)算范圍篩選房產(chǎn)列表。

  Manus 能夠自動搜索、并過濾掉條件不符合用戶要求的房源 | 圖片來源:極客公園

  最后,Manus 會整合所有收集的信息,撰寫詳細報告,包括社區(qū)安全分析、學(xué)校質(zhì)量評估、預(yù)算分析、推薦房產(chǎn)列表以及相關(guān)資源鏈接——就像一個專業(yè)的房地產(chǎn)經(jīng)紀人一樣。而且由于 Manus 自帶「完全基于用戶利益考慮」的屬性,其使用甚至體驗更好。

  在最后一個案例中,Manus 展示了對股票價格的分析能力。

  案例給出的任務(wù)是分析過去三年中英偉達、邁威爾科技和臺積電股票價格之間的相關(guān)性:眾所周知這三支股票之間存在緊密的關(guān)聯(lián)性,但對于新手用戶來講,很難快速將其中的因果關(guān)系整理清楚。

  而 Manus 的操作,與一個真正的股票經(jīng)紀人非常相似,它先是通過 API 訪問雅虎金融等信息網(wǎng)站,來獲取股票歷史數(shù)據(jù),同時還會交叉驗證數(shù)據(jù)準確程度,避免被單一信息來源誤導(dǎo),對最終產(chǎn)生結(jié)果帶來重大影響。

  在這個案例中,Manus 同樣用到了編寫 Python 代碼、進行數(shù)據(jù)分析和可視化的能力,同時還引入了金融相關(guān)的專業(yè)工具進行分析,最終通過數(shù)據(jù)可視化圖表,搭配詳盡的綜合分析報告的方式,向用戶反饋其中的因果關(guān)系——真的就像一個金融領(lǐng)域「實習(xí)生」做的日常工作。

  不僅如此,在 Manus 官網(wǎng)還展示了十多個 Manus 能夠使用的場景:直接使用 Manus 幫你整理行程、個性化推薦旅游路線,還能讓它學(xué)習(xí)使用各種復(fù)雜工具,來流程化的完成日常工作。

  在這個過程中,真正讓 Manus 展現(xiàn)出與往常工具不同的,是它的自主規(guī)劃,來確保執(zhí)行任務(wù)的能力。

  自主學(xué)習(xí)的能力也讓 Manus 的工作能力提升邏輯更像是真正的人類——即使現(xiàn)階段,它可能還無法在某一個特定領(lǐng)域做到專家級別的精通,但已經(jīng)能看到巨大的潛力。

  隨著自主學(xué)習(xí)能力的加入,AI Agent 的泛用性得到了巨大的提升,在用戶對 Manus 的實際測試中,你甚至可以做到直接對它描述一個視頻畫面中的相關(guān)內(nèi)容,Manus 最終能夠直接根據(jù)對應(yīng)的信息,跨越平臺內(nèi)容對于搜索引擎的限制,精準找到某個抖音短視頻的鏈接。

  由于目前版本的 Manus 完全基于云端異步運行,因此實際上 Manus 的能力并不被你所使用的端側(cè)平臺形態(tài)或算力等因素限制——用戶甚至可以做到在向 Manus 下達指令之后,暫時關(guān)閉電腦,當(dāng) Manus 執(zhí)行完成活動結(jié)果后,會自動通知你結(jié)果。

  這個操作邏輯同樣非常眼熟——就像一個人下班以后,在微信上喊實習(xí)生「文件整理好發(fā)我」。只不過,現(xiàn)在,這個實習(xí)生是真的可以 7x24 小時的響應(yīng)你了,并且不用擔(dān)心他會「整頓職場」。

  02

  多代理+自查,跑通 AI Agent 流

  從上面這些案例,其實不難看出 Manus 真正的殺手锏,并非 Computer Use 中已經(jīng)出現(xiàn)過的「AI Agent」概念,而是它「模擬人類方式工作方式」的能力。

  比起「運行計算」,Manus 的工作邏輯更像是「思考并執(zhí)行命令」。它并沒有做到哪些人類當(dāng)前真正無法做到的事;這也就是為什么一些已經(jīng)體驗過當(dāng)前版本 Manus 的用戶,將它形容為「一個實習(xí)生」。

  在 Manus 官網(wǎng),展示著眾多 Manus 能夠完成的任務(wù),其中就有一個案例,展示了在 B2B 業(yè)務(wù)中,如何使用 Manus?焖倬珳实膶⒛愕挠嗀浶枨,與全球供應(yīng)商實現(xiàn)精準匹配。

  在類似需求的常規(guī)產(chǎn)品中,在平臺內(nèi)整合全球供應(yīng)鏈企業(yè)信息,來幫助用戶完成供貨商/需求方匹配這件事,是業(yè)內(nèi)通行的邏輯。但這件事在 Manus 的案例中,你能看到完全不同的實現(xiàn)方式。

  Manus AI 使用一套名為「Multiple Agent」的架構(gòu),運行在獨立的虛擬機中。通過規(guī)劃代理、執(zhí)行代理、驗證代理的分工協(xié)作機制,。來大幅提升對復(fù)雜任務(wù)的處理效率,并通過并行計算縮短響應(yīng)時間。

  在這個架構(gòu)中,每個代理可能基于獨立的語言模型或強化學(xué)習(xí)模型,彼此通過 API 或消息隊列通信。同時每個任務(wù)也都在沙盒中運行,避免干擾其他任務(wù),同時支持云端擴展。每個獨立模型都能模仿人類處理任務(wù)的流程,比如先思考和規(guī)劃,理解復(fù)雜指令并拆解為可執(zhí)行的步驟,再調(diào)用合適的工具。

  換言之,通過 Manus 的這套多代理架構(gòu),它更像是由多個助理,通過協(xié)助的方式,分別完成檢索資源、對接、驗證信息是否有效等工作,來幫你完成整個工作流程——這實際上不僅像是你招了一個「實習(xí)生」,更像是直接當(dāng)上了一個微縮版的「部門主管」。

  在 B2B 業(yè)務(wù)這個案例中,Manus 通過網(wǎng)頁爬蟲以及代碼編寫、執(zhí)行能力,Manus 會自動在互聯(lián)網(wǎng)這片汪洋大海中檢索,根據(jù)你自己的需求,對潛在供應(yīng)商從產(chǎn)品質(zhì)量、價格、交貨能力等方面,為你匹配到最合適的貨源。不僅可以將結(jié)論以圖表的方式直觀呈現(xiàn)在你眼前。還能對這些數(shù)據(jù)進一步給出更加詳細的操作建議。

  Manus 完成 B2B 場景下的需求,或許比單一平臺的內(nèi)建工具更好用 | 圖片來源:極客公園

  至于 Monica 團隊到底如何、用何種技術(shù)實現(xiàn)的視頻效果,根據(jù)消息,團隊或?qū)⒃诒本⿻r間 3 月 6 日為大家揭曉。

  03

  「縫合」的*,就是炸裂

  Manus 背后的 Monica.im,到底是家什么公司?

  Monica 是一款 All-in-One 的 AI 助手,產(chǎn)品形態(tài)從瀏覽器插件、慢慢拓展至了 App、網(wǎng)頁端。主流的使用場景是,當(dāng)用戶在瀏覽器中點開它的小圖標,就能直接使用其接入的各大主流模型。通過對細分場景用戶需求的準確理解,Monica 摘到了大模型「低垂的果實」。

  其創(chuàng)始人肖弘(昵稱小紅,英文名 Red)是一位年輕的連續(xù)創(chuàng)業(yè)者,1992 年生,畢業(yè)于華中科技大學(xué)。2015 年,他畢業(yè)后創(chuàng)業(yè),早期創(chuàng)業(yè)不算順利(如校園社交、二手集市)。2016 年,他創(chuàng)業(yè)微信公眾號運營者提供編輯與數(shù)據(jù)分析工具,獲得了百萬用戶、并完成了盈利,最終產(chǎn)品于 2020 年出售給了某獨角獸公司。

  等到 2022 年大模型浪潮后,他正式創(chuàng)立 Monica,專注海外市場,通過獨立開發(fā)者產(chǎn)品 ChatGPT for Google,產(chǎn)品快速完成了冷啟動。

  2024 年,在 GPT-4o、Claude 3.5、OpenAI o1 系列上線的*時間,Monica 讓用戶可以獲得最新 SOTA 模型。隨著接入模型的新進展,Monica 推出的專業(yè)搜索、DIY Bot、Artifacts 寫小程序、記憶等功能也受到用戶喜愛。而 Monica 在 YouTube、Twitter、Gmail、The Information 等不同功能的網(wǎng)頁里呈現(xiàn)出不同的交互形態(tài)和功能,以適配特定場景的用戶需求,更新了數(shù)百個網(wǎng)頁的個性化 AI 體驗。

  2024 年,Monica 用戶數(shù)量翻番,達 1000 萬。同時,其保持著可觀的盈利,在海外同類產(chǎn)品中,位居頭部。

  Monica 的強勁表現(xiàn)驗證了一件事:

  套殼到*,既是 TPF、也是 PMF,最后都通往用戶價值。

  Monica 首頁 | 圖片來源:Monica

  Manus 或許延續(xù)了 Monica 團隊這種思路——肖弘接受媒體人張小珺的訪談時表示,產(chǎn)品不能只有聊天機器人一種形態(tài),Agent 會是新增的形態(tài)、需要新的產(chǎn)品去承接。

  他從 AI 編程產(chǎn)品 cursor 和 Devin 中獲得了靈感。據(jù)極客公園了解,前者主要是 copilot 模式、后者則是 autopilot 模式,后者更符合人性需求。Agent 也應(yīng)該像 Devin 一樣,面向大眾人群、真正由 ai 主導(dǎo)進行執(zhí)行。但過去的問題是,模型不夠聰明。

  但基于模型已有能力去做場景的封裝服務(wù),或許正是 Monica 團隊的優(yōu)勢。肖弘說,目前 Agent 產(chǎn)品團隊并不多,因為它需要很多復(fù)合能力,比如說團隊要搞過 chatbot、AI 編程、瀏覽器相關(guān)(因為都在瀏覽器上跑)、而且對模型的邊界要有不錯的感知——今天發(fā)展到什么水平,接下來會發(fā)展到什么樣的水平等等。

  「同時擁有這些能力的公司沒那么多,而有這些能力的公司,可能手頭正在干一個很具體的業(yè)務(wù),但我們恰好有同學(xué)剛好有時間一起把這件事情做出來!顾f。

  為什么是 Monica 做出來了,他總結(jié)道,「*,我覺得我們是比較幸運的。第二,某種程度上,如果今天大家都去做 reasoning 了,可能是不是又多出了一些時間給創(chuàng)業(yè)公司?模型預(yù)計能力外溢還能走多遠?」

  他認為,目前 Agent 還在早期階段。一是目前 Agent 還在規(guī)劃階段,還沒到物理世界的執(zhí)行;二是大模型的能力還在往上發(fā)展,一切還不可預(yù)料。

  「我肯定不知道 Agent,是可以被用這樣的方式被出來的,它是一個未知的事情。」他說。

  耐人尋味的是,「不知道怎么做 Agent」的 Monica,現(xiàn)在做出了一個讓整個 AI 圈感到炸裂的產(chǎn)品。

  Manus 可能未必是最終的 AI Agent,但它無疑在 DeepSeek 爆火之后,再次將人們對 AI 的期望拉升了一個數(shù)量級。

  榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。

海報生成中...

分享到微博

掃描二維碼分享到微信

分享到微信
一鍵復(fù)制
標題鏈接已成功復(fù)制

最新新聞

熱門新聞