最新四色米奇影视777在线看_暴躁少女csgo视频一_中文字幕乱码中文乱码_有什么好看的小说推荐_亚洲一卡2卡三卡4卡高清_国产成人精品无码免费看_成人免费120分钟啪啪_两性午夜刺激爽爽视频_国产成人av在线免播放app

首頁 > 資訊 > 評論

反擊梁文鋒,馬斯克的“半成品”夠格嗎?

2025/02/19 11:48      字母榜


  起猛了,差點分不清馬斯克和奧特曼。

  北京時間2月18日中午,馬斯克旗下人工智能公司xAI搞了一場直播,進行新一代模型Grok 3的介紹和現(xiàn)場演示。

  氣氛很輕松,馬斯克和xAI團隊的三名成員,圍坐在一張小桌前,背后是用來展示的大屏幕。不管是這個形式,還是這個畫面,都讓人聯(lián)想到OpenAI。只不過xAI走的是暗黑極客風,OpenAI則是溫馨家居風。

  這倒也不奇怪,畢竟馬斯克從創(chuàng)辦xAI伊始,就死死盯住OpenAI的背影狂追。

  而看起來小小的發(fā)布會,在一個小時的時間里實則殺機滿滿:

  *Grok 3在多項基準測試中,擊敗了競爭對手,包括DeepSeek的V3和OpenAI的GPT-4o;

  *推出名為“DeepSearch”的智能搜索引擎,由推理模型Grok 3 Reasoning和Grok 3 mini Reasoning驅(qū)動;

  *Grok 3將顯示詳細的思維鏈,和DeepSeek R1和OpenAI的o3-mini相似;

  *將“盡快”加入語音模式。

  xAI的發(fā)展迅猛,2023年7月成立,11月就發(fā)布了首個大模型Grok。次年5月,xAI完成60億美元B輪融資,12月又宣布完成60億美元C輪融資,估值超過400億美元。

  從去年9月,xAI建成包含10萬張英偉達***的集群Colossus開始,外界就在期待xAI的下一代大模型的發(fā)布。從去年年底,“跳票”到今年年初,外界又多了新的變數(shù),一邊是OpenAI開啟算力基礎建設的“星際之門”,一邊是DeepSeek掀起低成本推理模型熱潮,Grok 3的發(fā)布頂著巨大的壓力。

  在Grok 3發(fā)布之前,馬斯克做足了預熱,稱其“聰明得嚇人”“(是)最聰明的AI”,但從發(fā)布會來看,xAI尚未結(jié)束追趕態(tài)。馬斯克的AI路,還未到一馬平川之境。

  就在馬斯克鼓足熱情發(fā)布Grok 3之際,奧特曼也暗戳戳來搶熱度,在X(推特前身)上發(fā)起投票,詢問網(wǎng)友對于OpenAI下一個開源項目的看法,是做一個相當小但仍需要在GPU上運行的o3-mini級模型更有用,還是做一個能做得最好的手機大小的端側(cè)模型更有用。

  超3萬名參與投票的網(wǎng)友中,超過一半的票投向了端側(cè)模型。畢竟,趕在奧特曼前面,大熱的DeepSeek,已經(jīng)搶先掀起了一波在智能手機和新能源汽車等終端,部署端側(cè)模型的浪潮。

  Grok 3發(fā)布會之前,外界也很關心特斯拉汽車是否會接入Grok。1月初,馬斯克曾經(jīng)給出肯定的回答,稱Grok會登陸特斯拉。但可惜的是,本次發(fā)布會中,馬斯克并未回應特斯拉接入Grok的相關問題。

  A

  發(fā)布會一開始,xAI就著重談了談Grok 3背后的Colossus超算。

  該超算包含10萬張英偉達***芯片,建立僅用三個月,是馬斯克的一大“偉業(yè)”。連黃仁勛都表示,這堪稱“奇跡”。

  在發(fā)布會上,xAI表示訓練進行到第92天時,集群的規(guī)模拓展到了20萬張芯片。這是該消息首次被披露

  得益于新計算集群,馬斯克在直播演講表示:“Grok 3 的能力比 Grok 2 高出10倍。”

  據(jù)xAI介紹,Grok 3 在包括 AIME(評估模型在數(shù)學問題樣本上的表現(xiàn))和 GPQA(使用博士級物理、生物和化學問題評估模型)在內(nèi)的基準測試中勝過 GPT-4o。此外,Grok 3的早期版本在Chatbot Arena中也獲得了有競爭力的分數(shù),是有史以來第一個突破1400分的模型。這是一項眾包測試,讓不同的 AI 模型相互競爭,并讓用戶投票選出他們喜歡的答案。

  準確地說,Grok 3是一系列模型。

  Grok 3的較小版本Grok 3 mini可以更快地回答問題,但會犧牲一些準確性。

  另外兩個版本 Grok 3 Reasoning和Grok 3 mini Reasoning,旨在仔細“思考”問題然后再提供解決方案,類似于OpenAI的o3-mini和DeepSeek 的 R1 等“推理”模型。

  推理模型在給出結(jié)果之前會徹底檢查自己,這有助于它們避免通常會絆倒模型的一些陷阱。

  xAI表示,Grok 3 Reasoning在幾個流行的基準測試中超越了OpenAI的o3-mini 的最佳版本——o3-mini-high,其中包括一個名為 AIME 2025的較新的數(shù)學基準測試。

  推理模型可通過 Grok 應用程序訪問。用戶可以要求 Grok 3“思考(Think)”,或者利用“大腦(Big Brain)”模式進行推理,該模式需要額外的計算。xAI 認為推理模型最適合數(shù)學、科學和編程相關的問題。

  另一個明顯沖著OpenAI和DeepSeek來的是“DeepSearch”,直譯是“深度搜索”。這是一個AI代理,由xAI的推理模型驅(qū)動,掃描互聯(lián)網(wǎng)和X平臺來分析信息。演示顯示,DeepSearch包含研究、頭腦風暴和數(shù)據(jù)分析等選項,會展示“思考”過程和計劃響應的方式。

  就在兩周前,OpenAI推出AI代理“DeepResearch”,直譯“深度研究”。

  與 DeepSeek R1和現(xiàn)在的OpenAI o3-mini 一樣,Grok 3將顯示詳細的思維鏈,讓用戶可以看到聊天機器人是如何思考問題的。馬斯克證實,xAI 會稍微模糊思維,這樣其他公司就不能直接復制xAI的聊天機器人。

  順帶一提,馬斯克表示,在 Grok 應用中,推理模型的一些“想法”被模糊化,以防止“蒸餾”,即AI模型開發(fā)人員從另一個模型中提取知識的方法。最近,DeepSeek 被指控蒸餾 OpenAI 的模型來創(chuàng)建自己的模型。

  當然啦,新產(chǎn)品還是得“會員搶先用”。

  X的Premium+級別的訂戶將首先獲得 Grok 3,其他功能則由xAI的新計劃SuperGrok提供。SuperGrok 的價格為每月30美元或每年300美元,可解鎖額外的推理和 DeepSearch 查詢,并提供無限的圖像生成。

  馬斯克表示,未來(最快一周后),Grok 將獲得“語音模式”,這將為 Grok 提供合成語音。幾周后,Grok 3 模型將與 DeepSearch 功能一起出現(xiàn)在xAI 的企業(yè)API中。幾個月后,馬斯克表示,xAI 將開源 Grok 2。

  “我們的一般做法是,當下一個版本完全發(fā)布時,我們將開源最后一個版本(Grok)。”馬斯克說。“當 Grok 3 成熟穩(wěn)定時,可能在幾個月內(nèi),我們就會開源 Grok 2。”

  B

  從演示及xAI給出的基準測試結(jié)果來看,Grok 3確實實力不俗,但這場發(fā)布會還是略有“倉促”之感。

  一向樂于畫餅、擅長于把80分宣傳成101分的馬斯克,也在這次發(fā)布會時給用戶“打預防針”:“這只是一個測試版本,剛開始可能會有些不完美。如果你想要更完善的版本,可能需要等上一周。”

  此外,語音模式?jīng)]有發(fā)布也值得注意。發(fā)布前的幾個小時,希馮·齊利斯(Shivon Zilis)——Neuralink高管,同時也是和馬斯克育有一對雙胞胎的孩子媽,在X上大贊和Grok 3進行的對話,稱“是我一生中最出乎意料、最值得的時光之一”,公開了Grok 3有語音功能。

  但隨后馬斯克回復稱語音模式還有一些問題,還需要一周左右時間才能發(fā)布。在發(fā)布會上,結(jié)束時壓軸的也是一小段Grok 3語音對話的畫面,看起來語音模式是被臨時從這次發(fā)布會中取消的。

  大家都明白這次發(fā)布對馬斯克和xAI來說都很重要,Grok 3必須支棱。

  Grok 3原本定于去年年底推出,但被推遲。根據(jù)馬斯克的說法,Grok 3在今年一月初完成了訓練。

  按理說這樣的推遲并不算久,但剛跨進新年,今年一月接連發(fā)生兩件大事:一是OpenAI宣布攜手軟銀和甲骨文,共建“星際之門”,預計投入5000億美元夯實AI基建。二是中國殺出個DeepSeek,其推理模型R1因低成本高性能表現(xiàn)驚艷大洋彼岸的硅谷。

  可能也正因如此,馬斯克這次硬是整出了蘋果發(fā)布會的排場,在Grok 3發(fā)布之前就預熱不斷。馬斯克在各個場合以及X上都大贊新一代模型,以視頻接入迪拜世界政府峰會時稱“Grok 3 的表現(xiàn)優(yōu)于我們所知的任何已發(fā)布產(chǎn)品”,周末在X上宣稱Grok 3是“地球上最聰明的AI”。

  這也可以解釋為什么這次語音模式?jīng)]有完全準備好、Grok 3也尚處于測試階段,xAI就急著隆重召開發(fā)布會——同行的獠牙,八成已經(jīng)閃得馬斯克睡不著覺了。

  C

  馬斯克不停地強調(diào)“再等一周”,但一周之內(nèi)世界會發(fā)生什么真不好講。

  在DeepSeek于1月底開始打出知名度之后,OpenAI的應對措施就火速跟上,先是給免費用戶開放o3-mini,又發(fā)布DeepResearch深度研究的功能。此外,OpenAI的CEO山姆·奧特曼(Sam Altman)前不久還發(fā)布長推文,公布GPT-5的計劃。

  在更大的競爭場中,中國的科技大廠如騰訊、百度等,以及出海的中國初創(chuàng)AI公司如MiniMax,都紛紛接入DeepSeek的模型,眼瞅著有打造“技術共同體”之態(tài),形成競爭合力。

  好在馬斯克也有打造“馬斯克共同體”的潛力。其名下企業(yè)眾多,借由xAI正在加速彼此打通的進程。

  一開始,似乎是馬斯克名下其他幾個企業(yè)當“扶弟魔”,喂養(yǎng)xAI。陸續(xù)傳出過特斯拉顯卡、X平臺數(shù)據(jù)被xAI使用的消息。如今xAI也有了回饋的趨勢。

  Grok從一開始就是X(前推特)訂閱用戶的“特權”,在去年底,Grok開始提供給X的免費用戶,甚至是未注冊用戶,只是模型選擇與提問數(shù)量的限制有高低之分。今年1月,Grok的獨立應用也在蘋果商店上線,正式和ChatGPT展開角逐。

  本次直播期間,打開X的APP,相關入口在頂部高亮顯示。托X的福,這場直播在進行半個小時后就已經(jīng)有200萬次觀看,一小時后這個數(shù)字達到300萬。從前期宣傳、發(fā)布會直播到后期嵌入,馬斯克算是把X玩明白了。

  要知道,據(jù)X官方消息,2024年3月時平臺日活2.5億,月活5.5億。相比而言,據(jù)《紐約時報》,ChatGPT去年6月的月活為3.5億。X對于xAI來說,是一個巨大的流量池。

  此次發(fā)布會之前,外界也很關心特斯拉汽車是否會接入Grok。還是在1月初,馬斯克曾經(jīng)給出肯定的回答,稱Grok會登陸特斯拉,你可以和特斯拉對話,提出任何要求。

  但可惜的是,本次發(fā)布會中沒有涉及特斯拉接入Grok的問題,倒是有一名xAI的工作人員問馬斯克Grok何時會被接入SpaceX的火箭,馬斯克回答“兩年”。

  不管怎樣,xAI接下來一周,都得祈禱AI界不要再有“炸場”的同行。再稍久一些的未來,則得期待Grok 3的表現(xiàn)足以打動華爾街,畢竟xAI正在考慮以750億美元估值融資100億美元,而與此同時,OpenAI據(jù)傳正在進行一輪400億美元的融資,目標估值沖著3400億美元而去。

  Grok 3是否是“地球上最聰明的AI”,又是否能長久成為“地球上最聰明的AI”,好戲還在后頭。

  榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。

海報生成中...

分享到微博

掃描二維碼分享到微信

分享到微信
一鍵復制
標題鏈接已成功復制

最新新聞

熱門新聞