子曰教育大模型在行業(yè)絕對是個另類。
5月29日的子曰大模型新品發(fā)布會上,網(wǎng)易有道給出了這樣的成績單:一季度AI訂閱業(yè)務收入5000萬,同比增長140%;在線營銷服務業(yè)務近5億,同比增長近126%。
但,你有沒有發(fā)現(xiàn)哪里有點不對勁?
別人給產(chǎn)品起名:Dall-E、Sora、Gemini、Claude …有道給產(chǎn)品起名:Q Anything;Hi Echo;小P家庭教師…一點都不Fancy,這種產(chǎn)品也會有人買單?
所以有道到底做了什么,讓消費者心甘情愿掏錢?最重要的是,它有沒有可能代表了未來大模型一種可行的商業(yè)模式?
發(fā)布會后,零態(tài)LT(ID:LingTai_LT)和有道CEO周楓及子曰大模型落地應用的負責人,深入聊了聊。
1、GPT5都要來了,有道慌不慌
要討論大模型,絕對繞不開GPT。
從GPT-4o的驚艷登場,到微軟發(fā)布會暗示GPT5正在路上,緊接著GPT就宣布向免費用戶開放。一連串的組合拳都在不斷向所有大模型從業(yè)者提出嚴峻的挑戰(zhàn)。更要命的是,奧特曼一直都非?粗谹I在教育領域的落地,有道慌不慌?
周楓表示,GPT對子曰有壓力,但不多。因為子曰擅長的,GPT不擅長。
盡管OpenAI在人工智能領域的發(fā)展速度相當迅猛,其GPT-4o技術已經(jīng)充分展示了實時交互對于吸引用戶的巨大潛力。不過,從技術角度來看,GPT使用的是端到端模型技術并非OpenAI一家獨有。
事實上,這種技術在人工智能行業(yè)內(nèi)被廣泛采用。以有道的翻譯服務為例,2018年之前,翻譯系統(tǒng)由多個模型串聯(lián)而成;而2018年之后,該系統(tǒng)轉變?yōu)槎说蕉四P停瑢崿F(xiàn)了文本的直接轉換,無需中間的語法分析或拆分步驟。
GPT-4o的重要意義在于,它將語音識別、文本處理和聲音合成等功能整合在一起,這標志著行業(yè)發(fā)展的必然趨勢,也是所有公司努力的方向,有道亦不例外。
然而,當深入探究各個行業(yè)后有道發(fā)現(xiàn),真正重要的并非僅僅是交互方式和實時性。實際上,與業(yè)務密切相關的要素往往與這些技術特性正交,即相互獨立。以教育行業(yè)為例,有道專注于解決家長和學生面臨的實際問題,而非單純的技術展示。
家長并不關心機器是否能解決算術問題,他們關心的是產(chǎn)品是否理解并解決他們在教育孩子過程中遇到的具體問題。例如,孩子在學習過程中遇到的難點,或是考試中真正會考察的內(nèi)容。對于高中生而言,家長更關心的是未來的職業(yè)規(guī)劃。
這些問題,才是消費者最為關心的。
有道認為,解決消費者最關心的關鍵問題才是他們的核心任務。有道首先是一家教育公司,其次才是AI大模型,甚至在產(chǎn)品宣傳的時候還要盡可能的避免AI、大模型這些概念。
畢竟,家長和學生看到“AI”“教育大模型”的時候,不一定能理解這個東西是什么、能干啥;但他們看到“小P家庭教師”的時候,一定知道它是什么,能干啥。
周楓還舉了個例子。針對高考填志愿難的需求,有道推出了領世志愿填報應用,受到了廣泛歡迎。許多家長表示,他們曾向許多人咨詢問題,但未得到滿意的答復,而機器提供的答案卻超出了他們的預期。
其實相比填報志愿,我更關心的是近年來,學生因心理壓力,不斷爆出抑郁甚至跳樓的案例。而這個問題,有道用即將上架的小P移動端app的心語樹洞功能回答了我。
諸如此類的操作,有道沒少做。這個時候回過頭再看GPT的時候,我對周楓說的“我們擅長的東西”有了更直觀的體會。從我最近使用GPT-4o的體驗來看,它確實已經(jīng)具備了一定的教輔能力。比如我問了它一篇文言文文章,它是這么回應的。
事實上,我問GPT的時候刻意用了一個錯字,第二句“遂”契應該是“遽”契,然而GPT-4o沒有發(fā)現(xiàn)。
在教育下一代的時候,正確答案里隱藏著一個不正確的內(nèi)容,遠比一上來就表現(xiàn)的不靠譜更可怕。這是通用大模型讓人不放心的地方,也是教育垂直大模型值得深耕的地方,因為:
2、領域做深了,誰都搶不走
最近谷歌搜索倉促推出的AI功能,因為胡說八道引發(fā)熱議。很多人上傳了各種荒謬回答的截圖,比如建議孕婦應該抽煙、人們應該每天吃一點小石子等,逼的谷歌搜索VP親自下場道歉。
▲圖:谷歌搜索VP回應
GPT-4o有時候也固執(zhí)的讓人無奈。
我問它草莓這個單詞里有幾個r,GPT堅稱只有2個,即便它自己親自拼寫了一遍,即便我親自問它有沒有可能里面有3個r。
▲圖:GPT-4o出錯
機器學習三巨頭之一,卷積神經(jīng)網(wǎng)絡創(chuàng)始之一的Yann LeCun認為,現(xiàn)在的大模型智力還比不過雪橇三傻。
這樣的AI應用到教育上,怎么能讓人放心?
有道給出的解決辦法非常簡單:取大模型的長處,服務于十多年深耕教育領域的經(jīng)驗和心得。
周楓不止一次提到,大模型可以做到以前想做卻做不到的事情,比如Hi Echo這樣的英語口語教練,不僅可以實時對話,還能夠評估孩子的口語水平并給出改進建議。但模型本身并不是最終目的,而是作為實現(xiàn)這些應用并滿足用戶需求的手段。
大道理誰都會講,但吹得牛要真的實現(xiàn),只有一個辦法“深耕”。首先是深耕教育,這是核心;其次是深耕大模型,這是手段。兩者結合,就是有道的壁壘。
這種典型的實用主義,配合上有道對教育的長期堅持,就組合成了有道的AI長期主義。
3、教育大模型的未來,在哪里
在當前AI技術迅猛發(fā)展背景下,直接面向用戶的AI產(chǎn)品已成為市場增長的重要驅動力。目前大模型主要有兩種商業(yè)模式,要么賣API,要么賣訂閱服務,有道顯然是后者。
有道認為,AI訂閱服務是推動AI技術發(fā)展和普及的自然途徑。目前,有道正處于這一領域的起步階段,但他們堅信,通過加速擴大產(chǎn)品規(guī)模和提高用戶訂閱量,將能夠實現(xiàn)快速增長。
AI與會員模式的結合,為有道帶來了健康增長的前景。AI技術不僅增強了產(chǎn)品的付費價值,而且構建了競爭壁壘。隨著用戶對高質量服務付費意愿的上升,有道將重點關注三個方面:提高AI的滲透率和使用頻次,推動會員營收的健康增長;在供給側創(chuàng)造更多高價值功能,同時在需求端尋找優(yōu)享用戶;關注創(chuàng)新和新技術,快速實現(xiàn)落地,并持續(xù)探索新場景。
而背后所依賴的,是有道堅持“AI+內(nèi)容”的雙輪驅動策略。教育內(nèi)容是公司長期堅持的業(yè)務方向,而AI技術則是公司在不斷變化的時代中的新焦點。
在過去一年中,有道圍繞AI技術主要完成了三項工作:訓練大模型、將AI功能嵌入原有產(chǎn)品、推出AI生產(chǎn)力工具。自2016年起,有道就開始構建AI基礎能力,并組建了語言、視覺、聲音等多個團隊,積累了包括神經(jīng)網(wǎng)絡翻譯(NMT)、計算機視覺、智能語音AI技術和高性能計算(HPC)在內(nèi)的四大底層技術能力。
自2017年起,有道與主流技術Transformer緊密結合,將AI能力統(tǒng)一在大模型之下,并特別重視端側的落地應用。例如,有道詞典筆2代在2019年首次搭載了離Transformer NMT,這一技術的持續(xù)賦能確立了有道學習硬件在行業(yè)內(nèi)的領先地位。
在底層技術不斷創(chuàng)新的同時,有道也在細分場景下研發(fā)了多項“黑科技”。例如,虛擬人口語教練在語音識別能力方面取得了重大突破,支持多語種的流式低延遲語音識別技術,能夠適應中式英語、英語、中英混合等多種場景。此外,聲學降噪、回聲消除、自動語音檢測、自動斷句等技術的應用,使得虛擬人口語教練能夠像真正的傾聽者和交流者一樣,與用戶進行自然、流暢的互動。
在AI虛擬人的驅動方面,有道利用自主研發(fā)的情感識別算法和實時渲染驅動引擎,對播放的語音數(shù)據(jù)進行深度分析,實時驅動虛擬人的面部表情和口型變化,使虛擬人能夠以更加自然和生動的方式與用戶進行一對一交互,顯著提升了對話的真實感和用戶體驗。
另外,有道的自研ASR算法是公司AI技術實力的重要體現(xiàn)。2021年,網(wǎng)易有道ASR團隊在“Interspeech 2021-非母語兒童語音識別”算法競賽中取得了兩項冠軍。
有道的實用主義,是對技術發(fā)展的洞察;而AI長期主義,卻是對教育本質的堅守。無論技術如何發(fā)展,真正能給用戶帶來價值的,只能是能夠深入理解并滿足用戶需求的企業(yè)。
有道的實踐,為我們提供了一個值得仔細琢磨的案例。
作者|吳狄
編輯|胡展嘉
運營|陳佳慧
出品|零態(tài)LT
榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報生成中...