在大模型的眾多落地場景中,為何AI+知識庫會受到大量企業(yè)的青睞?
文|周享玥 周路平
編|游勇
01
一家央企子公司的知識庫實踐
五環(huán)公司是中國化學(xué)集團的子公司,在化工工程領(lǐng)域有著廣泛的業(yè)務(wù)積累,包括累計完成了3000多項大中型設(shè)計項目、300多項工程總承包項目和200多項海外項目。
但這些長年積累的行業(yè)寶貴知識和經(jīng)驗,卻面臨著難以被高效利用的難題。
在知識管理上,因為項目管理比較獨立,知識難以有效沉淀和匯聚,而且由于缺乏專門的組織、崗位和標準化制度,導(dǎo)致知識缺乏統(tǒng)一分類和存儲標準,知識資源分散且檢索效率較低,員工參與的積極性不高。
另外,現(xiàn)有的檔案管理、云盤和培訓(xùn)系統(tǒng),雖然能夠初步實現(xiàn)文檔的線上化管理,但不能覆蓋知識的流動與共享,導(dǎo)致知識應(yīng)用與業(yè)務(wù)發(fā)展脫節(jié),限制了業(yè)務(wù)部門的生產(chǎn)效率。
在內(nèi)部的學(xué)習(xí)培訓(xùn)上,同樣面臨著諸多痛點。五環(huán)每年需要進行600多場學(xué)習(xí)培訓(xùn)項目,而內(nèi)部自建的培訓(xùn)系統(tǒng)功能較為基礎(chǔ),導(dǎo)致培訓(xùn)管理效率低下,無法高效支持培訓(xùn)的執(zhí)行和效果追蹤。同時,內(nèi)部系統(tǒng)改造又面臨技術(shù)復(fù)雜、成本高昂的挑戰(zhàn),難以快速響應(yīng)業(yè)務(wù)變化和需求升級,制約了五環(huán)培訓(xùn)管理的數(shù)字化轉(zhuǎn)型。
現(xiàn)有的數(shù)字化水平已經(jīng)難以跟上業(yè)務(wù)發(fā)展的需要。
AI的興起讓業(yè)內(nèi)看到了新的思路,尤其是央國企對大模型的熱情高漲。五環(huán)在2024年初制定了AI落地的路線圖,梳理了一系列的落地場景,最終確定以知識庫的建設(shè)作為重要試點,為后續(xù)的AI場景落地提供經(jīng)驗。
五環(huán)公司選知識庫有兩個原因:一是五環(huán)所在的行業(yè)屬于知識密集型產(chǎn)業(yè),過去60多年積累了大量行業(yè)的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),而且因為具備設(shè)計院背景,正式員工里95%以上擁有本科以上學(xué)歷。二是內(nèi)部提倡打造學(xué)習(xí)型組織,員工需要不斷成長,建設(shè)企業(yè)知識庫成為AI最快見效也是最確定性方向。
其實,知識管理并不是新概念,但很多企業(yè)很難真正用起來。中國化學(xué)五環(huán)公司科數(shù)部副主任張科發(fā)現(xiàn),其中一個原因是知識庫的使用門檻太高,需要員工對各種文檔分門別類打上標簽。造成的結(jié)果就是三分鐘熱度,前期的熱情一過,員工就很難嚴格按照標準去維護知識庫。
2024年,在騰訊樂享團隊的幫助下,五環(huán)公司確定了AI助手+知識庫的架構(gòu),打造一個五環(huán)專屬的私域智能大腦和一個員工24小時的貼身AI助手。
如今,五環(huán)公司的知識庫已經(jīng)覆蓋了20個部門,導(dǎo)入6-8萬篇文檔和200多門在線課程、1000多個高質(zhì)量視頻資源。而且,這個知識庫可以根據(jù)部門、項目和員工職級設(shè)置不同的訪問權(quán)限,保證了內(nèi)部信息的安全可控。
通過建設(shè)AI知識庫,五環(huán)公司實現(xiàn)了員工培訓(xùn)和知識管理的協(xié)同。不僅實現(xiàn)了對存量知識的有效利用,避免了因為員工工作變動造成數(shù)據(jù)資產(chǎn)的流失;同時也讓員工能夠利用碎片化時間持續(xù)學(xué)習(xí)。
02
知識庫,已成AI落地最具確定性的場景
中國五環(huán)的案例并非孤例。今年初,隨著DeepSeek爆火,企業(yè)在知識庫方面的需求出現(xiàn)井噴式增長。騰訊云副總裁答治茜認為,大模型+知識庫已成為目前企業(yè)落地大模型最明確的一條路徑。
“從體感上來說,至少有三五倍的增長。”答治茜告訴數(shù)智前線,這背后,是大模型顯著縮短了知識獲取、消費的路徑。過去,人們獲取信息需經(jīng)歷多個步驟,現(xiàn)在,大模型簡化了這一過程。企業(yè)因此意識到是時候建立更高效的系統(tǒng),以便員工能迅速獲取所需知識。
尤其是知識密集型企業(yè),希望通過大模型+知識庫,促進知識在員工和組織間流動,并轉(zhuǎn)化為組織資產(chǎn),實現(xiàn)效率、業(yè)績提升。
例如,在律師行業(yè),曠真律所正在使用騰訊樂享知識庫,將律師工作過程中的經(jīng)驗沉淀下來,從而提升律師工作的效率。
“他們現(xiàn)在要求每做一個案子都必須沉淀下來,以便律師在遇到類似情況時,能快速查找過往案例和結(jié)論。”答治茜告訴數(shù)智前線,通過大模型+知識庫的方式,曠真律所將合伙人的培養(yǎng)時間從8年縮短至了6年。
另一方面,大模型雖熱,實際應(yīng)用場景卻仍然有限,多位行業(yè)人士判斷,大模型首先大規(guī)模應(yīng)用的場景,一種是在核心業(yè)務(wù)里能帶來顯著價值的小場景;另一種是像知識庫這樣知識密集但有一定容錯性的場景。
在核心業(yè)務(wù)中,企業(yè)通常對AI持謹慎態(tài)度,需要持續(xù)攻堅,完成可靠性驗證。相比之下,知識庫能快速發(fā)揮大模型的優(yōu)勢,讓管理層和一線員工快速體驗AI帶來的效果,通過知識的不斷沉淀、積累,企業(yè)也能挖掘出更多業(yè)務(wù)需求,是目前落地相對順暢,也是最快能夠見到成效的路徑之一。
答治茜告訴數(shù)智前線,有不少企業(yè)購買一體機后,落地遇到困難,找到他們,希望基于知識庫,將大模型快速用起來。
此前,有些企業(yè)選擇自建企業(yè)知識庫,但一直面臨投入大、周期長、見效慢、技術(shù)門檻高等難題。個人通過做筆記,形成個人知識庫相對容易,只需對自己負責(zé),但企業(yè)知識庫的建立卻需應(yīng)對多方面挑戰(zhàn)。
比如分散的知識如何整理到一起?知識庫兼容的格式是否足夠滿足要求?知識能否清晰地、成體系化地呈現(xiàn)?權(quán)限管理是否完善,既保證安全,又滿足跨部門協(xié)作需求?知識質(zhì)量是否足夠,有沒有過時冗余的知識,是否能跟上業(yè)務(wù)變化?預(yù)算投入后,知識庫有沒有用是否能量化評估……
在大模型時代,這些挑戰(zhàn)將更為凸顯。知識庫如何適應(yīng)大模型的能力?從知識的搜集、解析、存儲、生成、管理到更新,整個流程都會變化。以文檔解析為例,傳統(tǒng)文檔解析注重視覺呈現(xiàn),現(xiàn)在則需將文本、圖像、視頻內(nèi)容解析給模型,讓模型理解內(nèi)容。
“我們看到很多技術(shù)團隊基于開源技術(shù),自己嘗試去搭建企業(yè)知識庫,但建完后發(fā)現(xiàn)效果不符合預(yù)期,開始轉(zhuǎn)向?qū)I(yè)團隊和產(chǎn)品尋求解決方案。”一位行業(yè)人士表示。
樂享在知識管理領(lǐng)域已經(jīng)耕耘多年。早在2008年,騰訊就在內(nèi)部推出了知識管理平臺——KM(knowledge management),成為了騰訊員工在內(nèi)部分享、交流知識的核心承載。伴隨著騰訊業(yè)務(wù)的進一步多元化,樂享也逐漸孵化出更豐富、更完善的知識管理體系。2017年,樂享正式對外提供服務(wù),將騰訊沉淀多年的產(chǎn)品和經(jīng)驗對外輸出,幫助更多企業(yè)搭建內(nèi)部社區(qū)、做好知識管理。
“樂享過去已服務(wù)30萬+企業(yè),廣泛應(yīng)用于金融、零售、制造、教育等多個行業(yè)。”樂享內(nèi)部人士告訴數(shù)智前線,過去,企業(yè)內(nèi)部對于培訓(xùn)、社區(qū)類的需求較多,大模型+知識庫的需求出來后,這些客戶正在快速轉(zhuǎn)向樂享新的知識庫的能力。
03
一個好的知識庫,應(yīng)該具備怎樣的能力?
隨著知識庫需求的激增,一個好的知識庫到底應(yīng)該如何建立,成為了業(yè)界討論的重點。
“我們認為,一個優(yōu)秀的知識庫,應(yīng)該具備‘放得進’、‘管得好’、‘看得清’、‘找得準’、‘用得上’五方面的能力。”答治茜告訴數(shù)智前線,大模型時代,知識庫的終極目標是“讓企業(yè)知識觸手可及”。這正是樂享最新產(chǎn)品定位的核心理念。
實現(xiàn)這些要求,需要對知識管理的全周期進行優(yōu)化。
在知識整合環(huán)節(jié),要“放得進”。企業(yè)知識廣泛分散在各種的辦公文檔、圖片、音視頻文件中,需梳理、解析變成模型能看懂的知識,并統(tǒng)一管理,打破分散困境。
“樂享現(xiàn)在支持上百種文件格式。”答治茜透露,其文件上傳模式也在持續(xù)優(yōu)化。過去,一個個文件單獨上傳的方式,客戶覺得麻煩,于是樂享推出按目錄上傳的能力,并計劃未來通過API和拖拽等方式提供更多便捷上傳選項。
在知識更新與屬性管理環(huán)節(jié),要“管得好”,確保知識的時效性和質(zhì)量,并對權(quán)限進行細致劃分。
例如,樂享知識庫提供有效性巡檢、知識審核、知識引用實時更新以及知識所有人機制等功能,確保知識有效、可靠。同時,支持實時批注和任務(wù)下發(fā),提高團隊交流效率,促進業(yè)務(wù)流程和內(nèi)部協(xié)作。它還允許根據(jù)組織架構(gòu)設(shè)置靈活的權(quán)限,既可繼承父級權(quán)限,也可為成員單獨定制權(quán)限,平衡數(shù)據(jù)安全與協(xié)作需求。
而在“看得清”問題上,要求AI知識庫具有足夠清晰的數(shù)據(jù)洞察與管理看板能力,可以對知識數(shù)據(jù)進行深度分析和挖掘,比如通過提供知識的熱度統(tǒng)計、趨勢分析等功能,幫助企業(yè)管理者更好地了解知識的使用情況和價值。
“找得準”則要求智能問答檢索與溯源的效率要足夠高。目前,知識問答工具常面臨兩大挑戰(zhàn):一是僅依靠模型自身的推理能力,缺乏對企業(yè)知識的深入理解,難以準確把握用戶需求,回答偏離主題;二是僅僅根據(jù)用戶提出的問題進行檢索,一旦相關(guān)文檔缺失,AI很容易產(chǎn)生“幻覺”,給出錯誤回答。
“這就要求我們?nèi)プ龊闷胶,既要有一定的發(fā)散性,又要盡量減少幻覺。”答治茜說,“例如在需要嚴謹?shù)膱鼍跋,我們通過前期文件預(yù)處理,以及精準的溯源能力來提升AI回答的準確率;蛘呶覀兺ㄟ^一定的手段,來提高人類校驗知識準確性的能力,那么即便是大模型瞎編,也能夠知道哪里出了問題。”
“你對非結(jié)構(gòu)化資料的識別是不是準確、數(shù)據(jù)規(guī)模特別大時,召回的切片怎么做才是精準的、如何精排才能獲取到最好的結(jié)果,以及最后給大模型總結(jié)的時候,選擇什么樣的模型,或者有些場景可能需要多個模型結(jié)合使用,這些都是在工程和產(chǎn)品設(shè)計上要解決的問題。”答治茜說,目前,騰訊樂享結(jié)合知識萃取+模型推理能力,能夠超越基礎(chǔ)的RAG(檢索增強生成)模式,深度挖掘企業(yè)中的隱形知識關(guān)聯(lián),實現(xiàn)“理解準”、“檢索準”、“回答準”。
在“用得上”這件事上,樂享則通過開放平臺與Agent機制,支持知識導(dǎo)進來,以及場景化使用。答治茜透露,樂享提供多種方式幫助企業(yè)將AI助手融入工作流。
比如在五環(huán)公司的知識庫,騰訊樂享提供了三個入口,除了在PC端有桌面懸浮窗,也可以從OA系統(tǒng)進入,還可以在企業(yè)微信工作臺進入,保證員工能隨時隨地訪問。
基于這五方面的能力,騰訊樂享知識庫已助力多家企業(yè)實現(xiàn)大模型應(yīng)用。例如,與云康集團構(gòu)建“智云”知識體系,并上線AI助手“小云”,應(yīng)用于臨床研發(fā)、樣本管理、客戶服務(wù)等關(guān)鍵服務(wù)?莆炙够隍v訊樂享搭建AI知識庫,為一線門店導(dǎo)購進行產(chǎn)品知識與售賣實戰(zhàn)的賦能,全國門店人效提升10%,一年節(jié)省100萬元成本。樂享還為騰訊ToB業(yè)務(wù)開發(fā)了知識管理平臺“云知”,該平臺每年訪問量超800萬次,為騰訊節(jié)省的時間、人力、場地及差旅成本累計近3億元。
不過,企業(yè)知識庫的成功搭建并非終點。搭建完成后,如何真正用起來,避免為了建設(shè)而建設(shè),仍然還有不少痛點,需要行業(yè)共同去解決。
“這應(yīng)當是一個上下聯(lián)動的過程。”五環(huán)公司張科認為,公司高層和管理部門要明確知識庫的業(yè)務(wù)提效定位,制定知識管理核心規(guī)則,并通過專項活動吸引員工,為一線作業(yè)提供支持。
同時,他們也在探索在流程和組織機制上進行調(diào)整,例如制定激勵措施,鼓勵知識貢獻突出者,考慮將每年產(chǎn)生的知識數(shù)量、質(zhì)量以及他們?yōu)闃I(yè)務(wù)節(jié)省的工時等指標作為KPI考核的一部分,融入各業(yè)務(wù)部門。
另外,對中大型企業(yè)而言,建立知識庫團隊、主動運營至關(guān)重要。初期知識庫不會自發(fā)成長,必須有人負責(zé)運營和推動。知識管理與項目管理相似,需要指定專門人員負責(zé)并推動知識管理。
“建知識庫知識邁出了第一步,更多是怎樣通過制度和流程設(shè)計形成一個互相促進、螺旋上升的態(tài)勢。”張科說。
榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報生成中...