合合信息智能文檔處理技術(shù)亮相2023第十二屆中國智能產(chǎn)業(yè)高峰論壇

2023/09/22 17:27 IT產(chǎn)業(yè)網(wǎng) [No.S013]

　　近日，2023第十二屆中國智能產(chǎn)業(yè)高峰論壇(CIIS 2023)在江西南昌順利舉行。大會由中國人工智能學(xué)會、江西省科學(xué)技術(shù)廳、南昌市人民政府主辦，南昌市科學(xué)技術(shù)局、中國工程科技發(fā)展戰(zhàn)略江西研究院承辦。本次大會重點(diǎn)關(guān)注AI大模型、生成式AI、無人系統(tǒng)、智能制造、數(shù)字安全等領(lǐng)域，匯集了來自中國工程院、國際歐亞科學(xué)院、國際核能院等多個(gè)學(xué)術(shù)機(jī)構(gòu)的院士進(jìn)行主題報(bào)告演講、專題論壇研討。近200位人工智能領(lǐng)域?qū)＜覍W(xué)者同場交流分享，吸引了線上線下超千萬人次觀會。

　　大會現(xiàn)場

　　行業(yè)的發(fā)展離不開信息傳遞，文檔是信息傳遞最常見的載體之一。智能文檔處理技術(shù)歷來便是學(xué)術(shù)界重點(diǎn)關(guān)注的領(lǐng)域，多模態(tài)大模型可以利用大量的數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練，有效解決文檔圖像質(zhì)量及自然語言處理技術(shù)限制問題�；诖�，大會期間，中國人工智能學(xué)會(CAI)模式識別專委會與合合信息共同承辦了《多模態(tài)大模型與文檔圖像智能理解》專題論壇，論壇主席為華南理工大學(xué)金連文教授、復(fù)旦大學(xué)邱錫鵬教授。來自清華大學(xué)、華中科技大學(xué)、復(fù)旦大學(xué)、百度、科大訊飛、合合信息等研究機(jī)構(gòu)和企業(yè)的技術(shù)專家，圍繞行業(yè)焦點(diǎn)議題展開探討。

　　《多模態(tài)大模型與文檔圖像智能理解》專題論壇現(xiàn)場

　　“大模型的出現(xiàn)勢必對行業(yè)帶來巨大的影響，文檔圖像的分析、識別、理解與大模型技術(shù)間存在互補(bǔ)關(guān)系。”合合信息智能技術(shù)平臺事業(yè)部副總經(jīng)理、高級工程師丁凱博士在《文檔圖像預(yù)訓(xùn)練模型的探索與思考》分享中提到，在互聯(lián)網(wǎng)語料“見底”之日逐漸逼近之時(shí)，電子書成為了大模型訓(xùn)練的新“燃料”，而電子書很多是由文檔圖像組成的，文檔圖像識別分析與智能理解技術(shù)可以將大量的文檔圖像轉(zhuǎn)化為具有豐富格式信息的文本，為大模型提供更豐富更高質(zhì)量的訓(xùn)練語料，解決大模型訓(xùn)練的‘token荒’的問題。

　　合合信息智能技術(shù)平臺事業(yè)部副總經(jīng)理、高級工程師丁凱博士進(jìn)行《文檔圖像預(yù)訓(xùn)練模型的探索與思考》主題分享

　　文檔圖像技術(shù)已走過百年歷程，但文檔圖像質(zhì)量退化、文字檢測及版面分析困難、非限定條件文字識別率低、結(jié)構(gòu)化智能理解能力差等問題如今仍是工業(yè)化落地中的難題。丁凱認(rèn)為，文檔圖像處理技術(shù)在推動大模型技術(shù)發(fā)展的同時(shí)，大模型的小樣本學(xué)習(xí)能力、多任務(wù)能力、智能涌現(xiàn)能力對于文檔圖像處理問題的解決具有重要的研究價(jià)值。

　　“在已有的學(xué)術(shù)研究中，文檔圖像專有大模型在更復(fù)雜的文檔理解問題上存在天然的短板，而一些多模態(tài)大模型已經(jīng)表現(xiàn)出了從含有表格、圖片等多重元素的文檔中提取關(guān)鍵信息進(jìn)行分析，理解內(nèi)容的潛力。”丁凱表示，研究人員可以基于現(xiàn)有的領(lǐng)域做更好的融合，開辟新的研究方向。

　　合合信息-華南理工大學(xué)文檔圖像分析識別與理解聯(lián)合實(shí)驗(yàn)室也對以下行業(yè)前沿問題進(jìn)行了研究，包括如何將文檔圖像識別分析的各種任務(wù)定義為序列預(yù)測的形式，通過不同的AI提示詞(prompt)引導(dǎo)模型完成不同的文檔圖像識別分析與理解任務(wù)，讓模型更好地支持篇章級的文檔圖像識別分析。

　　大模型蓬勃生長的背面，大量經(jīng)過人工、生成式AI篡改合成的圖片被用于散播謠言、經(jīng)濟(jì)詐騙，AI圖像內(nèi)容安全也成為了文檔大模型發(fā)展中亟待解決的痛點(diǎn)。丁凱表示，合合信息智能文檔處理技術(shù)覆蓋了圖像預(yù)處理、解析識別到AI安全等文檔圖像處理全生命周期，在端到端提升文件處理效率、準(zhǔn)確率的同時(shí)，有效保障用戶及企業(yè)數(shù)據(jù)安全。

　　今年8月，合合信息戰(zhàn)勝了來自全球的上千支參賽團(tuán)隊(duì)，獲得了文檔分析與識別國際會議(ICDAR 2023)“文本篡改檢測”賽道冠軍。合合信息技術(shù)團(tuán)隊(duì)提出的方案能夠在保持極低誤檢率的同時(shí)，準(zhǔn)確識別并定位圖片中文本的篡改行為，從而有效保障文本信息的真實(shí)性。相關(guān)方案此前已在銀行、證券、保險(xiǎn)多個(gè)場景中應(yīng)用。此前，合合信息曾獲得ICPR、ICFHR 等十余項(xiàng)文檔圖像處理、文字識別領(lǐng)域國際競賽冠軍。

　　榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn（把#換成@）。

海報(bào)生成中...

分享到微博分享到微信一鍵復(fù)制

標(biāo)題鏈接已成功復(fù)制

最新四色米奇影视777在线看_暴躁少女csgo视频一_中文字幕乱码中文乱码_有什么好看的小说推荐_亚洲一卡2卡三卡4卡高清_国产成人精品无码免费看_成人免费120分钟啪啪_两性午夜刺激爽爽视频_国产成人av在线免播放app

合合信息智能文檔處理技術(shù)亮相2023第十二屆中國智能產(chǎn)業(yè)高峰論壇

最新新聞

熱門新聞

新動態(tài)

關(guān)注度

最話題

最新四色米奇影视777在线看_暴躁少女csgo视频一_中文字幕乱码中文乱码_有什么好看的小说推荐_亚洲一卡2卡三卡4卡高清_国产成人精品无码免费看_成人免费120分钟啪啪_两性午夜刺激爽爽视频_国产成人av在线免播放app

合合信息智能文檔處理技術(shù)亮相2023第十二屆中國智能產(chǎn)業(yè)高峰論壇

相關(guān)閱讀

最新新聞

熱門新聞

新動態(tài)

關(guān)注度

最話題