6月11日,中國(guó)信息通信研究院(以下簡(jiǎn)稱“信通院”)公布可信AI代碼大模型首輪評(píng)估結(jié)果,商湯小浣熊獲得最高評(píng)級(jí)(4+級(jí)),在代碼通用能力、專用場(chǎng)景和應(yīng)用成熟度多個(gè)評(píng)估維度中表現(xiàn)優(yōu)秀。
信通院在2024上半年正式啟動(dòng)可信AI代碼大模型評(píng)估,以《智能化軟件工程技術(shù)和應(yīng)用要求 第1部分:代碼大模型》標(biāo)準(zhǔn)為評(píng)估依據(jù),該標(biāo)準(zhǔn)也是業(yè)內(nèi)首個(gè)代碼大模型標(biāo)準(zhǔn),其涵蓋通用能力、專用場(chǎng)景能力和應(yīng)用成熟度三大部分,包括16個(gè)能力項(xiàng)、100多個(gè)能力要求,全面從輸入多樣性、任務(wù)多樣性、語言完備度、結(jié)果可接收性、結(jié)果準(zhǔn)確度等維度,考核代碼大模型的全棧技術(shù)能力。
圖片來源:中國(guó)信息通信研究院
商湯小浣熊是本次評(píng)分最高的代碼大模型之一,作為首批參評(píng)企業(yè)獲得4+級(jí)評(píng)級(jí),信通院給出測(cè)評(píng)結(jié)論:
在通用能力方面,其代碼解釋、代碼轉(zhuǎn)換等方面表現(xiàn)突出;
在專用場(chǎng)景方面,其支持網(wǎng)站開發(fā)、桌面應(yīng)用開發(fā)、移動(dòng)應(yīng)用開發(fā)、數(shù)據(jù)庫開發(fā)等多個(gè)場(chǎng)景的開發(fā)能力;
在應(yīng)用成熟度方面,其數(shù)據(jù)分類分級(jí)、模型性能、模型服務(wù)可維護(hù)性、風(fēng)險(xiǎn)可控性等方面均表現(xiàn)優(yōu)秀。
「小浣熊家族」是基于商湯“日日新SenseNova”大模型體系打造的 AI Native 生產(chǎn)力系列工具,覆蓋軟件開發(fā)、數(shù)據(jù)分析、編程教育等多個(gè)場(chǎng)景,旨在通過先進(jìn)的人工智能技術(shù)優(yōu)化和提升工作效率。
榜單收錄、高管收錄、融資收錄、活動(dòng)收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報(bào)生成中...