3月31日,記者在教育部介紹深入貫徹落實(shí)《教育強(qiáng)國(guó)建設(shè)規(guī)劃綱要(2024—2035年)》,推進(jìn)語(yǔ)言文字信息化發(fā)展情況的新聞發(fā)布會(huì)上獲悉,近日教育部、國(guó)家語(yǔ)委、中央網(wǎng)信辦共同印發(fā)了《關(guān)于加強(qiáng)數(shù)字中文建設(shè) 推進(jìn)語(yǔ)言文字信息化發(fā)展的意見(jiàn)》(以下簡(jiǎn)稱《意見(jiàn)》),部署應(yīng)用關(guān)鍵新技術(shù),構(gòu)建資源數(shù)據(jù)新體系,實(shí)施賦能全局新行動(dòng),全力服務(wù)教育強(qiáng)國(guó)、科技強(qiáng)國(guó)和文化強(qiáng)國(guó)建設(shè)。
根據(jù)《意見(jiàn)》要求,第一步,到2027年,國(guó)家數(shù)字中文建設(shè)行動(dòng)取得重要成效,語(yǔ)言文字?jǐn)?shù)據(jù)要素價(jià)值有效釋放。第二步,到2035年,中文在全球數(shù)字空間、網(wǎng)絡(luò)空間以及生成式人工智能等關(guān)鍵應(yīng)用場(chǎng)景中的使用占比顯著提高;語(yǔ)言文字信息化有力支撐國(guó)家語(yǔ)言能力建設(shè)、語(yǔ)言文字事業(yè)和經(jīng)濟(jì)社會(huì)高質(zhì)量發(fā)展,整體水平位居世界前列。
教育部語(yǔ)言文字信息管理司司長(zhǎng)劉培俊指出,當(dāng)前數(shù)字中國(guó)建設(shè)的大背景和世界大語(yǔ)言格局,對(duì)承載中華文化的中文數(shù)字化提出新的要求。
“《意見(jiàn)》明確提出重點(diǎn)加強(qiáng)數(shù)字中文建設(shè),著力推進(jìn)中文數(shù)字化與數(shù)據(jù)中文化、創(chuàng)新應(yīng)用與規(guī)范安全、新型中文服務(wù)體系構(gòu)建與語(yǔ)言文字治理體系的完善,進(jìn)一步提升中文在全球數(shù)字空間以及人工智能等關(guān)鍵應(yīng)用場(chǎng)景的使用占比和價(jià)值引領(lǐng),進(jìn)一步提升在全球語(yǔ)言治理框架中中文參與度和在世界文明交流互鑒中的中文貢獻(xiàn)率,為教育強(qiáng)國(guó)、科技強(qiáng)國(guó)、文化強(qiáng)國(guó)建設(shè)發(fā)揮中文更大的作用?!眲⑴嗫≌f(shuō)。
“加強(qiáng)數(shù)字中文建設(shè)將從三個(gè)維度重塑發(fā)展格局,推動(dòng)中文信息處理技術(shù)發(fā)展進(jìn)入新階段。一方面,語(yǔ)言文字要從重要資源轉(zhuǎn)化為數(shù)據(jù)要素價(jià)值。新形勢(shì)下,語(yǔ)言文字將實(shí)現(xiàn)從‘靜態(tài)符號(hào)’向‘動(dòng)態(tài)數(shù)字資產(chǎn)’,從‘信息載體’向‘生產(chǎn)要素’的轉(zhuǎn)型,要重點(diǎn)推動(dòng)語(yǔ)料庫(kù)、數(shù)據(jù)標(biāo)注與評(píng)價(jià)等標(biāo)準(zhǔn)的研制,支持文本生成與理解、語(yǔ)言翻譯、情感分析等各種任務(wù)。同時(shí),語(yǔ)言文字要從廣泛存在聚焦到關(guān)鍵領(lǐng)域應(yīng)用,聚焦關(guān)鍵垂直領(lǐng)域建設(shè)語(yǔ)料基礎(chǔ)設(shè)施,構(gòu)建支持大模型訓(xùn)練的高質(zhì)量中文數(shù)據(jù)集。此外,語(yǔ)言文字還要從基礎(chǔ)支撐提高到賦能全局發(fā)展。語(yǔ)言文字將實(shí)現(xiàn)與信息技術(shù)的深度融合,要形成‘技術(shù)突破—場(chǎng)景落地—生態(tài)繁榮’的良性循環(huán)?!北本┐髮W(xué)王選計(jì)算機(jī)研究所所長(zhǎng)湯幟表示。
據(jù)教育部語(yǔ)言文字應(yīng)用管理司副司長(zhǎng)王暉介紹,目前教育部已經(jīng)啟動(dòng)布局了新型國(guó)家語(yǔ)料庫(kù)的建設(shè)工作?!耙环矫媸且?guī)范引領(lǐng),主要是加強(qiáng)制度的供給,研制語(yǔ)料庫(kù)建設(shè)規(guī)范,突出價(jià)值導(dǎo)向、應(yīng)用導(dǎo)向、創(chuàng)新導(dǎo)向,統(tǒng)籌質(zhì)量和安全,為語(yǔ)料庫(kù)建設(shè)提供基礎(chǔ)原則和方法指引。另一方面是示范引導(dǎo),成熟先上,開(kāi)發(fā)建設(shè)‘中華文脈新型語(yǔ)料庫(kù)’‘中華大閱讀體系語(yǔ)料庫(kù)’,以這兩個(gè)示范庫(kù)建設(shè)整體打造出標(biāo)桿。在此基礎(chǔ)上,探索建設(shè)系列教育、語(yǔ)言文化國(guó)家新型語(yǔ)料庫(kù)群,服務(wù)教育強(qiáng)國(guó)、文化強(qiáng)國(guó)建設(shè)。”王暉表示。
值得關(guān)注的是,科研院所和高校也在發(fā)力數(shù)字中文建設(shè)。
“語(yǔ)言文字是文化的基礎(chǔ)要素和鮮明標(biāo)志,是文化傳承發(fā)展的重要載體,是國(guó)家軟實(shí)力的重要組成部分。北京大學(xué)王選計(jì)算機(jī)研究所將以數(shù)字中文建設(shè)為契機(jī),深化產(chǎn)學(xué)研用協(xié)同機(jī)制,進(jìn)一步發(fā)揮在人工智能、文字信息處理和字體設(shè)計(jì)領(lǐng)域的優(yōu)勢(shì),以發(fā)揮中文數(shù)據(jù)的賦能作用為著力點(diǎn),努力研發(fā)更多優(yōu)質(zhì)的中文字庫(kù),滿足社會(huì)用字需求,助力中文發(fā)揮立德樹(shù)人的基礎(chǔ)作用、傳承中華文化的根脈作用、推進(jìn)科技創(chuàng)新的支撐作用、賦能產(chǎn)業(yè)升級(jí)的關(guān)鍵作用,助力教育強(qiáng)國(guó)建設(shè)。”湯幟說(shuō)。
北京師范大學(xué)黨委常委、副校長(zhǎng)康震則提到,為積極應(yīng)對(duì)以大語(yǔ)言模型為代表的人工智能技術(shù)對(duì)教育變革帶來(lái)的新機(jī)遇、新挑戰(zhàn),北京師范大學(xué)發(fā)揮古籍整理智能化關(guān)鍵技術(shù)優(yōu)勢(shì),針對(duì)古漢語(yǔ)信息處理任務(wù)“低資源”“富知識(shí)”的特點(diǎn),以解決領(lǐng)域知識(shí)學(xué)習(xí)需求為核心任務(wù),使用1.8B(18億)參數(shù)量,訓(xùn)練出理解力強(qiáng)、準(zhǔn)確率高、應(yīng)用場(chǎng)景豐富的“AI太炎”古漢語(yǔ)大語(yǔ)言模型。
“下一步,北京師范大學(xué)將認(rèn)真貫徹落實(shí)《意見(jiàn)》,持續(xù)推動(dòng)學(xué)科交叉融合和協(xié)同創(chuàng)新,強(qiáng)化有組織科研,加快培養(yǎng)復(fù)合型人才,推進(jìn)國(guó)家關(guān)鍵領(lǐng)域語(yǔ)料庫(kù)和智能化關(guān)鍵技術(shù)研發(fā),探索大語(yǔ)言模型創(chuàng)新應(yīng)用新范式,為教育強(qiáng)國(guó)建設(shè)貢獻(xiàn)更多的智慧和力量。”康震表示。(記者 袁小康)
轉(zhuǎn)自:經(jīng)濟(jì)參考網(wǎng)
【版權(quán)及免責(zé)聲明】凡本網(wǎng)所屬版權(quán)作品,轉(zhuǎn)載時(shí)須獲得授權(quán)并注明來(lái)源“中國(guó)產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)”,違者本網(wǎng)將保留追究其相關(guān)法律責(zé)任的權(quán)力。凡轉(zhuǎn)載文章及企業(yè)宣傳資訊,僅代表作者個(gè)人觀點(diǎn),不代表本網(wǎng)觀點(diǎn)和立場(chǎng)。版權(quán)事宜請(qǐng)聯(lián)系:010-65363056。
延伸閱讀

版權(quán)所有:中國(guó)產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)京ICP備11041399號(hào)-2京公網(wǎng)安備11010502035964