國家語言資源監(jiān)測與研究平面媒體中心(National Print Media Language Resources Monitoring & Research Center)成立于2004年6月,是教育部語言文字信息管理司與北京語言大學(xué)共建的研究中心。中心以科學(xué)研究為核心,以語言資源建設(shè)為根本,以服務(wù)國家服務(wù)社會為宗旨,有組織地開展科學(xué)研究,進(jìn)行人才培養(yǎng),努力推進(jìn)語言文字信息化發(fā)展。
中心長期開展語言監(jiān)測與研究、語言信息處理、社會計算、語言教育技術(shù)等交叉學(xué)科方向的研究工作。面向國家語言資源監(jiān)測與研究重大需求,中心持續(xù)性建設(shè)動態(tài)流通語料庫(Dynamic Circulating Corpus, DCC),建成了實時動態(tài)更新、歷時共時與領(lǐng)域地域體系化分布、形式正確、內(nèi)容安全的高質(zhì)量大規(guī)模語言資源,保障了國家語言資源監(jiān)測任務(wù)的實施:每年向社會發(fā)布媒體用字用語調(diào)查;支持了年度“漢語盤點”以及科技、教育、反腐領(lǐng)域年度盤點;為國家語言政策的制定提供數(shù)據(jù)基礎(chǔ),為語言生活、語言教學(xué)、語言信息處理提供服務(wù)。
中心在資源建設(shè)的基礎(chǔ)上,積極對接國家任務(wù)。支持了國務(wù)院公布的《通用規(guī)范漢字表》的研制;為外語中文譯寫部際聯(lián)席會議提供數(shù)據(jù)提取服務(wù);在語信司的指導(dǎo)下,中心研發(fā)了全球首個多語種冬奧會術(shù)語庫、《冬奧體育項目名詞》,在2022北京冬奧會籌備、舉辦期間發(fā)揮了重要作用,獲得國際奧委會巴赫主席的簽名感謝;在國家語言資源服務(wù)平臺上建構(gòu)了語言翻譯服務(wù)板塊,創(chuàng)新性地實現(xiàn)了回譯功能,提供了獨特的翻譯質(zhì)量評估服務(wù)。
中心圍繞語言文字信息化工作開展智能語言生活的調(diào)查跟蹤,提交資政報告多份,獲得黨和國家領(lǐng)導(dǎo)人、國家語委科研規(guī)劃領(lǐng)導(dǎo)小組批示或采納。
中心圍繞文本內(nèi)容計算、智能輔助語言學(xué)習(xí)、價值計算、大語言模型語言能力評測等方面開展研究。開發(fā)了“文心”語料檢索平臺、中文文本特征計算平臺、各類評測數(shù)據(jù)集等具有特色的語言資源服務(wù)平臺,獲得良好的社會反響。近五年在領(lǐng)域內(nèi)國際、國內(nèi)頂級會議、SCI/SSCI一區(qū)、二區(qū)國際期刊、國內(nèi)CSSCI期刊、核心期刊上發(fā)表論文余80篇,獲得專利12項。
