2015年10月31日,自治區民委、財政廳在內蒙古大學組織召開2013年度自治區蒙古語言文字信息化專項扶持項目“蒙古語語言資源建設、信息化理論與相關技術研究”結項驗收會。
該項目是第一批立項實施的自治區蒙古語言文字信息化專項扶持項目,建設期為兩年。項目開發內容包括蒙古語言文字信息化基礎研究、蒙古語言文字資源庫建設和蒙古文信息處理言語工程技術研發3項內容。主要建設成果有:基礎研究方面,一是蒙古語言文字信息化基礎研究—基礎標準和規范的研制完善,對《信息技術 傳統蒙古文名義字符、變形顯現字符和控制字符使用規則》(GB 25914—2010)等七項標準進行了擴充和完善。二是在面向信息處理的蒙古語語義研究、面向信息處理的蒙古語句法研究等基礎理論研究方面取得了顯著成績(起草2項國家標準文本、出版2部專著,發表20余篇論文),其成果在蒙古語自然語言處理領域有較大的理論創新。蒙古語言文字資源庫建設方面,已完成的數據資源建設包括1000萬詞蒙古語粗加工語料庫、500萬詞蒙古語精加工語料庫和80萬句對的漢蒙、蒙漢平行語料庫;同時完成了“蒙古語知識詞典庫”(包括具有6萬個詞條,69個屬性字段的“蒙古語語義信息詞典”、 3.5萬條熟語,15個屬性字段,4個輔助庫的“蒙古語熟語知識庫”、有3萬棵樹的“蒙古語句法結構知識庫”等)。口語語料庫建設方面,已建立20個小時5個層次的標注庫、5個小時的語料韻律標注20小時的“喀爾喀方言口語語料庫”和“蒙古語口語韻律標注庫”以及“面向言語工程的蒙古語語音數據庫”。蒙古文信息處理工程技術研發方面,開發了包括蒙古語語料庫自動校對軟件、精加工語料庫軟件、詞法、短語、語義自動標注軟件、蒙古語語音識別、合成軟件以及蒙古語標準音自動檢測系統在內的蒙古語言資源加工系列軟件等。
經專家組認真聽取項目單位匯報、觀看成果演示,聽取項目監理單位監理意見,進行項目組答辯后,一致認為該項目內容涉及面廣,涵蓋蒙古語言文字信息化基礎理論研究、標準規范研制和軟件系統研發,涉及語言學、計算機科學等相關學科,工作量大,技術含量高。其研究成果具有重要的理論意義和應用價值,將對蒙古語言文字信息化事業起到有力的推動作用。
2015年10月31日,自治區民委、財政廳在內蒙古大學組織召開2013年度自治區蒙古語言文字信息化專項扶持項目“蒙古語語言資源建設、信息化理論與相關技術研究”結項驗收會。
該項目是第一批立項實施的自治區蒙古語言文字信息化專項扶持項目,建設期為兩年。項目開發內容包括蒙古語言文字信息化基礎研究、蒙古語言文字資源庫建設和蒙古文信息處理言語工程技術研發3項內容。主要建設成果有:基礎研究方面,一是蒙古語言文字信息化基礎研究—基礎標準和規范的研制完善,對《信息技術 傳統蒙古文名義字符、變形顯現字符和控制字符使用規則》(GB 25914—2010)等七項標準進行了擴充和完善。二是在面向信息處理的蒙古語語義研究、面向信息處理的蒙古語句法研究等基礎理論研究方面取得了顯著成績(起草2項國家標準文本、出版2部專著,發表20余篇論文),其成果在蒙古語自然語言處理領域有較大的理論創新。蒙古語言文字資源庫建設方面,已完成的數據資源建設包括1000萬詞蒙古語粗加工語料庫、500萬詞蒙古語精加工語料庫和80萬句對的漢蒙、蒙漢平行語料庫;同時完成了“蒙古語知識詞典庫”(包括具有6萬個詞條,69個屬性字段的“蒙古語語義信息詞典”、 3.5萬條熟語,15個屬性字段,4個輔助庫的“蒙古語熟語知識庫”、有3萬棵樹的“蒙古語句法結構知識庫”等)。口語語料庫建設方面,已建立20個小時5個層次的標注庫、5個小時的語料韻律標注20小時的“喀爾喀方言口語語料庫”和“蒙古語口語韻律標注庫”以及“面向言語工程的蒙古語語音數據庫”。蒙古文信息處理工程技術研發方面,開發了包括蒙古語語料庫自動校對軟件、精加工語料庫軟件、詞法、短語、語義自動標注軟件、蒙古語語音識別、合成軟件以及蒙古語標準音自動檢測系統在內的蒙古語言資源加工系列軟件等。
經專家組認真聽取項目單位匯報、觀看成果演示,聽取項目監理單位監理意見,進行項目組答辯后,一致認為該項目內容涉及面廣,涵蓋蒙古語言文字信息化基礎理論研究、標準規范研制和軟件系統研發,涉及語言學、計算機科學等相關學科,工作量大,技術含量高。其研究成果具有重要的理論意義和應用價值,將對蒙古語言文字信息化事業起到有力的推動作用。