11月19日,国内首个面向藏语场景的千亿级参数藏语基座大模型“阳光清言”V1.0在拉萨正式发布。该模型由中国工程院院士、西藏大学教授尼玛扎西团队与北京智谱华章科技有限公司联合研发,标志着我国在藏语人工智能领域取得重大突破。
“阳光清言”V1.0作为千亿参数级大模型,其训练数据规模达到288亿Token,涵盖新闻、法律、医学、哲学等多元领域的高质量藏语单语数据,以及汉藏、藏英平行语料和双语辞典条目。中国工程院院士尼玛扎西指出,该模型在藏语语义理解、文本生成及机器翻译等方面表现优异,能够精准处理复杂语言结构和跨领域知识。
值得注意的是,该模型不仅具备强大的藏语能力,还拥有卓越的汉语处理功能。研发团队成员洛桑嘎登表示,作为通用基座模型,“阳光清言”可支撑边疆治理、文化旅游、绿色能源等七大行业大模型的开发,重点解决边疆数智治理中的语言技术难题,提升民生服务智能化水平。
目前,研发团队正按照国家法规推进备案工作,预计近期将正式上线服务。该成果的发布,对提升我国藏语智能技术国际话语权、促进西藏高质量发展具有重要意义。
© 版权声明
文章版权归作者所有,未经允许请勿转载。