金年会中新社西宁5月25日电 (记者 孙睿)记者25日从青海师范大学省部共建藏语智能信息处理及应用国家重点实验室获悉,该实验室已初步建成600TF算力的智算平台和面向多领域多用途的大规模藏语数据资源库。
青海师范大学省部共建藏语智能信息处理及应用国家重点实验室2021年2月经中国科技部批准建设,是中国唯一的藏语信息处理领域国家重点实验室。实验室拥有5000平方米的科研用房和1.5亿元人民币的专业研发设备。
该实验室主任赵海兴介绍,近年来金年会金年会,实验室构建了藏文百科知识金年会、新闻、经济、文化艺术等多领域文本语料40G以上,藏语语音数据15000小时、各类文化资源近2万件,规模达到1600GB,是目前国内外最大的基于国标的大型标注语料库金年会,对中国涉藏地区教育、语言研究以及社会文化发展起到积极推动作用。
同时,该实验室还构建了大规模藏汉平行语料库,并通过迭代式回译策略等进行数据增强及质量评价,训练了融合单语语言模型和注入双语词典信息的深度神经网络翻译模型,在新闻、法律等领域准确率达90%以上。
此外,该实验室还搭建藏文文献资源数字化协同工作平台,构建文献图文对照数据150余万文本行,复杂场景图文资源220万个,开展藏文印刷字体、复杂场景藏文区域检测研究,自动检测视频帧中的文字区域,并将其分割成单个字符或行文本。利用深度学习对分割处理后的文本进行识别,实现了藏文文献标准体和手写体扫描识别系统、藏语视频流复杂场景中的藏文识别。(完)
想爆料?请登录《阳光连线》()、拨打新闻热线,或登录齐鲁网官方微博(@齐鲁网)提供新闻线索。齐鲁网广告热线,诚邀合作伙伴。
中新社金边5月25日电当地时间5月25日,中国援助柬埔寨国王工作队物资交接仪式在金边王宫举行。中国驻柬埔寨大使王文天与柬埔寨国王诺罗敦·...[详细]
新华社深圳5月25日电题 凝聚思想共识担负新的文化使命——2024文化强国建设高峰论坛综述 新华社记者周科 聚集最强大脑,发出文化...[详细]
中新网北京5月25日电人工智能可否追踪他人心理状态。施普林格·自然旗下专业学术期刊《自然-人类行为》最新一期发表一篇人工智能研究论文显...[详细]
中国运营商发布首个支持30种方言混说语音大模型。25日,在第七届数字中国建设峰会上,中国电信人工智能研究院发布业内首个支持30种方言自由...[详细]
新华社北京5月25日电25日至27日,南方地区预计将有一次强降雨过程。受降雨影响,珠江、长江等流域的多条河流可能发生超警洪水,暴雨区内部...[详细]
中新网重庆5月25日电记者25日从重庆市应急管理局获悉,预计25日夜间至26日白天,重庆西部和东南部部分地区有暴雨,局地大暴雨。重庆市防汛...[详细]
新华社北京5月25日电题 飞驰吧,满载希望的中欧班列 新华社记者谢彬彬 25日上午,随着X8157次中欧班列从西安国际港站开出金年会,中欧...[详细]
5月25日,中欧班列蓉欧速达运输模式班列满载55柜彩电、零配件、鞋类服饰等货物从成都国际铁路港发车。此趟班列将从阿拉山口口岸出境,经哈...[详细]
中新社厦门5月25日电2024年第十七届“嘉庚杯”“敬贤杯”海峡两岸龙舟赛暨第九届中国龙舟拔河公开赛25日在厦门集美龙舟池展开角逐,两岸42...[详细]
“青海是西洽会的‘老朋友’,今年现场的火热程度超过我们预期。”新时代推动西部大开发座谈会后,首场以西部为主题的国际展会——第六届中...[详细]