分析测试百科网

搜索

喜欢作者

微信支付微信支付
×

让“无声”世界感受冬奥魅力

2022.2.04
头像

柔荑含莲

听君一席话,胜读十年书

编者按:奋进的中国再度点燃激情与梦想的圣火,世界翘首以待的北京冬奥会将于2022年2月4日开幕。

“水立方”变身“冰立方”、“百米级、分钟级”精准气象预报、国家速滑馆世界跨度最大的单层双向正交马鞍形索网屋面、5G信号覆盖所有场馆、8K比赛画面实时传输……科技冬奥是北京2022年冬奥会和冬残奥会的主要特色,是体现我国综合国力的舞台,更是实现高水平科技自立自强的舞台。

中国科协网开设“科技冬奥的背后故事”专题,挖掘冬奥高科技的幕后故事、幕后英雄,展现中国科协所属全国学会及广大科技工作者在“科技冬奥”中的拼搏、奉献、创新、超越,记录科技工作者助力北京冬奥冰雪史诗的感人故事。

 

数次联系左家平,她都在忙。

“我们一直在北京广播电视台做技术方面的沟通对接,估计到今年1月底才能圆满完成。”左家平回复说。

左家平是智谱AI公司的高级副总裁。作为课题组成员,左家平和中国计算机学会中文信息技术专业委员会副主任、清华大学教授、北京智源人工智能研究院副院长唐杰等人一起,研发了“手语播报数字人”系统。

基于该手语播报数字人,北京2022年冬奥会、冬残奥会举行时,听障人士将享受基于人工智能(AI)技术的精准手语播报服务。

“这个手语播报数字人将应用于北京2022年冬奥会、冬残奥会的赛事报道场景中,提供全流程智能化的数字人手语生成服务,用手语根据文字自动播报相关信息。”唐杰表示。

作为构建未来虚拟世界诸多应用的主干,如何创造栩栩如生的虚拟数字人,一直是计算机视觉、计算机图形学与多媒体等 AI 相关学科密切关注的重要研究课题。

“手语播报数字人能够方便听障人士收看赛事专题报道,提升他们的社会参与度和幸福感。”唐杰说。

事实上,手语播报数字人的研发离不开超大规模人工智能预训练模型的支持。这个手语播报数字人基于“悟道2.0”大模型开发,由“科技冬奥”专项支持,智谱AI、凌云光和北京广播电视台联合打造。

赋予手语播报数字人、科普机器人理解和表达知识的能力,是研发的难点。项目团队成员、清华大学计算机系博士生于济凡表示,科普机器人目前已经学习了百万级别的知识图谱,也接入了超大规模的中文预训练模型,相比很多其他智能问答类产品,进一步减少了人工规则,加强了智能学习和提升能力。

而让手语播报数字人这样一款创新产品真正应用于赛事报道中,也并非易事。“需要不断与电视台方面去沟通,进行技术调试,让手语播报数字人真正解决听障人士收看冬奥赛事的问题。”左家平说。

在工程实现上,团队也做了大量创新。项目团队成员、智谱AI工程师谭棋洋表示,为了增加机器人对人工智能模型的兼容性,并为机器人定制合适的动作,让它能在不同的场景用更准确合理的姿势增加交流的亲密性和表达的准确性,团队重构了机器人底层的交互逻辑。

“手语主要靠手势来传递信息,由于不同的人有不同的手势习惯,容易造成信息传递偏差。”唐杰介绍,人工智能可避免“千人千面”,始终保持统一。手语播报机器人能提供全流程智能化的精确播报服务,方便听障人士收看赛事专题报道。


中国科学报
仪器推荐
文章推荐