GB 21023-2007
中文语音识别系统通用技术规范

General specification for Chinese speech recognition system


 

 

非常抱歉,我们暂时无法提供预览,您可以试试: 免费下载 GB 21023-2007 全文,或者稍后再访问。

您也可以尝试购买此标准,
点击右侧 “购买” 按钮开始采购(由第三方提供)。

点击下载后,生成下载文件时间比较长,请耐心等待......

 

标准号
GB 21023-2007
发布
2007年
发布单位
国家质检总局
当前最新
GB 21023-2007
 
 

GB 21023-2007相似标准


推荐

谷歌助手超进化:可以同时识别两种语言了,AI空耳再无国界

启用LangID,两套语音识别系统同时工作,二者做出的判断最后要经过一轮评估。这一步,是由另外一个算法完成的。这个算法会给两个语音识别系统的判断结果,做个排名,决定要输出怎样的命令。当用户说完的时候,模型除了知道ta说了哪种语言,也要领会ta的意图。而评估步骤会增加处理成本,也会造成不必要的延时。反应慢,可能是语音助手最大的缺点了。所以,算法还需要优化。...

DCASE 2020权威声学比赛:腾讯多媒体实验室斩获双项指标国内第一

本次声学场景识别任务,涵盖机场、室内购物、地铁站台、街道行人、公共广场等10个通用声学场景。在现实生活中,这些通用声学场景,通常同时存在多个声音,并且会被环境噪声干扰。此次任务,通过研究来识别真实场景的声音场景和声音事件,对于让声音场景识别应用落地具有重要意义。声学场景识别就是利用机器学习模仿人脑,对周边的环境进行有效及时的判断。随着深度学习的高度演化,声学场景识别的正确率有了飞跃提升。...

人机交互的语音识别技术

但进入九十年代后,我国语音识别研究的步伐就逐渐紧追国际先进水平了,在“八五”、“九五”国家科技攻关计划、国家自然科学基金、国家863计划的支持下,我国在中文语音技术的基础研究方面也取得了一系列成果。...

国内首次!这家中国企业的语言AI实力被公认全球No.2!仅次于谷歌

在此基础上,达摩院融合了其自研的端到端语音识别技术SAN-M网络结构,打造出新一代的端到端中英自由说语音识别系统。最后的效果就是:阿里的语音AI能在没有语种信息的前提下,大幅提升中英文混说场景下的识别性能。△ SAN-M网络结构框架借鉴这套模型搭建思路,达摩院又解锁了“方言自由说”技能,打造了一套端到端方言自由说语音识别系统。...





Copyright ©2007-2022 ANTPEDIA, All Rights Reserved
京ICP备07018254号 京公网安备1101085018 电信与信息服务业务经营许可证:京ICP证110310号