GB 21023-2007
中文语音识别系统通用技术规范

General specification for Chinese speech recognition system

中文语音识别系统通用技术规范 是强制性国家标准，您可以免费下载。

非常抱歉，我们暂时无法提供预览，您可以试试：免费下载 GB 21023-2007 全文，或者稍后再访问。

您也可以尝试购买此标准，
点击右侧 “购买” 按钮开始采购（由第三方提供）。

注意：点击下载后，生成下载文件时间比较长，请耐心等待......

标准号: GB 21023-2007
发布: 2007年
发布单位: 国家质检总局
当前最新: GB 21023-2007

GB 21023-2007相似标准

T/QGCML 1908-2023 智能语音识别转文字系统技术规范 YD/T 4157-2022 车载通信终端语音识别功能技术要求和测试方法 GB/T 21024-2007 中文语音合成系统通用技术规范 T/QGCML 877-2023 中文语音合成系统通用技术规范 GB/T 36464.1-2020 信息技术智能语音交互系统第1部分：通用规范

推荐

谷歌助手超进化：可以同时识别两种语言了，AI空耳再无国界

启用LangID，两套语音识别系统同时工作，二者做出的判断最后要经过一轮评估。这一步，是由另外一个算法完成的。这个算法会给两个语音识别系统的判断结果，做个排名，决定要输出怎样的命令。当用户说完的时候，模型除了知道ta说了哪种语言，也要领会ta的意图。而评估步骤会增加处理成本，也会造成不必要的延时。反应慢，可能是语音助手最大的缺点了。所以，算法还需要优化。...

DCASE 2020权威声学比赛：腾讯多媒体实验室斩获双项指标国内第一

本次声学场景识别任务，涵盖机场、室内购物、地铁站台、街道行人、公共广场等10个通用声学场景。在现实生活中，这些通用声学场景，通常同时存在多个声音，并且会被环境噪声干扰。此次任务，通过研究来识别真实场景的声音场景和声音事件，对于让声音场景识别应用落地具有重要意义。声学场景识别就是利用机器学习模仿人脑，对周边的环境进行有效及时的判断。随着深度学习的高度演化，声学场景识别的正确率有了飞跃提升。...

人机交互的语音识别技术

但进入九十年代后，我国语音识别研究的步伐就逐渐紧追国际先进水平了，在“八五”、“九五”国家科技攻关计划、国家自然科学基金、国家863计划的支持下，我国在中文语音技术的基础研究方面也取得了一系列成果。...

国内首次！这家中国企业的语言AI实力被公认全球No.2！仅次于谷歌

在此基础上，达摩院融合了其自研的端到端语音识别技术SAN-M网络结构，打造出新一代的端到端中英自由说语音识别系统。最后的效果就是：阿里的语音AI能在没有语种信息的前提下，大幅提升中英文混说场景下的识别性能。△ SAN-M网络结构框架借鉴这套模型搭建思路，达摩院又解锁了“方言自由说”技能，打造了一套端到端方言自由说语音识别系统。...

Copyright ©2007-2022 ANTPEDIA, All Rights Reserved
京ICP备07018254号京公网安备1101085018 电信与信息服务业务经营许可证：京ICP证110310号