非常抱歉,我们暂时无法提供预览,您可以试试: 免费下载 ISO 15706-1:2002 前三页,或者稍后再访问。
您也可以尝试购买此标准,
点击右侧 “购买” 按钮开始采购(由第三方提供)。
点击下载后,生成下载文件时间比较长,请耐心等待......
7月26日下午,深圳市龙岗区政府与北京大学数字视频编解码技术国家工程实验室、中关村视听产业技术创新联盟,在深圳市举行深圳龙岗智能视听研究院签约暨揭牌仪式。 据了解,智能视听产业是智能科技与数字视听产业渗透融合的新兴产业,是人工智能发展的核心基础,包括机器视觉,语音、图像识别,自然语言理解、跨媒体推理等智能与视听的融合,是深圳市重点培育和发展的新兴产业。 ...
据悉,智能视听产业是智能科技与数字视听产业渗透融合的新兴产业,是人工智能发展的核心基础,包括机器视觉,语音、图像识别,自然语言理解、跨媒体推理等智能与视听的融合,是深圳市重点培育和发展的新兴产业。...
听觉推理模型具体为将视觉特征输入编码器进行编码,利用解码器解码出对应的听觉特征,通过在生成的听觉特征与真实的听觉特征之间增加L2范数约束来更新该模型参数,并实现视觉特征到听觉特征的准确映射。模型在MSR-VTT、MSVD数据集上取得了理想的效果。 2.视听模态的生成 视听模态是视频中的两个共生模态,包含相同和互补信息。利用共同信息可实现模态间的相互转换。同时,互补信息可作为先验去辅助相关工作。...
Copyright ©2007-2022 ANTPEDIA, All Rights Reserved
京ICP备07018254号 京公网安备1101085018 电信与信息服务业务经营许可证:京ICP证110310号