非常抱歉,我们暂时无法提供预览,您可以试试: 免费下载 ITU-T G.107 AMD 1-2006 前三页,或者稍后再访问。
您也可以尝试购买此标准,
点击右侧 “购买” 按钮开始采购(由第三方提供)。
点击下载后,生成下载文件时间比较长,请耐心等待......
例如,如果目标是使阻力系数Cd(t)实时最小化,瞬时奖励方程Rt则可以定义为 那么DDPG算法中相应的Q值方程Qπ 可表示为特定策略下未来奖励的预期折现额:式中,E 表示计算期望的数学运算符,rt =EπRt 。γ表示时间上的折扣因子,其值通常在0~1范围内。s和a分别表示当前状态和动作。我们需要在每个时间步骤通过优化来优化。换句话说,时间t的最优建筑配置会最大化其价值函数。...
4.内蒙古地区多年大气可降水量及其转化效率研究………………王慧清付亚男 包福祥 孟雪峰 5.额济纳旗典型地表沙尘释放潜力及沙尘天气频发成因………………李宽贾晓鹏 熊鑫 王海兵 李钢铁6.西藏高海拔地区气象数据缺失条件下的ET0计算研究………………汤鹏程 徐冰 高占义高晓瑜7.一种基于SWAT模型的干旱牧区生态脆弱性评价方法-----以艾布盖河流域为例………………宋一凡...
Copyright ©2007-2022 ANTPEDIA, All Rights Reserved
京ICP备07018254号 京公网安备1101085018 电信与信息服务业务经营许可证:京ICP证110310号