T/JSIA 0003-2020
基于强化学习的智能化决策系统标准

Intelligent Decision System Standard Based on Reinforcement Learning

2021-08

 

 

非常抱歉,我们暂时无法提供预览,您可以试试: 免费下载 T/JSIA 0003-2020 前三页,或者稍后再访问。

您也可以尝试购买此标准,
点击右侧 “购买” 按钮开始采购(由第三方提供)。

点击下载后,生成下载文件时间比较长,请耐心等待......

 

标准号
T/JSIA 0003-2020
发布
2020年
发布单位
中国团体标准
替代标准
T/JSIA 0003-2021
当前最新
T/JSIA 0003-2021
 
 
适用范围
1主要要求 1.1 环境要求 对不同的应用场景进行梳理,提供具有通用接口设计的仿真环境,允许比较不同的强化学习算法。并通过仿真环境测试实际系统。具体包括:环境的使用方式,环境对外统一的自定义接口规范等。 1.2 观察 强化学习是典型的“智能体-环境”循环实现,交互时智能体选择一个行动,环境返回一个观察和奖励值。 1.3 空间 用来描述有效的动作和观察,是环境的属性,智能体与环境交互时可以直接根据环境提供给系统的接口进行交互。 1.4 策略 策略的输入为状态和动作,并返回在输入状态的情况下采取输入动作的概率。 2 运行设计 2.1 环境配置 环境配置主要是对初始状态的基本环境信息进行配置,有加区分对不同状态进行学习和挖掘,提升强化学习算法实验的结果。 2.2 可视化展示 实时可视化展示当前场景的相关环境信息,便于开发人员观察效果,并对算法进行相应的调优工作。 2.3 交互规范 智能体与环境进行交互可分为两类:人机交互和自动交互。 a) 人机交互, 人根据系统设计相应的交互方式和系统进行交互,而机器则直接依据智能算法生成相应的策略进行输出,并在界面上动态显示。 b)  自动交互,交互双方则均是依据机器生成相应的策略进行输出,并在界面上动态显示,无需人的参与。 2.4 策略生成 策略生成模块则是针对不同的应用场景均内置相应的基准策略用于和设计的算法效果进行对比。 2.5 数据库存储  数据库操作模块的主要功能是对系统中的参数配置信息和数据文件进行存储,为策略生成模型的模型训练提供可靠数据。 3 使用性能要求 3.1 安全性 3.1.1 系统的安全分析、安全设计、安全使用、安全管理等,应该遵循下列的原则要求:  a)有限授权原则系统应能控制用户的使用权限,规定必要的最小授权范围,应能控制操作者的使用权限和使用等级,防止对系统信息的越权使用、修改和调阅;  b)全面确认原则系统应能对采集数据的合法性、输人数据的有效性、信息处理的正确性、传输数据的安全性等进行确认;  c)安全跟踪原则对系统的信息处理过程应设置完善的跟踪目标,具有安全的跟踪力,随不规范的操作可以自动记录并提示;  d)既要充分有效地把系统可能造成的危害减少到能承受的最小程度,又要避免付出与其效果不相称的过高的投资代价或系统资源代价,从而取得综合性的、最佳的安全。 3.1.2 系统应能对重要信息资料能够给予相应的操作权限,以防重要数据、文件等被破坏。 3.1.3 系统应具有防范计算机病毒产生、侵人和传播的能力。系统内的重要部位应有防病毒措施,重要程序和文件应设置禁写保护。 3.1.4 系统的电气安全、环境安全等要求应符合G881、G1295中的有关规定。 3.2 保密性 3.2.1 系统不能因用户有意或无意的不正当操作而破坏。 3.2.2 系统处在不保密环境时,应有严密的保护措施,确保系统内指挥信息、文电、情报 数据等在严格安全保密条件下传递、处理和使用。 3.2.3 系统对重要信息应采用加密技术进行保护。 3.2.4 系统加密软件本身应具有防拷贝、防改、防静态分析等自我保护措施。 3.3 可靠性 3.3.1 系统及分系统应规定定性要求和验收准则。可用故障模式与影响分析等方法,发现薄弱环节,采用工程保证,生产质量保证等措施,降低致命性故障发生的概早,保证系统的可靠性。 3.3.2 系统应采用冗余设计,必要时关键模块应采用双机备份,保证系统具备一定程度的容错性。

T/JSIA 0003-2020相似标准


推荐

大数据助力地球系统科学步入数字孪生

以上大数据分析方法弥补了传统方法在可预测性、可迁移性、可解释性和决策支持方面的不足,为推动智能化数字孪生地球(Digital Twin of Earth)建设提供了先进解决方案。文章认为,大数据同化是融合地球大数据和地球系统模型重要方法。...

基于深度强化学习机器人控制合作研究获进展

机器人在空间、陆地和水下等大量动态、非结构环境下作业是一个复杂任务,相比于传统工业机器人作业要求更高,通常需要机器人具有感知、导航、决策、操作等多种功能。  沈阳自动化所与爱丁堡机器人中心科研团队联合利用神经网络构建了一种机器人整体强化学习控制模型,采用深度学习方法对机器人相机获得环境与目标信息进行处理,然后将感知信息与机器人当前状态作为系统输入,对机器人整体行为进行自主控制。...

当我们谈论智能医疗时,我们在谈论什么?

如果是用户自己作出决策,用户有没有足够医疗知识?用户是否能在危急时刻保持冷静?  如果是医学专业人员作出决策,被削弱现代医学检查手段能否支撑这样决策?如果决策失误应该是责任事故还是技术事故?  如果这些问题我们都不能给出合理而肯定回答,基于个人医疗硬件智能化在近期内没有实现可能。  让我们回头看基于医院医疗智能化。  ...

要做自主决策AI,英国创业公司Prowler.io又融了1000万欧元

这家初创公司150万欧元(约 1167 万人民币)种子轮是在去年 9 月底融到。   Prowler.io 是由两名业界资深人士 Vishal Chatrath(CEO)和 Dongho Kim(CTO)创办。他们之前创办另一家人工智能初创公司 VocalIQ 被苹果公司收购。   该公司宣称要开发出一种崭新机器决策系统。该系统基于概率模型、强化学习、以及博弈论。...





Copyright ©2007-2022 ANTPEDIA, All Rights Reserved
京ICP备07018254号 京公网安备1101085018 电信与信息服务业务经营许可证:京ICP证110310号