据曙光公司总裁助理李斌介绍,曙光全新的PHANERON云端服务器可以支持2-10块寒武纪MLU处理卡,可灵活应对不同的智能应用负载。以升级版的PHANERON-10为例,单台专用服务器可集成10片寒武纪人工智能处理单元,可以为人工智能训练应用提供832T半精度浮点运算能力,为推理应用提供1.66P整数运算能力。 “这是非常惊人的计算能力。”...
Caffe-MPICaffe-MPI是全球首个集群并行版的Caffe深度学习计算开源框架,针对高性能计算系统设计使之具备良好的并行扩展性。新版本在4节点16块GPU卡集群系统上训练性能较单卡提升13倍,其每秒处理图片数量是同配置集群运行的TensorFlow 1.0的近2倍。Caffe-MPI设计了两层通信模式,非常适合现在的高密度GPU服务器。...
Copyright ©2007-2022 ANTPEDIA, All Rights Reserved
京ICP备07018254号 京公网安备1101085018 电信与信息服务业务经营许可证:京ICP证110310号