浪潮发布新版AIStation推理服务平台,可高效调度多元AI芯片

9月17日,在苏州举行的第四届全球人工智能产品应用博览会(AIExpo2021)上,浪潮发布新版AIStation人工智能推理服务平台,为快速发展的人工智能应用提供强大的服务管理支撑,并可统一高效调度多款国际国内领先的AI芯片的算力,帮助企业和智算中心充分发挥多元算力作用,加速AI应用场景落地。此次发布是为了应对日趋丰富的人工智能应用对多元化AI芯片算力的需求,以及智能计算中心日益复杂的异构计算资源管理调度挑战。

1.jpg

浪潮AIStation是业界领先的人工智能开发服务平台,可支持超过数千节点AI服务器的超大规模人工智能集群调度管理。基于容器化技术简化算力调度过程,帮助用户摆脱在大规模AI计算集群中进行算力选择、算力适配等繁杂工作,提高调度效率。实现资源敏捷调配,使得资源利用率得以大幅提升;强大的平台调度机制可以应对需求突发场景在几分钟内自动完成服务扩容;支持多源模型统一部署,模型部署时间从数天缩短到几分钟,从而实现业务快速上线。AIStation可支持百万级高并发的大规模AI推理服务场景,服务响应平均延迟低于1ms。

当前,日趋丰富的人工智能应用对多元化AI芯片算力的需求激增,驱动人工智能计算系统向多元算力计算架构转化。使用多种AI芯片的混合计算架构需求越来越多,这种需求在产业AI化、智算中心等大规模AI计算系统建设时更加迫切。然而,各种类型AI芯片的连接接入标准不同,用户在使用多元AI芯片系统时会遇到系统适配、芯片驱动、互联互通、功耗管理、安全传输、易用性等各类问题,给用户在部署多元AI芯片算力系统时提出巨大挑战。

针对当前多元化算力的应用困局,浪潮此次发布的新版AIStation推理服务平台实现了对英伟达、寒武纪、昆仑芯、高通等6家国际国内厂商的12款AI和GPU芯片的多元算力支持。AI芯片可通过适配浪潮提供的AI芯片算力接入规范即可快速接入AIStation平台,帮助用户降低对多元AI芯片的使用和管理难度。AIStation平台实现多元算力的统一管理及调度,为生产环境算力运行提供一致的监管功能,对GPU、MLU、XPU等AI芯片的性能状况、AI业务流量及响应延时进行实时监控,并根据监控数据进行分析、决策、执行操作,实现服务算力的自动调节、自适应推理业务突发资源扩展需求。

AIStation是业界首个支持多元AI芯片算力的人工智能服务平台,打通了多元AI芯片从接入、管理、调度、适配到应用的路径,通过构建AI芯片算力接入规范实现多元算力的标准化管理,为产业AI化和智算中心建设提供高效便捷的AI算力调度,让AI应用和AI服务更便捷,助力用户充分使用多元算力实现AI技术创新和落地。目前,浪潮AIStation推理服务平台已在诸多客户获得成功应用,在新基建、互联网、金融、保险、交通、手机通信、智能汽车、智慧城市等多个AI场景发挥着重要作用。

稿源:美通社

最新文章