近日,昆仑芯(北京)科技有限公司的第二代云端通用人工智能计算处理器昆仑芯2代AI芯片及AI加速卡与飞桨完成III级兼容性测试,兼容性表现良好。
本次III级兼容性测试完成了包括PP-YOLOE、PP-OCR、ERNIE 3.0、PP-TSM、PP-TTS、DLRM、PPO等51个模型[1]的完整验证,算子支持超过400个,覆盖了智能视觉、自然语言处理、智能语音、智能推荐、强化学习共5个技术领域。
经双方联合严格测试,昆仑芯2代AI芯片及AI加速卡与飞桨兼容性表现良好,并基于R200、R300搭建了CI/CD持续集成流水线,整体运行稳定,训练与推理性能可以满足用户的应用需求。
未来两周,来自昆仑芯科技及百度飞桨的产品技术专家将带来两场线上直播,分别从落地应用案例及技术适配的角度对昆仑芯与飞桨III级适配进行深度解读,敬请期待。
昆仑芯和飞桨的适配自2018年启动,目前双方已共同完成框架层面的适配,支持XPU Device及大部分算子。在双方合作的训练部分中,昆仑芯XPU和飞桨的适配在一些场景下能够做到通过仅切换一行代码便可指定到昆仑芯XPU的后端,低成本地从GPU切换到昆仑芯,满足绝大部分用户的需求。目前,昆仑芯软件栈已集成到飞桨上,完成对接与支持。此外,双方已经完成了多款主流CPU及操作系统的适配,方便广大开发者和用户更高效、更便捷地开发。
2021年8月,高度集成昆仑芯AI加速卡的飞桨一体机在单PCIe switch下支持两块全高全长AI加速卡并行训练的技术。该适配使得飞桨一体机在算力和安全性方面得到进一步保障,同时也为AI服务器的加速发展提供了更多可能性。同年,飞桨一体机在金融行业成功部署落地,助力江苏银行进行证照识别能力的建设。
除此之外,在工业质检领域,"昆仑芯+飞桨"方案也实现了自研AI芯片在工业领域的大规模应用,助力某客户实现成本降低65%、性能提升9%的明显效果。
从底层AI算力组件到AI服务器,再到操作系统,进一步到昆仑芯SDK,四年来,昆仑芯和飞桨携手共同完成了一套端到端的AI计算系统解决方案,并致力于携手打造一个全栈式软硬一体的AI生态。
昆仑芯科技相关负责人表示:"未来,昆仑芯和飞桨将进一步深化合作,携手提升软硬件创新能力,为开发者提供灵活便捷的部署方案,赋能更多企业和政府机构实现智能化升级。"
关于昆仑芯科技
昆仑芯科技在国内最早布局AI加速领域,已深耕10余年,在体系结构、芯片实现、软件系统和场景应用等方面均有深厚积累。100%自研核心架构昆仑芯XPU,可实现灵活适配,满足多样的AI模型和场景需求。最优的性能和能耗效率,为开发者提供灵活易用的编程模型。
目前,公司两代芯片产品均已实现扎实落地,在互联网、智慧城市、智慧工业、智慧金融、智慧交通、科研等"智慧+"场景实现数万片部署。秉承"让计算更智能"的使命,昆仑芯科技致力于构建软硬一体化的AI芯片生态,打造从芯片到终端、应用、云端、服务的生态闭环。
[1]飞桨与昆仑芯2代芯片支持的模型列表:https://www.paddlepaddle.org.cn/documentation/docs/zh/develop/guides/hardware_support/xpu_docs/paddle_2.0_xpu2_cn.html
稿源:美通社