2020年11月13日,以“Connect·Collaborate·Accelerate”为主题,由浪潮和OCP基金会联合举办的第二届OCP China Day 暨OCP Tech Week全球技术峰会中国专场在北京望京凯悦酒店隆重开幕。百度携整机柜、OAI等多种解决方案亮相大会,与微软、浪潮、Facebook、阿里、腾讯等OCP社区领袖企业和数百位参会嘉宾一道,共同探讨开放计算在人工智能、边缘计算等新兴技术领域及未来数据中心基础设施层面的发展与应用。
OCP(Open Compute Project)是由Facebook联合英特尔、Rackspace等公司于2011年发起成立的非营利组织,作为全球影响力最大的开放计算社区, OCP旨在解决未来数据中心技术的标准化、产业化问题。目前在机架式和整机柜式高密度服务器、下一代数据中心管理架构等领域的开源项目已经实现了数百万的部署规模,人工智能、开源交换机操作系统等新领域的标准正在开放测试,是业内最有影响的开放技术项目。
整机柜,超大规模数据中心规模化应用
作为OCP 中国社区的重要成员,百度服务器资深系统工程师赵杰向与会者介绍了百度天蝎3.0整机柜以及中国开源整机柜技术与应用。
天蝎计划最早由百度在2011年推出并商用,经过近十年的积累沉淀和两次大版本的迭代升级,目前百度天蝎整机柜部署规模超2万柜,生态产值超200亿元。
天蝎3.0采用了全新的架构设计,在散热、供电、结构三个方面进行了技术革新。散热方面,同时布局多种散热技术,风冷可支持最大350W的CPU,同时风扇能耗降低了35%。供电方面,支持最高48V供电,单机柜最高功率密度可达36kW。结构上,兼容21inch/19inch设计,以及风冷液冷两种散热方式,模块化的快插设计,使成本降低了30%。
而这样的技术创新则离不开百度与浪潮的深度合作,在此基础上,不仅实现了整机柜的L11级高效交付,也刷新了多项纪录,2019年,百度与浪潮8小时完成1万台服务器部署,交付效率较机架式服务器提升20倍,为支撑2019年春晚红包项目发挥了关键作用。
OAI推动AI、5G开放创新
2019年,OCP社区成员百度、Facebook、微软、浪潮等共同发起OAI(Open Accelerator Infrastructure)项目,计划建立一套支持不同AI芯片的技术标准,涵盖结构设计、温度、管理、供电、硬件安全性、可用性等诸多方面。OCP大会现场,百度、浪潮、燧原科技等企业基于OAM标准的产品纷纷亮相。
百度系统架构师黎世勇表示,OAI标准不仅将极大提高不同AI硬件加速模块和系统的互操作性,更将加速新AI硬件加速模块的大规模落地应用,全球AI硬件生态系统都会从中受益。同时,为了更好地为上层各种各样的AI负载提供高效灵活的硬件算力,百度不仅积极参与构建了AI芯片昆仑、AI服务器X-MAN系列产品、AI通信加速组件Halo以及AI训练平台Kongming,并可搭配高效的分布式存储系统。
他还表示,百度X-MAN系列产品多项技术行业领先,如X-MAN1.0首次实现AI计算硬件解耦架构、X-MAN2.0首次将冷板式液冷散热技术应用到AI计算产品里、X-MAN3.0首次倡导模块化标准化设计,X-MAN4.0是首款实现支持OAI标准及液冷散热的AI计算产品。
最后,百度云边缘计算计算部总经理陈刚,带来了他对开放计算的看法。他表示,边缘计算依然处于初期阶段,而在此基础上产生的业务需求又非常的多样化,导致了对基础设施的需求也十分的多样化,并由此带来了一些技术方面的挑战。对此,他认为应该设立一个统一的标准,来规范整个基础设施,尤其是从物理形态上。这样对开放计算的标准化能起到一定的作用。
接下来他提到了关于对边缘计算的管控问题和平台调度问题,他认为边缘计算设备尚在发展初期,需要开放计算来给出指导,标准化相应的硬件规格,从而推进商业化进程并提高部署效率。
正是因为百度这样的优秀合作伙伴在软硬件技术上的革新与支持,才使得开放计算的生态不断丰富和完善,这样才能加快推动整个行业的发展和向传统行业落地。这也让更多合作伙伴和客户看到了开放计算的优秀成果和未来潜在的发展,为吸引更多厂商加入这一生态做出了贡献。
2020年初,一场突如其来的新冠肺炎疫情席卷全球,时至今日仍在影响着世界各国的经济发展和日常工作生活,迫使各行各业加速数字化转型的步伐。利用AI、5G、边缘计算等前沿技术为新型基础设施赋能,构建更灵活,更开放、更智能的开放数据中心,获得弹性、可扩展和成本效益等优势,是OCP长期以来的目标,也是本次大会“连接、协作、加速”主题的意义所在。
未来,百度将携手OCP和以浪潮为代表的社区合作伙伴一起,为开放计算产品带来更多创新,为客户创造更大价值。也希望能有更多像百度这样的优质合作伙伴,加入开放计算,加速开放计算生态的建设和完善。