认识AI硬体的开放架构-OAI&OAM,正凌为为OAM设计者提供高速I/O与OAM相关产品,共同迎接AI发展新挑战
在AI领域,开放加速器基础设施(OAI)是由全球最具影响力的开源硬体组织之一:开放计算项目(OCP)所设立的一个子组织。 自2019年起,OAI专注于定义适合大规模深度学习训练的AI加速卡形态,解决了多元AI加速卡形态和接口不统一的问题。 透过发布OAI-UBB(通用底板)1.0设计规范,OAI推动了AI加速硬体平台的标准化,使其能够无需修改即支援不同厂商的产品,显著提升了AI模组的扩展性和灵活性。
AI巨头们陆续采用的架构- OAM (Open Accelerator Module)
对于AI伺服器开发商来说,开放加速模组(OAM)带来了显著的好处。 由于AI加速晶片的多样化和专业化,开发商面临着更高的开发成本和较长的开发周期。 OAM的出现为这些开发商提供了一种高效且可扩展的解决方案,使他们能够更容易地整合新的AI加速器。 这不仅降低了进入门槛,还加快了产品的市场推广时间。
OAM带来的优点与挑战
OAM有着三项显著优点,使其在当今快速发展的AI市场中显得尤为重要。
1.高效能与效率:OAM能显著提高处理的性能和效率,对于需求高算力的应用,如深度学习和机器学习,表现特别突出。
2.可扩展性:OAM设计允许在不同的系统和基板之间实现灵活的兼容性和扩展性,从而能够适应不断进步的高算力负载和技术发展。
3.支持多样的应用场景:OAM适用于多种领域,包括AI推理、科学模拟以及数据分析等,这种多样性使其能够满足广泛的业务需求。
这些优点展示了OAM在现代数据中心和高性能计算环境中的应用潜力和灵活性。
但是与此同时,采用OAM也需要面对几项挑战。
1.技术和设计复杂性:当前专用的AI硬体系统在技术和设计上相当复杂,这使得将新的AI加速器整合到系统中通常需要6到12个月的时间,从而阻碍了新竞争技术的快速采纳。
2.高功耗管理:随着OAM产品设计功率的增加,达到600W以上时Base Specification已经建议采用液体冷却技术,这表示高功耗管理是一大挑战,特别是在未来功率可能轻易超过700W的情况下。
3.标准化和兼容性:AI加速器的快速演进和多样性对于标准化和兼容性有更高的要求,以支持各种硬体加速解决方案的可扩展性和模块间的高速通信链接。
正凌能为OAM设计者做什么?
正凌为市场上少数同时拥有高速传输、机构设计与散热模组的方案商。 已经为市场上几家领导AI晶片设计者提供高速I/O与OAM相关产品。 对于OAM的设计,正凌总结出两项常见的挑战:
1. 配合散热的结构设计:Top Stiffener with Thermal Solution
Top Stiffener 虽然在Base Specification中着墨甚少,但却需要良好的结构设计来配合OAM设计,否则会直接影响散热的效率。 好的Top Stiffener设计包括良好的支撑与导热,才能让air-cooling solution 例如3U 或是4U高度的3D VC充分发挥功效。 面对超过600W TDP的下一世代方案,还需要整合Cold plate的liquid cooling 。 这些都考验制作厂商在机构设计、材料选择以及对散热技术的了解才能实现。
2. 加工工艺上的挑战:OAM Bottom Stiffener
OAM与UBB连接不良是实务上最常见的问题,而连接不良往往来自于对于OAM Bottom Stiffener的轻忽。 OAM普遍采用的是Mirror Mezz Pro Connector,在Base Specification里提到的公差必须维持在± 0.15mm,但由于组装能力以及加工能力的差异,不良的Bottom Stiffener往往会导致最终组装公差过大或是两端 不平均导致连接不良。 无论是多优秀的AI晶片。
结语
AI相关的技术在近年来发展突飞猛进,带来的挑战更是跨领域的。 正凌在与AI领导者一起克服种种困难的同时,更加深刻体会到要实现让人惊艳的AI表现背后,每一个小细节都至关重要。 也希望所累积的各种经验与能力,能够为更多的AI产品开发者解决问题,让这个改变人类文明的技术能够更加便利的为所有人使用。
- |
- +1 赞 0
- 收藏
- 评论 0
本文由walkonair转载自正凌官网,原文标题为:认识AI硬体的开放架构-OAI & OAM,本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
相关研发服务和供应服务
相关推荐
中石科技散热解决方案,助力AI算力端侧技术迭代
AI硬件设备对综合散热解决方案带来更高性能的求,进而催生出更大的散热应用市场。作为国内散热行业主流企业,中石科技散热解决方案及核心材料、器件可应用于AI算力端侧四大细分领域:AI终端,AI算力中心,智能汽车,医疗设备等,公司服务于以上领域多家主流头部客户,如北美大客户、H客户、荣耀、迈瑞医疗等。
【应用】正凌推出QSFP28等连接器用于英伟达DGX A100,速度100Gb/s~400Gb/s,具有出色的散热设计
Nextron的产品系列包括QSFP+、QSFP28和QSFP-DD连接器,速度范围从100Gb/s到400Gb/s。它们具有出色的散热设计,可确保高速信号的完整性。我们提供1x1和1x4配置,支持多端口和单端口应用。
【应用】触点额定电流最大为0.5A的连接器助力RRU设备提供高效散热,解决热设计难题
客户RRU设备在选用光模块CAGE时发现散热较差, 原因为CAGE与模块之间为间隙配合,仅很少部分接触。给客户推荐了正凌的SFP 28 CAGE,顶部凹陷式设计,与光模块过盈配合,增加散热面积,提高散热效率。
世强硬创携6G/AI服务器/新能源等十二大主题新产品亮相2024慕尼黑上海电子展
十二大主题展区涵盖6G&AI&服务器、功率半导体、电气自动化、新材料、电源&显示屏、传感技术、汽车电子&EV、新能源&电力、IOT&智能家居等新产品新技术新方案。
正凌(Nextron)高速光电连接器选型指南
目录- Company Profile and Test Capabilities Connector Application Connector Customized-Solutions High Speed I/O Connector Overview SFP series High Speed Connector QSFP series High Speed Connector MiniSAS HD series High Speed Connector Dust/EMI Covers
型号- Z-H03B0011**000,Z-8420011**0001,Z-855**10000*10,Z-834B***P****1,Z-834E***P****1,Z-861E0**00**01,Z-828***000D0*0,Z-844E0**P0***1,Z-861T0**00**01,Z-8560**1000000,Z-8350011**0001,Z-840B000020000,Z-828***000**00,Z-848T***P****1,Z-8670011**0001,Z-868**0***0**0,Z-830B000100000,Z-83220S00****0,Z-848B***P*00*1,Z-848E***P*00*1,Z-H02R0111**0R0,Z-8270000*0*000,Z-H02R0111**1R0,Z-85020S******0,Z-824**1000***0,Z-844T0**P0**01,Z-S892000*0B22,Z-854***000***0,Z-834T********1,Z-S891000*0B22
认识AI硬体的开放架构
在AI领域,开放加速器基础设施(OAI)是由全球最具影响力的开源硬体组织之一:开放计算项目(OCP)所设立的一个子组织。自2019年起,OAI专注于定义适合大规模深度学习训练的AI加速卡形态,解决了多元AI加速卡形态和接口不统一的问题。
【产品】正凌提供400G高速连接与散热解决方案QSFP112,每条通道皆可支援112Gb/s
大型数据中心对资料传输速度的要求不断提升,正凌推出QSFP模组QSFP112,每条通道皆可支援112Gb/s并可向后兼容QSFP56及QSFP28;在不重建网路结构的前提下,该产品是升级频宽最具成本效益的方式,也是迈向800G通讯的垫脚石。
宜科(ELCO)FX20系列插片式IO产品选型指南
描述- 天津宜科自动化股份有限公司是中国工业自动化的领军企业,于2003年在天津投资成立,销售和服务网络覆盖全国。作为中国本土工业自动化产品的提供商和智能制造解决方案的供应商,宜科在汽车、汽车零部件、工程机械、新能源、物流设备、食品制药、印刷包装、纺织机械、电子制造等诸多领域占据领先地位。
型号- FX20-CNT-BB00,FX20-GW-EC00,FX20-DO-BH00,FX20-DI-BL60,FX20-DO-BF00,FX20-DI-BF60,FX20-DO-BL00,FX20-DI-BH60,FX20-AO-BF60,FX20-AI-BD80,FX20-AI-BF60,FX20-AI-BD60,FX20-GW-PN00,FX20-DO-BH50,FX20-DO-BF50,FX20-DO-BL50,FX20-SCM-BB00,FX20,FX20-AO-BD60,FX20-PS-AB00,FX20-AI-BD90,FX20-GW-EP00,FX20-LKM-BD00,FX20系列,FX20-GW-CE00
正凌携高速连接器、液体冷却解决方案探索高效能运算的未来
作为高速运算技术的伙伴企业,正凌了解 I/O 和高速运算的要求,能够提供灵活的解决方案,以适应不同的机箱设计。 可以说,正凌正在引领这场革命,利用液体冷却和 3D Vapor Chamber(3D VC)等技术的进步,满足高效能运算应用不断发展的需求。
宜科LogicX1 & X3可编程控制器
描述- 天津宜科自动化股份有限公司提供工业自动化产品及解决方案,涵盖总线I/O系统、测量识别传感器、旋转编码器、PLC等。公司产品包括LogicX1通用中型PLC和LogicX3中型运动控制器,满足不同自动化设备需求。此外,宜科还提供多种I/O模块,包括数字量、模拟量、温度测量等,以及串口通讯、高速计数、IO-Link等模块。公司致力于工业互联网领域,提供云工业互联网平台,助力企业实现数字化转型升级。
型号- FX20-CNT-BB00,FX20-PGM-BA00,FX20-DO-BH00,FX20-DI-BL60,FX20-DO-BF00,FX20-DI-BF60,FX20-DO-BL00,FX20-DI-BH60,FX20-AO-BF60,FX20-AI-BD80,FX20-AI-BF60,FX20-AI-BD60,FX20-DO-RF50,FX20-DO-BH50,FX20-DO-BF50,LOGICX1-008N001,FX20-DO-BL50,FX20-DO-RF00,FX20-SCM-BB00,FX20-AO-BD60,FX20-PS-AB00,FX20-AI-BD90,LOGICX1,LOGICX3,FX20-LKM-BD00
“冷静卫士”意兆电子授权世强硬创,代理通讯/消费/汽车领域散热器
意兆电子的高速连接器具有信号质量好、兼容性好、可实现高速数据传输、环境适应性好等优势。
【材料】大图热控全新液冷板DTC-1500,实现千瓦级芯片散热能力,满足高算力服务器产业日益增长的散热需求
当芯片功耗提升到700W以上、热流密度超过100W每平方厘米时,传统液冷板也面临严重挑战,大图热控开发出的全新液冷板DTC-1500,成功突破了传统液冷板的散热瓶颈,实现了千瓦级的芯片散热能力。目前大图热控也已着手开发针对最新一代BlackWell系列GPU芯片的高效液冷板解决方案,以应对AI大模型训练等高算力服务器产业日益增长而产生的散热需求。
Nextron正凌提供卡扣式翅片散热器、热管散热器助力应对5G应用不断提高的散热挑战
通讯中5G相关电子设备互连系统将是“耗电大户”散热技术若能升级将能赋能“新基建”的巨大能量。Nextron正凌将分享两种有效的方法在I/O高速连接器QSFP-DD上进行散热,这两种方法都通过系统验证(例如气流和机械装配)配合整合技术、工艺、材料到整体体设计中来优化热性能。
电子商城
现货市场
服务
提供稳态、瞬态、热传导、对流散热、热辐射、热接触、和液冷等热仿真分析,通过FloTHERM软件帮助工程师在产品设计初期创建虚拟模型,对多种系统设计方案进行评估,识别潜在散热风险。
实验室地址: 深圳 提交需求>
使用FloTHERM和Smart CFD软件,提供前期热仿真模拟、结构设计调整建议、中期样品测试和后期生产供应的一站式服务,热仿真技术团队专业指导。
实验室地址: 深圳 提交需求>
登录 | 立即注册
提交评论