认识AI硬体的开放架构
在AI领域,开放加速器基础设施(OAI)是由全球最具影响力的开源硬体组织之一:开放计算项目(OCP)所设立的一个子组织。自2019年起,OAI专注于定义适合大规模深度学习训练的AI加速卡形态,解决了多元AI加速卡形态和接口不统一的问题。
透过发布OAI-UBB(通用底板)1.0设计规范,OAI推动了AI加速硬体平台的标准化,使其能够无需修改即支援不同厂商的产品,显著提升了AI模组的扩展性和灵活性。
AI巨头们陆续采用的架构-OAM (Open Accelerator Module)
对于AI伺服器开发商来说,开放加速模组(OAM)带来了显著的好处。由于AI加速晶片的多样化和专业化,开发商面临着更高的开发成本和较长的开发周期。OAM的出现为这些开发商提供了一种高效且可扩展的解决方案,使他们能够更容易地整合新的AI加速器。这不仅降低了进入门槛,还加快了产品的市场推广时间。
OAM带来的优点与挑战
OAM有着三项显著优点,使其在当今快速发展的AI市场中显得尤为重要。
1.高效能与效率:OAM能显著提高处理的性能和效率,对于需求高算力的应用,如深度学习和机器学习,表现特别突出。
2.可扩展性:OAM设计允许在不同的系统和基板之间实现灵活的兼容性和扩展性,从而能够适应不断进步的高算力负载和技术发展。
3.支持多样的应用场景:OAM适用于多种领域,包括AI推理、科学模拟以及数据分析等,这种多样性使其能够满足广泛的业务需求。
这些优点展示了OAM在现代数据中心和高性能计算环境中的应用潜力和灵活性。
但是与此同时,采用OAM也需要面对几项挑战
1.技术和设计复杂性:当前专用的AI硬体系统在技术和设计上相当复杂,这使得将新的AI加速器整合到系统中通常需要6到12个月的时间,从而阻碍了新竞争技术的快速采纳。
2.高功耗管理:随着OAM产品设计功率的增加,达到600W以上时Base Specification已经建议采用液体冷却技术,这表示高功耗管理是一大挑战,特别是在未来功率可能轻易超过700W的情况下。
3.标准化和兼容性:AI加速器的快速演进和多样性对于标准化和兼容性有更高的要求,以支持各种硬体加速解决方案的可扩展性和模块间的高速通信链接。
正凌能为OAM设计者做什么?
正凌为市场上少数同时拥有高速传输、机构设计与散热模组的方案商。已经为市场上几家领导AI晶片设计者提供高速I/O与OAM相关产品。对于OAM的设计,正凌总结出两项常见的挑战:
1.配合散热的结构设计:Top Stiffener with Thermal Solution
Top Stiffener虽然在Base Specification中着墨甚少,但却需要良好的结构设计来配合OAM设计,否则会直接影响散热的效率。好的Top Stiffener设计包括良好的支撑与导热,才能让air-cooling solution例如3U或是4U高度的3D VC充分发挥功效。面对超过600W TDP的下一世代方案,还需要整合Cold plate的liquid cooling 。 这些都考验制作厂商在机构设计、材料选择以及对散热技术的了解才能实现。
2.加工工艺上的挑战:OAM Bottom Stiffener
OAM与UBB连接不良是实务上最常见的问题,而连接不良往往来自于对于OAM Bottom Stiffener的轻忽。OAM普遍采用的是Mirror Mezz Pro Connector,在Base Specification里提到的公差必须维持在±0.15mm,但由于组装能力以及加工能力的差异,不良的Bottom Stiffener往往会导致最终组装公差过大或是两端不平均导致连接不良。无论是多优秀的AI晶片。
结语
AI相关的技术在近年来发展突飞猛进,带来的挑战更是跨领域的。正凌在与AI领导者一起克服种种困难的同时,更加深刻体会到要实现让人惊艳的AI表现背后,每一个小细节都至关重要。也希望所累积的各种经验与能力,能够为更多的AI产品开发者解决问题,让这个改变人类文明的技术能够更加便利的为所有人使用。
- |
- +1 赞 0
- 收藏
- 评论 0
本文由咪猫转载自正凌,原文标题为:认识AI硬体的开放架构,本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
相关推荐
Understanding the Open Architecture of AI Hardware: OAI & OAM
NEXTRON is one of the few market solution providers with expertise in high-speed transmission, structural design, and cooling modules. It has already provided high-speed I/O and OAM-related products to several leading AI chip designers.
【技术】虚拟示波器相较于传统仪器的优势分析
虚拟示波器是在PC技术的基础上发展起来的,所以*“继承”了以现成即用的PC技术为主导的新商业技术的优点,包括功能超卓的处理器和文件I/O,使您在数据导入磁盘的同时就能实时地进行复杂的分析。 随着数据传输到硬驱功能的不断加强,以及与PC总线的结合,高速数据记录已经较少依赖大容量的本地内存。
正凌(Nextron)高速光电连接器选型指南
目录- Company Profile and Test Capabilities Connector Application Connector Customized-Solutions High Speed I/O Connector Overview SFP series High Speed Connector QSFP series High Speed Connector MiniSAS HD series High Speed Connector Dust/EMI Covers
型号- Z-H03B0011**000,Z-8420011**0001,Z-855**10000*10,Z-834B***P****1,Z-834E***P****1,Z-861E0**00**01,Z-828***000D0*0,Z-844E0**P0***1,Z-861T0**00**01,Z-8560**1000000,Z-8350011**0001,Z-840B000020000,Z-828***000**00,Z-848T***P****1,Z-8670011**0001,Z-868**0***0**0,Z-830B000100000,Z-83220S00****0,Z-848B***P*00*1,Z-848E***P*00*1,Z-H02R0111**0R0,Z-8270000*0*000,Z-H02R0111**1R0,Z-85020S******0,Z-824**1000***0,Z-844T0**P0**01,Z-S892000*0B22,Z-854***000***0,Z-834T********1,Z-S891000*0B22
认识AI硬体的开放架构-OAI&OAM,正凌为为OAM设计者提供高速I/O与OAM相关产品,共同迎接AI发展新挑战
开放加速器模块(OAM)为AI服务器开发商提供了一种高效且可扩展的解决方案,使他们能够更容易地整合新的AI加速器。OAM具有高效能与效率、可扩展性和支持多样的应用场景等优点,但同时也面临着技术和设计复杂性、高功耗管理和标准化和兼容性等挑战。正凌作为一家拥有高速传输、机构设计与散热模组的方案商,为OAM设计者提供了配合散热的结构设计和加工工艺上的挑战解决方案。
客户案例 | NGI高精度模拟量I/O卡助力头部PLC控制器模拟量高效测试
根据客户端的模块测试要求,NGI恩智测控模块化仪器平台自主研发与生产的模拟量输出卡配合高速数据采集卡可以实现客户端的研发测试要求。NGI全系列数据采集板卡是一种将低压模拟信号(通常为60V以下)转换为数字信号、以便计算机进行进一步处理和分析的模块化仪器,广泛应用于高校科研、汽车电子、工业自动化、航空航天和国防等行业。
【产品】正凌提供400G高速连接与散热解决方案QSFP112,每条通道皆可支援112Gb/s
大型数据中心对资料传输速度的要求不断提升,正凌推出QSFP模组QSFP112,每条通道皆可支援112Gb/s并可向后兼容QSFP56及QSFP28;在不重建网路结构的前提下,该产品是升级频宽最具成本效益的方式,也是迈向800G通讯的垫脚石。
正凌自主开发一系列连接器产品,满足高速传输技术发展需求,应用涵盖工业物联网及车联网等
围绕着云端运算、物联网、大数据以及AI技术而生的高速资料传输需求急速发展,讯号传输除了追求速度,安全可靠更是必要条件。为了满足科技急速发展而产生的各种新需求,正凌结合30几年来累积的专利技术,不断推出自主开发的新产品,包含高速I/O连接器、圆形连接器和背板连接器,应用范畴涵盖高速资料中心、工业物联网及车联网等。
热性能热阻测试服务:支持LED/IGBT/MOSFET/IC等产品热阻/热容/热特性测试
贝思科尔在世强平台上线热阻测试服务,使用MicRed T3Ster 热阻测试仪,给出数据解析及报告。测试对象热阻范围:0.01K/W-5K/W。可支持半导体器件结温测量、半导体器件封装内部结构分析;封装缺陷诊断,定位封装内部的缺陷结构;材料热特性测量、接触热阻测量等。
英德斯VMC-1000工控机助力工业AI缺陷检测系统,配备丰富I/O接口,轻松实现产品缺陷智能识别和分类
近期,某科技公司最新研发的工业AI检测系统系列,采用了YDSTECH英德斯VMC-1000工控机。VMC-1000工控机搭载的酷睿处理器,可实现高性能视觉计算和分析。配备了4个USB 3.0端口和2个USB2.0端口,最多可以连接4个摄像头,可以实时获取生产线上的图像数据,并进行初步的处理和分析,传输处理后数据给AI系统,实现产品缺陷智能识别和分类。
大型内存服务器,用于金融市场中的实时人工智能推理
描述- 本文探讨了在金融市场中,实时AI推理对大数据中心的重要性。文章指出,实时AI在金融领域的应用,如实时趋势预测、欺诈预防和信用评分,对数据访问速度和准确性有极高要求。为了满足这些需求,企业AI正在采用内存数据库服务器、特征存储、向量数据库和智能缓存等新技术。此外,文章强调了内存扩展技术的重要性,如CXL(Compete Express Link),它允许通过CPU的外围I/O总线(PCIe)增加内存,从而提高服务器性能。SMART Modular Technologies的Penguin大内存服务器解决方案通过支持CXL卡,提供高达22TB的内存容量,以满足不同应用的需求。
【应用】 MCU N32G032R8L7用在智能井盖中,I/O接口高达56个可满足多路外设控制需求
由于智能井盖有大量数据交换分析的需要,这就对MCU的性能提出了很高的要求。这里的MCU芯片推荐国民技术N32G032R8L7,32位Arm®Cortex®-M0+内核,工作频率高达48MHz,运算性能更强,高效完成运算及通讯任务;64KB FLASH,大存储空间,便于固件存储。
“魏”联万物、创赢未来——魏德米勒工业网物联网解决方案助力数智升级
魏德米勒的工业物联网解决方案覆盖了从数据采集、数据预处理、数据通信和数据分析的完整链条,构建了一个全方位的工业物联网生态系统。
750-645现场总线独立I/O模块2AI/2DO VIB VRMS/SPM多手动
描述- 本资料介绍了WAGO-I/O-SYSTEM 750系列I/O模块,特别是750-645模块,用于机器振动状态在线监测。资料详细阐述了振动强度和滚动轴承状态的监测方法,包括ISO 10816-3标准和冲击脉冲分析。此外,还提供了750-645模块的视图、描述、技术数据、功能描述以及使用方法。
型号- 750-925,750-606,750-3../...-...,750-609,750-***,750-.../...-...,750-440,750-484,750-320,750-540,758-910,750-323,750-642,0888-0412,750-611,750-633,750-324,750-327,750-625/000-001,750-645,750-601,750-487/003-000
提供从AAU至CN解决方案的高速I/O连接器及外壳系列,数据传输速率高达400Gbps
正凌丰富的高速I/O连接器及外壳系列提供从AAU至CN的解决方案,传输速率从 1Gbps 到 400Gbps,其中 800Gbps 正在开发中。从 AAU 到 DU/CU,Nextron 的 SFP 系列最高可支持 50Gbps的数据传输,而回程传输的数据速率最高可达 400Gbps。
电子商城
现货市场
服务
提供稳态、瞬态、热传导、对流散热、热辐射、热接触、和液冷等热仿真分析,通过FloTHERM软件帮助工程师在产品设计初期创建虚拟模型,对多种系统设计方案进行评估,识别潜在散热风险。
实验室地址: 深圳 提交需求>
使用FloTHERM和Smart CFD软件,提供前期热仿真模拟、结构设计调整建议、中期样品测试和后期生产供应的一站式服务,热仿真技术团队专业指导。
实验室地址: 深圳 提交需求>
登录 | 立即注册
提交评论