Enfabrica的EMFASYS技术结合了以太网RDMA和CXL技术,打造出一款内存设备,可连接至AI GPU服务器计算机架,旨在提供弹性内存带宽和容量,减轻GPU高带宽内存(HBM)的负载。
该内存设备通过3.2 Tbps ACF-S SuperNIC交换机与GPU服务器连接,该交换机将PCIe/CXL和以太网架构相结合,通过多端口800 GbE连接实现GPU和加速器的互联。交换机的核心是ACF-S芯片,提供800和400 GbE接口、32个网络端口的高基数以及160条PCIe通道。它支持144条CXL 2.0通道,可配置高达18TB的DDR5内存池。
Enfabrica首席执行官Rochan Sankar表示:"AI推理面临内存带宽扩展问题和内存容量堆叠问题。随着推理变得更加智能体导向而非对话式,更具记忆性而非遗忘性,当前的内存访问扩展方式将无法满足需求。我们构建EMFASYS来创建弹性的机架级AI内存架构,以前所未有的方式解决这些挑战。客户很乐意与我们合作,为其生成式AI工作负载构建更具扩展性的内存移动架构,实现更好的Token经济效益。"
Enfabrica由Sankar和首席开发官Shrijeet Mukherjee于2019年创立。其已知融资始于2022年的5000万美元A轮融资。B轮融资于2023年6月筹集了1.25亿美元,C轮融资于去年11月获得1.15亿美元,累计融资总额达到2.9亿美元。
从某种意义上说,随着生成式AI在过去几年的爆炸式增长,市场已经向Enfabrica倾斜。该公司表示,生成式、智能体驱动和推理驱动的AI工作负载正在指数级增长——在许多情况下,每次查询所需的计算量比以前的大语言模型部署多10到100倍,在AI云中每天要处理数十亿次批量推理调用。
除非GPU内存(HBM)保持加载状态,否则昂贵的GPU将处于空闲状态,浪费购买配备这些GPU服务器的成本。Enfabrica声称其技术满足了AI云的需求,即在扩展到更多用户/智能体数量、累积上下文和Token量的同时,最大化GPU和HBM资源的利用率。
ACF-S交换机能够在大量内存通道和以太网端口之间分条处理内存事务。据介绍,它可在微秒级提供读取访问时间,软件支持的缓存层次结构在AI推理管道中隐藏传输延迟。其功能包括高吞吐量、零拷贝、直接数据放置,并可在四或八GPU服务器复合体之间进行导向,或者跨18个以上支持CXL的DDR内存通道。其基于InfiniBand Verbs的远程内存软件栈支持GPU服务器与通用DRAM之间通过400/800 GbE网络端口束进行大规模并行、带宽聚合的内存传输。
Enfabrica声称不再需要购买更多GPU来获得更多HBM容量。其方案是:使用其交换机来增加DRAM容量,更好地利用现有GPU。据称该交换机的性能超越基于闪存的推理存储替代方案,延迟降低100倍,支持无限次写入/擦除事务。Enfabrica表示,"使用EMFASYS扩展内存可以缓解仅基于推理服务规模需求而线性增长GPU HBM和CPU DRAM资源的税负。"
群联科技的aiDAPTIV+软件也提供从HBM到DRAM再到NAND的卸载功能,但它不使用以太网RDMA和CXL,因此与EMFASYS相比是一种相对较慢的技术。
Enfabrica是超以太网联盟(UEC)的活跃咨询成员,也是超加速器链路(UALink)联盟的贡献者。
EMFASYS AI内存架构系统和3.2 Tbps ACF SuperNIC芯片目前正在与客户进行采样和试点测试。更多信息可以在这里获取,特别是关于ACF SuperNIC硅片、系统和主机软件的详细信息。
好文章,需要你的鼓励
面对全球气候挑战,美国NOAA数据显示近年来每年发生至少10起损失超10亿美元的天气灾害。Tomorrow.io公司开发了微波探测卫星星座,采用多光谱成像、高分辨率成像、无线电掩星、合成孔径雷达等五种数据技术,构建首个商业化大气3D研究架构。该项目旨在解决全球覆盖数据不足问题,提供更精确的天气预报和灾害预警能力。
加州大学圣克鲁兹分校研究团队创建了包含150万高质量样本的GPT-IMAGE-EDIT-1.5M图像编辑数据集,通过利用GPT-4o优化现有数据质量,使开源AI模型在多项测试中达到接近GPT-4o的性能水平,在GEdit-EN测试中获得7.24分的突破性成绩,显著缩小了开源与商业模型的差距,为AI图像编辑技术的民主化奠定了基础。
本文深入分析OpenAI新发布的ChatGPT学习模式背后的自定义指令机制。学习模式通过教育专家协作制定的自定义指令,引导AI采用循序渐进的教学方式,而非直接给出答案。文章将自定义指令分为五个部分:总体目标、严格规则、行动指南、语调方法和重点强调。这些指令体现了优秀的提示工程技巧,可应用于其他AI场景。作者强调自定义指令的强大功能,建议用户通过分段结构化方式制定指令,并进行充分测试和调试以确保效果。
这项由清华旗下奇虎科技等机构联合开发的研究,提出了ForCenNet前景中心网络来解决手机拍摄文档变形问题。与传统均匀处理方法不同,该系统重点关注文档中的关键信息区域如文字和表格线条,采用创新的前景分割、掩码引导和曲率一致性优化技术,在四个主流数据集上达到最优性能,为移动文档数字化提供了高效解决方案。
农历正月初一是什么节日 | 甲亢吃什么食物最好 | 雷龙吃什么 | 胃低分化腺癌是什么意思 | 头疼发热是什么原因 |
白内障是什么症状 | 丝状疣挂什么科 | 口腔溃疡需要补充什么维生素 | 灰指甲用什么药 | 支配是什么意思 |
既什么又什么 | 咽鼓管炎吃什么药 | 心脏供血不足吃什么 | 极有家是什么意思 | 肥波是什么品种的猫 |
momo是什么意思 | 鸢的俗称是什么 | 冬至夏至什么意思 | 心脏突然剧烈跳动是什么原因 | 知天命是什么意思 |
不孕不育做什么检查hcv7jop9ns1r.cn | 钙化积分是什么意思hcv9jop4ns8r.cn | 眼睛看东西变形扭曲是什么原因hcv9jop6ns5r.cn | 陈皮泡水喝有什么功效sscsqa.com | cold是什么意思chuanglingweilai.com |
贫血会引起什么症状hcv8jop9ns8r.cn | 肠胃炎吃什么药效果好inbungee.com | 血钾高是什么引起的liaochangning.com | 左大腿外侧麻木是什么原因travellingsim.com | 女s是什么hcv9jop5ns1r.cn |
什么是布病shenchushe.com | 永加日念什么hanqikai.com | 血管瘤是什么病严重吗hcv9jop0ns5r.cn | 大黄米和小黄米有什么区别hcv8jop6ns2r.cn | 左侧后背疼是什么原因男性hcv9jop1ns9r.cn |
曼龙鱼能和什么鱼混养hcv8jop7ns9r.cn | 吃什么可以淡斑hcv7jop9ns4r.cn | 耍宝是什么意思jingluanji.com | 家的含义是什么1949doufunao.com | 麝牛是什么动物hcv7jop5ns0r.cn |