黄仁勋、苏姿丰点赞:英伟达、AMD 力挺 InferenceMAX 开源新基准
IT之家 10 月 11 日消息,黄仁科技媒体 Tom's Hardware 昨日(10 月 10 日)发布博文,勋苏新基报道称分析机构 SemiAnalysis 近日发布了一款名为 InferenceMax 的姿丰准荷泽市某某海绵制品教育中心开源 AI 基准测试套件,专注于衡量在真实 AI 推理(模型实际运行)场景下,点赞达由驱动、英伟内核、力挺框架等组成的开源整个软件堆栈的综合效率。
IT之家援引博文介绍,黄仁人工智能领域的勋苏新基焦点几乎完全集中在芯片交易和 GPU 等硬件发展上,现有的姿丰准基准测试也大多只关注硬件性能,因此 InferenceMax 希望提供一个开源且厂商中立的点赞达 AI 基准测试套件。该项目以滚动发布的英伟方式,每晚更新测试结果,力挺从而能够动态追踪软件更新对性能的开源持续影响。
InferenceMax 引入了两个相互制约的黄仁荷泽市某某海绵制品教育中心关键性能指标。其一是“吞吐量”,指在单位时间内处理更多并发请求的能力,这有利于最大化 GPU 利用率;其二是“交互性”,指为单个用户提供更快响应速度的能力,例如在聊天机器人场景中。
在两者之间取得理想平衡(即帕累托前沿曲线上的最佳点)至关重要。最终,对于服务提供商而言,衡量投资回报的终极标准是“总拥有成本”(TCO),即处理每百万 token 所需花费的美元。InferenceMax 致力于估算不同硬件采购或租赁方案下的 TCO,为用户提供最具经济效益的选择依据。
InferenceMax 的初步测试提供了一些颠覆性的见解。例如,尽管英伟达的 B200 在原始速度上遥遥领先,但在综合考量 TCO 后,AMD 的 MI335X 在特定场景下展现出了极强的竞争力,这表明,最快的芯片不一定是最经济高效的选择。
同时,测试也暴露了 AMD 在 FP4(4 位浮点格式)内核方面尚有改进空间,目前依赖该数学格式的场景仍由英伟达芯片主导。这些发现凸显了单纯比较硬件参数的局限性,软件优化与成本效益正成为评估 AI 性能的关键。
InferenceMax 的开发过程得到了英伟达、AMD 及多家云服务商的深度协作。这种合作不仅帮助项目获取了真实的硬件与软件配置方案,还意外地发现了两大巨头软件堆栈中的多个错误。
例如,项目组协助 AMD 修复了其 ROCm 软件中的问题,并建议 AMD 提供更优的默认配置以简化性能调优。对于英伟达,测试则暴露了其新款 Blackwell 驱动在快速启停实例时存在初始化相关的障碍。
英伟达首席执行官黄仁勋表示:
在长上下文推理的推动下,推理需求呈指数级增长。NVIDIA Grace Blackwell NVL72 正是为这个充满思考力的 AI 新时代而生。NVIDIA 通过持续的硬件和软件创新来满足这一需求,从而赋能 AI 的未来发展。 通过频繁的基准测试,InferenceMax 让业界能够清晰地了解 LLM 推理在实际工作负载下的性能。结果显而易见:搭载 TRT-LLM 和 Dynamo 的 Grace Blackwell NVL72 可提供无与伦比的单位成本和单位兆瓦性能,为全球生产力最高、成本效益最高的 AI 工厂提供支持。
AMD 首席执行官苏姿丰表示:
开放式协作正在推动人工智能创新的新时代。开源 InferenceMax 基准测试为社区提供透明的每日结果,从而激发信任并加速进步。 它凸显了我们的 AMD Instinct MI300、MI325X 和 MI355X GPU 在不同工作负载下具有竞争力的 TCO 性能,彰显了我们平台的强大实力以及我们致力于让开发人员实时了解软件进度的承诺。
IT之家附上参考地址
(责任编辑:知识)
-
据智利大学全国地震中心消息,位于南美洲与南极洲之间的德雷克海峡10日发生7.8级地震。智利海军水文和海洋局海啸预警部门发布预警说,此次地震可能引发低强度海啸。 智利大学全国地震中心消息说,地震发 ...[详细]
-
提升群众安全感为平安“加码” 北京公交警方一天查获3名网上在逃人员
7月6日,根据全国公安机关夏夜治安巡查宣防集中统一行动安排,北京公交警方在全市公共交通系统组织开展行动,守护群众出行,为平安“加码”。公交警方依托“警企地”协同联动工作格局,紧紧围绕轨道交通、地面公交 ...[详细]
-
昨天8日),北京市2024年第一封普招录取通知书从北京语言大学发出并送达考生的手中。8日18点45分左右,在北京语言大学高招录取现场,经过紧张的录取环节,今年北京市第一封普招录取通知书正式产生。工作人 ...[详细]
-
最高人民检察院7月10日通报,检察机关依法分别对十四届上海市政协原常委鲍炳章,广西壮族自治区柳州市委原书记吴炜,国家税务总局四川省税务局原副巡视员饶勇提起公诉。 上海检察机关依法对鲍炳章涉嫌受贿 ...[详细]
-
李飞飞要用ImageNet的方式,推动具身智能了。依然是一个“挑战赛”。就在最近,由李飞飞团队发起、英伟达赞助其中之一)的首届BEHAVIOR家务挑战赛正式启动。这一次,他们下定决心凝聚学术界和产业界 ...[详细]
-
据今日俄罗斯电视台RT)网站8日报道,乌克兰总统泽连斯基当天表示,乌克兰与波兰已经签署了一项双边安全协议,其中包含波兰可参与击落在乌克兰领空的俄罗斯导弹和无人机的条款。乌克兰总统泽连斯基和波兰总理图斯 ...[详细]
-
“上半年入境外国人同比增长152.7%”,这是国家移民管理局近期公布的数据。入境人数增加的同时,北京外语导游市场也在稳步恢复。7月7日,北京商报记者从部分旅行社和外语导游处了解到,当前北京外语导游的价 ...[详细]
-
“眼前的‘697’在我心中已不只是一个数字而已,我能感到‘697’的热度,‘697’的重量。‘697’比你去年的‘679’高了18分,这里包含了你的不屈不挠;这18分也包含了奶奶、妈妈的心血。这18分 ...[详细]
-
原标题:青春华章丨奏响江河共鸣、与祖国共生的“青春之歌”) 黄河之水奔腾着滋养华夏沃土,长江巨浪托举着大国重器启航,千年运河续写着南北通衢的繁华,贯穿古今的水脉, ...[详细]
-
五角大楼8日发布的正式报告显示,美国新一代“哨兵”陆基洲际导弹的成本超支问题远比预期严重得多——从原先估计的777亿美元暴涨到1600亿美元,交付时间也要推迟数年。如此严重的问题导致该项目一度面临被取 ...[详细]