英特尔发布Project Battlematrix推理工作站软件更新

英特尔发布Project Battlematrix(战斗阵列)推理工作站软件更新,英特并计划在第三季度末发布功能更全面的推理强化版LLM Scaler。
今年5月,工作英特尔发布了代号为Project Battlematrix(战斗阵列)的站软推理工作站。推理工作站具有广阔的英特发展前景,主要表现在:一是推理安全部署,数据可在本地进行处理;二是工作易于设置,将所有软件置于容器中,站软提供一站式解决方案;三是英特易扩展,可灵活配置不同数量的推理显卡;四是在成本效益上具有显著优势。Project Battlematrix推理工作站最多可支持八块英特尔锐炫 Pro B60 24GB GPU,工作提供高达192GB的站软VRAM,运行高达1500亿参数的英特中等规模且精度高的AI模型。
英特尔采用容器化方案来帮助客户解决软件部署的复杂性问题。在容器内部,工作对大语言模型进行了大量的优化,包括Linux软件栈的支持、验证以及分阶段的软件发布。基于全新的推理优化软件栈,Project Battlematrix还能够简化英特尔锐炫Pro B系列GPU的部署,加速英特尔GPU和AI战略的落实。
全新的软件栈在设计时充分考虑了易用性和行业标准,是专为Linux环境构建的容器化解决方案。经过优化,该方案能够借助多GPU扩展和PCIe P2P数据传输,带来卓越的推理性能。与此同时,该方案还具备企业级的可靠性和可管理性,如ECC、SRIOV、遥测和远程固件更新等。
LLM Scaler容器1.0版本对于前期客户支持至关重要,英特尔进行了以下更新:
vLLM:
·针对长输入长度(>4K)的TPOP性能优化:在32B KPI模型上,40K序列长度的性能提升高达1.8倍;在70B KPI模型上,40K序列长度的性能提升高达4.2倍
·与上一版本相比,8B-32B KPI模型的输出吞吐量性能优化约10%
·逐层在线量化,减少所需的GPU内存
·支持vLLM中的PP(流水线并行)(实验性)
·支持torch.compile(实验性)
·推测解码(实验性)
·支持嵌入和重排序模型
·增强的多模态模型支持
·最大长度自动检测
·数据并行支持
OneCCL基准测试工具支持
XPU Manager:
·GPU功耗
·GPU固件更新
·GPU诊断
·GPU内存带宽
英特尔表示此版本将按照5月初发布时公开的时间表顺利交付,并计划在第三季度末发布功能更全面的强化版LLM Scaler,同时积极争取在第四季度发布完整版本。
相关文章
- 实木地板先别买!看完再选也不迟要选购实木地板前,我们应该先来了解一下实木地板怕什么,这样在装修时候也能有效的规避一下,在科学铺装的基础上,对地板进行正确、充分的保养是决定木地板寿命长短的一大关键。那么2025-08-26
- 车展有车模、T型台上的时装模特、卖游艇的有艇模,卖钻戒的有手模,甚至卖鞋袜的还有脚模,而如今,家居广场也开始有了模特。2011年1月1日,金太阳国际家具广场开展活动,家具静态模特之风首次刮到合肥,并2025-08-26
- 目前,谁能够更好的将营销玩转市场,谁就能抓住消费者,就能在未来的LED市场占据一席之地。而当下最为流行的病毒式营销却正好是各大LED企业发展的桥梁之一,但LED企业更需做的是将品牌实实在在地贴近顾客,2025-08-26
中国消费者协会点评网购十大“霸王条款” 以“清仓”“尾货”名义拒绝七天无理由退货上榜
中国消费者报报道记者任震宇)日前,中国消费者协会公布了《“不公平格式条款”消费者认知及线索征集调查报告》。8月22日,中消协律师团律师对消费者反映强烈的网络购物领域不公平格式条2025-08-26天下晨間新聞 臉書、Google為什麼說不惜退出香港?|天下雜誌
香港一項修法,是否真的會讓科技巨頭大出走?另外,油價要飆了嗎?您的閱讀篇數已達上限立刻訂閱全閱讀,即可享全站不限篇數閱讀2025-08-26- 在人们的印象中,玻璃是一种易碎透明的材料,而且由于碎片尖锐容易伤人,安全性并不强。然而随着科技的发展,人们不但能够将玻璃的天然优势充分发挥,还能够调整其性能,弥补它的缺点。接下来我们将介绍全玻2025-08-26
最新评论