铭瑄 Intel Arc Pro B60 Dual 48G Turbo 显卡 BF16 算力 + 显存 + AI 推理 + 价格对比:B60 Dual vs A100、4090、B60 24G、B70
·
下面分三部分讲:
1)铭瑄 B60 Dual 48G Turbo 显卡规格
2)铭瑄 Ai Micro Station(MS 275HX)准系统
3)BF16算力+显存+AI推理+价格对比:B60 Dual vs A100、4090、B60 24G、B70 32G
一、铭瑄 Intel Arc Pro B60 Dual 48G Turbo 显卡
核心规格(一张卡=两颗B60)
- 架构:Intel Xe2(Battlemage),5nm
- GPU核心:2×B60,每颗20个Xe核心、160个XMX AI引擎
- 显存:48GB GDDR6(24GB×2),192bit×2,456GB/s×2=912GB/s
- 频率:2400MHz(Boost)
- 功耗:整卡400W(实测约260W)
- 接口:PCIe 5.0 x8+x8(需主板拆分x16→x8+x8)
- 输出:DP 2.1 + HDMI 2.1a ×2(双GPU各一组)
定位
- 专业AI推理/内容创作卡,非游戏卡
- 主打本地70B大模型推理(4-bit量化约需35–40GB显存)
- 支持 vLLM、IPEX-LLM,可跑 DeepSeek-70B、Qwen3-32B 等
二、铭瑄 Ai Micro Station(MS 275HX)准系统
核心配置
- CPU:Intel Core Ultra 9 275HX(Arrow Lake-HX)
- 24核(8P+16E),最高5.4GHz,55W TDP
- 体积:约20L,紧凑型工作站
- PCIe:
- 1×PCIe 5.0 x16(支持x8+x8拆分,完美适配B60 Dual)
- 1×PCIe 5.0 x8(可再插B60 24G)
- 内存:4×DDR5插槽,最高256GB,可超至7200MT/s
- 存储:M.2 PCIe 5.0×4 + 2×M.2 PCIe 4.0×4 + 2×SlimSAS
- 网络/IO:雷电5×2 + 雷电4×2、10GbE、Wi‑Fi 7
定位
- 专为B60 Dual设计的“20L AI算力盒”
- 原生支持PCIe拆分,供电/散热针对双GPU优化
- 开箱即可部署70B模型,无需折腾主板/BIOS
三、关键规格对比(含BF16算力)
1. 算力总表(TFLOPS / TOPS)
| 型号 | BF16(TFLOPS) | FP32(TFLOPS) | INT8(TOPS) | 显存 | 显存类型 |
|---|---|---|---|---|---|
| B60 Dual 48G | 49.16(24.58×2) | 24.58(12.29×2) | 394(197×2) | 48GB | GDDR6 |
| B60 24G(单芯) | 24.58 | 12.29 | 197 | 24GB | GDDR6 |
| B70 32G | 23.4 | 11.7 | 233 | 32GB | GDDR6 |
| RTX 4090 24G | 16.2 | 16.2 | 130 | 24GB | GDDR6X |
| A100 80GB | 312 | 19.5 | 624 | 80GB | HBM2e |
- BF16说明:
- B60 单芯:24.58 TFLOPS(官方FP16=BF16,Xe2架构统一)
- B60 Dual:49.16 TFLOPS(双芯相加)
- 4090:16.2 TFLOPS(RTX 40系BF16=FP16)
- A100:312 TFLOPS(专业训练卡,远高于推理卡)
2. 显存与AI推理能力
- B60 Dual 48G:
- 48GB GDDR6,可原生跑 70B 4-bit(≈38GB)
- 双芯并行,INT8 394 TOPS,推理速度≈120–150 token/s(70B 4-bit)
- B60 24G:
- 24GB,最大 34B 4-bit(≈20GB),70B 需CPU offload(很慢)
- B70 32G:
- 32GB,可跑 70B 5-bit(≈35GB,勉强),INT8 233 TOPS,推理比B60 Dual慢≈40%
- RTX 4090 24G:
- 24GB,70B无法本地跑(必爆显存),最多34B 4-bit
- BF16/INT8均低于B60系列
- A100 80GB:
- 80GB HBM2e,训练+推理全能,70B可跑FP16(≈70GB)
- 但价格极高(单卡约8–12万),功耗400W+
3. 价格与定位(2026年5月)
- B60 Dual 48G:约2.1万(国内)
- B60 24G:约7000元
- B70 32G:约1.2万元
- RTX 4090 24G:约1.3万元(游戏+轻度AI)
- A100 80GB:约10万元(专业训练)
- 铭瑄MS 275HX准系统:约1.5万元(不含内存/硬盘)
4. 适用场景总结
- ✅ B60 Dual + MS 275HX:
- 本地70B大模型推理、长文本/多模态、AI绘画(Stable Diffusion XL)、8K视频剪辑
- 性价比之王:48GB+双芯BF16 49TFLOPS,价格≈4090×1.6
- ✅ B60 24G:34B模型、内容创作、预算有限
- ✅ B70 32G:介于B60 24G与Dual之间,显存更大但算力略低
- ❌ 4090:游戏为主,70B推理显存不足
- ❌ A100:训练首选,推理性价比低
结论
- BF16算力:B60 Dual(49.16)> B70(23.4)> B60(24.58)> 4090(16.2)≪ A100(312)
- 显存+本地70B推理:B60 Dual 48G 是当前消费级/入门专业唯一能流畅跑70B 4-bit的方案
- 准系统:MS 275HX 是B60 Dual的最佳搭档,20L体积、原生PCIe拆分、供电散热拉满
要不要我补充一份B60 Dual与4090在主流大模型(7B/13B/34B/70B)下的实测推理速度对比,以及对应的推荐量化精度?
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐



所有评论(0)