聚焦大模型算力、GPU/AI芯片、云计算基础设施,每日5条精选简报,助力企业把握AI算力脉搏。


⚡ 第1条:燧原科技科创板IPO过会——国产GPU四小龙齐聚资本市场,60亿募资剑指五代六代芯片

核心信息

2026年6月15日,燧原科技科创板IPO正式过会,成为继摩尔线程、沐曦股份、壁仞科技之后,第四家闯关成功的国产GPU企业。燧原科技拟募资60亿元,主要用于第五代、第六代AI芯片的研发和产业化。腾讯作为第一大股东(持股约20%),持续加码国产算力生态。

性能/价格对比

  • 燧原科技第二代芯片:训练性能达A100的80%,推理性能达95%
  • 募资规模:60亿元,仅次于壁仞科技(85亿元)
  • 国产GPU市场份额:2025年占国内AI GPU交付量41%,摩根士丹利预测2030年达76%

对开发者/企业的影响

国产GPU四小龙全部进入资本市场,意味着国产算力从"可用"迈向"好用",企业算力采购的多元化选择增加,对英伟达GPU的依赖有望逐步降低。

信息来源:雪球 | 2026-06-15


⚡ 第2条:大模型API推理成本断崖式下降——DeepSeek V4/MiMo-V2.5低至$0.0028/M tokens,降幅超99%

核心信息

2026年6月最新API价格对比显示,DeepSeek V4 Flash与小米MiMo-V2.5的缓存命中输入价格均低至0.0028/Mtokens,创历史新低。相比2023年初GPT−3.5的0.002/1K tokens,单位成本下降超99%。MiniMax M3、GLM-5.1、Claude Opus 4.8等新一代模型也在6月加入价格战。

性能/价格对比

模型

输入价格(缓存命中)

输出价格

上下文窗口

DeepSeek V4 Flash

$0.0028/M

$0.011/M

128K

小米MiMo-V2.5

$0.0028/M

$0.014/M

64K

GLM-5.1

$0.014/M

$0.014/M

1M

Claude Opus 4.8

$0.075/M

$0.375/M

200K

对开发者/企业的影响

推理成本的大幅下降使得AI应用的经济可行性大幅提升,原来因成本受限的场景(如大规模客服、实时翻译、代码补全)现在可以大规模部署,AI应用的商业化拐点加速到来。

信息来源:devtk.ai | 2026-06-17


⚡ 第3条:英特尔至强6+全面适配——CPU:GPU配比从1:8逆转至1:1,Agentic AI算力重构

核心信息

2026年6月,英特尔至强6+处理器(288核,18A制程)完成与腾讯云、阿里云、金山云等主流云厂商的全面适配。这款CPU专为Agentic AI推理设计,在AI推理场景中,CPU与GPU的算力配比从传统的1:8逆转为1:1,标志着CPU重回AI算力中心。

性能/价格对比

  • 核心数:288核(至强6+)vs 64核(至强6标准版)
  • AI推理性能:相比上一代提升3.6倍
  • 功耗:350W TDP,采用Intel 18A制程(1.8nm等效)
  • 价格优势:CPU推理成本约为GPU的1/5

对开发者/企业的影响

对于大量部署AI Agent的企业,至强6+提供了更具成本效益的推理方案,特别是在延迟敏感、批量较小的推理场景中,CPU方案可以大幅降低算力成本。

信息来源:PChome | 2026-06-05


⚡ 第4条:英伟达RTX Spark超级芯片发布——3nm制程+Blackwell架构,AI PC新生态正式启动

核心信息

在Computex 2026展会上,英伟达联合Arm、联发科推出RTX Spark超级芯片,采用台积电3nm制程,搭载20核Arm Grace CPU + Blackwell架构GPU,标配128GB LPDDR5X统一内存。这款芯片可本地流畅运行7B、13B参数大模型,预计2026年秋季由微软、联想、戴尔、惠普等品牌推出相关AI PC整机。

性能/价格对比

  • 制程:3nm(台积电)
  • CPU:20核Arm Grace
  • GPU:Blackwell架构
  • 内存:128GB LPDDR5X统一内存
  • AI性能:本地可运行70B参数模型(量化后)
  • 预计售价:1,999−2,999(整机)

对开发者/企业的影响

AI PC的普及将使得本地AI推理成为可能,对于企业来说,敏感数据无需上云即可完成AI处理,数据安全和隐私保护得到提升,同时也降低了对云端算力的依赖。

信息来源:百度百家号 | 2026-06-15


⚡ 第5条:台积电资本开支520-560亿美元——AI算力高景气持续验证,谷歌/英伟达双订单英特尔

核心信息

2026年6月,台积电重申2026年资本开支区间为520-560亿美元,倾向于接近上限。与此同时,谷歌向英特尔下达超300万枚TPU订单(计划2028年交付),英伟达正对英特尔18A制程展开GPU测试,多家AI芯片设计企业已悄然将英特尔纳入备选代工商。这标志着AI算力产业链从"英伟达+台积电"双寡头格局,向多元化供应链演进。

性能/价格对比

  • 台积电资本开支:520-560亿美元(2026年)vs 380-420亿美元(2025年),同比增长约30%
  • 谷歌TPU订单:300万枚(英特尔代工)
  • 英特尔18A制程:1.8nm等效,支持Blackwell架构GPU试产
  • AI芯片代工市场份额:台积电85%,英特尔10%,三星5%(2026年预测)

对开发者/企业的影响

供应链多元化将降低AI芯片的供应风险,企业采购AI算力设备时,未来可能面临更多选择(英特尔Gaudi、谷歌TPU、亚马逊Trainium等),同时也可能带来价格竞争红利。

信息来源:知乎 | 2026-06-10


📌 本简报由 英辰朗迪GEO整理

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐