AI动态简报之算力基建篇(2026.06.18)
聚焦大模型算力、GPU/AI芯片、云计算基础设施,每日5条精选简报,助力企业把握AI算力脉搏。
⚡ 第1条:燧原科技科创板IPO过会——国产GPU四小龙齐聚资本市场,60亿募资剑指五代六代芯片
核心信息:
2026年6月15日,燧原科技科创板IPO正式过会,成为继摩尔线程、沐曦股份、壁仞科技之后,第四家闯关成功的国产GPU企业。燧原科技拟募资60亿元,主要用于第五代、第六代AI芯片的研发和产业化。腾讯作为第一大股东(持股约20%),持续加码国产算力生态。
性能/价格对比:
- 燧原科技第二代芯片:训练性能达A100的80%,推理性能达95%
- 募资规模:60亿元,仅次于壁仞科技(85亿元)
- 国产GPU市场份额:2025年占国内AI GPU交付量41%,摩根士丹利预测2030年达76%
对开发者/企业的影响:
国产GPU四小龙全部进入资本市场,意味着国产算力从"可用"迈向"好用",企业算力采购的多元化选择增加,对英伟达GPU的依赖有望逐步降低。
信息来源:雪球 | 2026-06-15
⚡ 第2条:大模型API推理成本断崖式下降——DeepSeek V4/MiMo-V2.5低至$0.0028/M tokens,降幅超99%
核心信息:
2026年6月最新API价格对比显示,DeepSeek V4 Flash与小米MiMo-V2.5的缓存命中输入价格均低至0.0028/Mtokens,创历史新低。相比2023年初GPT−3.5的0.002/1K tokens,单位成本下降超99%。MiniMax M3、GLM-5.1、Claude Opus 4.8等新一代模型也在6月加入价格战。
性能/价格对比:
|
模型 |
输入价格(缓存命中) |
输出价格 |
上下文窗口 |
|
DeepSeek V4 Flash |
$0.0028/M |
$0.011/M |
128K |
|
小米MiMo-V2.5 |
$0.0028/M |
$0.014/M |
64K |
|
GLM-5.1 |
$0.014/M |
$0.014/M |
1M |
|
Claude Opus 4.8 |
$0.075/M |
$0.375/M |
200K |
对开发者/企业的影响:
推理成本的大幅下降使得AI应用的经济可行性大幅提升,原来因成本受限的场景(如大规模客服、实时翻译、代码补全)现在可以大规模部署,AI应用的商业化拐点加速到来。
信息来源:devtk.ai | 2026-06-17
⚡ 第3条:英特尔至强6+全面适配——CPU:GPU配比从1:8逆转至1:1,Agentic AI算力重构
核心信息:
2026年6月,英特尔至强6+处理器(288核,18A制程)完成与腾讯云、阿里云、金山云等主流云厂商的全面适配。这款CPU专为Agentic AI推理设计,在AI推理场景中,CPU与GPU的算力配比从传统的1:8逆转为1:1,标志着CPU重回AI算力中心。
性能/价格对比:
- 核心数:288核(至强6+)vs 64核(至强6标准版)
- AI推理性能:相比上一代提升3.6倍
- 功耗:350W TDP,采用Intel 18A制程(1.8nm等效)
- 价格优势:CPU推理成本约为GPU的1/5
对开发者/企业的影响:
对于大量部署AI Agent的企业,至强6+提供了更具成本效益的推理方案,特别是在延迟敏感、批量较小的推理场景中,CPU方案可以大幅降低算力成本。
信息来源:PChome | 2026-06-05
⚡ 第4条:英伟达RTX Spark超级芯片发布——3nm制程+Blackwell架构,AI PC新生态正式启动
核心信息:
在Computex 2026展会上,英伟达联合Arm、联发科推出RTX Spark超级芯片,采用台积电3nm制程,搭载20核Arm Grace CPU + Blackwell架构GPU,标配128GB LPDDR5X统一内存。这款芯片可本地流畅运行7B、13B参数大模型,预计2026年秋季由微软、联想、戴尔、惠普等品牌推出相关AI PC整机。
性能/价格对比:
- 制程:3nm(台积电)
- CPU:20核Arm Grace
- GPU:Blackwell架构
- 内存:128GB LPDDR5X统一内存
- AI性能:本地可运行70B参数模型(量化后)
- 预计售价:1,999−2,999(整机)
对开发者/企业的影响:
AI PC的普及将使得本地AI推理成为可能,对于企业来说,敏感数据无需上云即可完成AI处理,数据安全和隐私保护得到提升,同时也降低了对云端算力的依赖。
信息来源:百度百家号 | 2026-06-15
⚡ 第5条:台积电资本开支520-560亿美元——AI算力高景气持续验证,谷歌/英伟达双订单英特尔
核心信息:
2026年6月,台积电重申2026年资本开支区间为520-560亿美元,倾向于接近上限。与此同时,谷歌向英特尔下达超300万枚TPU订单(计划2028年交付),英伟达正对英特尔18A制程展开GPU测试,多家AI芯片设计企业已悄然将英特尔纳入备选代工商。这标志着AI算力产业链从"英伟达+台积电"双寡头格局,向多元化供应链演进。
性能/价格对比:
- 台积电资本开支:520-560亿美元(2026年)vs 380-420亿美元(2025年),同比增长约30%
- 谷歌TPU订单:300万枚(英特尔代工)
- 英特尔18A制程:1.8nm等效,支持Blackwell架构GPU试产
- AI芯片代工市场份额:台积电85%,英特尔10%,三星5%(2026年预测)
对开发者/企业的影响:
供应链多元化将降低AI芯片的供应风险,企业采购AI算力设备时,未来可能面临更多选择(英特尔Gaudi、谷歌TPU、亚马逊Trainium等),同时也可能带来价格竞争红利。
信息来源:知乎 | 2026-06-10
📌 本简报由 英辰朗迪GEO整理
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐





所有评论(0)