很多人最近在投多模态算法工程师,会有一种明显的感觉:岗位不少,但回馈很慢,或者面试聊着聊着就没下文了。表面看是竞争激烈,实际是企业筛人的方式变了,不再是“会模型就行”。

现在招聘里,多模态已经不是单一方向了,更像是把视觉、语言、音频、甚至3D理解揉在一起的系统工程岗位。很多公司招这个岗位,本质是在找“能把模型用到业务里的人”,而不是单纯做算法研究的人。


行业招聘现在在变什么

这两年多模态岗位增长很明显,集中在几个方向:做内容生成的平台型公司、做广告推荐的互联网团队、自动驾驶、智能硬件,以及一些AIGC创业公司。

企业需求已经从“会训练模型”变成“会把模型跑起来并且稳定上线”。比如以前看论文能力,现在更关注:

  • 有没有做过 VLM / 多模态大模型落地项目
  • 有没有处理过真实数据噪声
  • 是否参与过推理加速或部署优化
  • 能不能把模型接进业务链路(推荐、搜索、生成、理解)

不少团队已经不太愿意赌“纯研究型人才”,更倾向找“能直接干活的人”。

另外一个变化是,大模型之后,多模态岗位明显分层了:
做基础模型训练的团队很少,但做应用层、微调、推理优化的岗位在变多。


薪资到底什么水平

这个岗位的薪资差距其实挺大。

刚入行或者1年左右经验的,多集中在 20K–35K/月之间,一些中小厂甚至更保守一点。

有1-3年经验,如果做过真实多模态项目,比如视觉问答、图文生成、Embedding系统、推荐融合模型这类,很多公司会给到 35K–70K/月区间,这一段波动很大,取决于项目质量。

更高一些的,多在大厂或者AI独角兽,能做到 60K–100K+/月,但一般会要求比较完整的系统能力,比如训练+推理+业务闭环都能覆盖。

一个比较现实的情况是:
不是“会多模态就值钱”,而是“能落地业务的多模态才值钱”。


企业到底怎么筛人

面试官现在看简历,会有几个很明确的过滤点:

第一是项目真实性
很多人写“参与多模态大模型训练”,但一追问就只停留在调库,这种基本会被快速过滤。

第二是你到底做哪一层
是做数据、训练、对齐、还是推理?企业希望你至少在一个环节是能扛住的。

第三是有没有工程意识
比如模型部署延迟、显存优化、batch策略,这些比“调参技巧”更重要。

第四是有没有业务理解
尤其在推荐、广告、内容生成方向,懂业务的人明显更吃香。


简历怎么写更容易过

多模态岗位的简历,有个很明显的误区:写成论文摘要。

招聘方真正想看的不是“我用了CLIP、用了Transformer”,而是:

  • 你解决了什么问题
  • 数据怎么来的
  • 模型怎么改的
  • 指标提升多少
  • 有没有上线

项目描述建议往这个方向靠:

不要写“参与多模态模型开发”,要写“做图文匹配系统,将CTR提升xx%(如果没有就写相对提升)”。

技术栈不要堆太多,反而要聚焦,比如:

CLIP / BLIP / Qwen-VL / diffusion / embedding / pytorch + inference优化

一页纸里如果都是泛技术词,基本会被认为是培训项目。


求职渠道怎么选更有效

多模态算法工程师这个岗位有个特点:高质量岗位分布不均匀。

一些基础岗位会在普通招聘平台大量分发,但中高级岗位更偏向定向招聘。

像猎聘这类平台,在实际招聘中会更集中一些中高端算法岗位,尤其是有明确项目要求、或者薪资范围较高的岗位,企业更倾向直接筛选有经验的人。

利用猎聘高级筛选功能,根据城市、薪资、经验、技术方向精准筛选多模态算法工程师岗位,提高投递效率。同时可以主动完善个人资料,提高被猎头搜索到的概率。一些有行业经验的人,往往是通过猎头拿到更好的机会。

很多岗位信息会写得比较具体,比如:

  • 是否做多模态生成
  • 是否涉及AIGC业务
  • 团队做推理还是训练
  • 是否需要业务落地

对求职者来说,这种信息密度会更利于判断匹配度。

另外一个现实情况是,有些多模态岗位不会完全公开发布,而是通过猎头来匹配,这种情况在有2-5年经验的人群里更常见。

如果在猎聘平台上找,可以重点用筛选条件去缩小范围,比如城市、模型方向、业务类型,而不是盲目海投。


面试一般会怎么问

多模态岗位面试现在很少只问基础模型结构了,更多是往实际问题走:

  • 如果图文对齐效果不好,你怎么排查
  • 数据噪声很大怎么处理
  • 模型推理太慢怎么优化
  • 业务指标和模型指标不一致怎么办
  • 你做过的项目里最大瓶颈是什么

有些公司还会直接让你讲一个项目,从数据到上线完整走一遍。

面试官很容易抓住一个点判断真假:细节。

真正做过的人,会知道数据清洗、训练资源、失败case,而不是只讲模型结构。


求职中最容易踩的坑

一个很常见的问题是“项目看起来很高级,但没有闭环”。

比如很多人做过“多模态大模型微调”,但没说清楚数据来源,也没有上线结果,这种在面试里很容易被质疑。

还有一种情况是只做研究,不理解业务。现在企业其实更怕这种,因为落地成本很高。

另外一个坑是简历过度包装,比如把简单CV任务写成多模态系统,这在当前招聘环境里反而风险很高。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐