33个语种互译, 腾讯混元全新翻译模型Hy-MT2开源
5月21日,混元翻译模型Hy-MT2 正式开源,包含3个尺寸的模型Hy-MT2-1.8B、Hy-MT2-7B、Hy-MT2-30B-A3B,三个模型均支持33个语种互译,5种民汉/方言。其中7B和30B-A3B模型在各类翻译任务上达到了开源模型最佳效果,超越了几十倍参数量的模型。轻量级的1.8B 模型也超越了微软等主流商业API,且得益于AngelSlim1.25-bit极端量化,仅需 440MB 存储空间,可以轻松部署在苹果、高通、联发科等手机芯片上支持本地推理,相比Hy-MT1.5推理速度提升 1.5 倍。
Hy-MT2模型已上线魔乐社区,欢迎广大开发者下载体验!
🔗 Hy-MT2权重链接:
https://modelers.cn/user/tencent?model_name=Hy-MT2

相比上一代翻译模型Hy-MT1.5,Hy-MT2 效果提升明显,尤其在多语言指令遵循、专业领域翻译和真实应用场景翻译中表现较好,追平甚至超过大尺寸通用模型。
在端侧场景下Hy-MT2进一步探索极低比特量化方案,本次升级模型中,极低比特量化版(1.25-bit)仅需约 440MB 存储空间即可部署,这也为翻译模型接入端侧智能设备做好了技术准备。
通用翻译能力出众,重点优化专业领域和真实业务场景
在通用翻译能力评测中,Hy-MT2系列三个模型在 FLORES-200 平均表现上分别达到目前行业表现最好的翻译模型 (Gemini 3.1 Pro )的 88.1%、 96.9%,和 98.1%水平,已经十分接近。同时,Hy-MT2-7B和 Hy-MT2-30B-A3B 的实测得分超过 DeepSeek-V4-Pro和Kimi K2.6等开源模型。在轻量级模型的横向对比中,Hy-MT2-1.8B 也整体优于头部商业翻译 API。

在保持通用翻译能力的同时,Hy-MT2进一步面向真实业务场景和专业领域翻译进行优化。可以看到,在真实场景测试集上,Hy-MT2-1.8B 和 Hy-MT2-7B 的 GEMBA 评分(基于大语言模型的翻译质量自动评估指标)分别达到 Gemini 3.1 Pro 的 96.7% 和 99.9%水平,并且这一场景下Hy-MT2-30B-A3B 效果已经超过 Gemini 3.1 Pro。

在涵盖 8 个专业领域的 DomainMTBench 上,三个模型的 GEMBA 评分分别达到 Gemini 3.1 Pro 的 96.2%、97.9% 和 99.0%水平,几乎持平。另外可以看到,Hy-MT2-30B-A3B在金融、政治、教育几个垂直领域的翻译表现已经部分超过主流翻译模型。
相比上一版本模型,Hy-MT2的最大提升体现在指令遵循能力上,模型能够更准确地理解并执行用户关于术语、风格和输出格式等方面的具体要求。腾讯混元自建数据集IFMTBench测试结果表明,Hy-MT2-7B和 Hy-MT2-30B-A3B的翻译效果已经超越等相近尺寸开源模型,接近 Gemini 3.1 Pro。

IFMTBench也随着模型发布一并开源,这是一个翻译指令遵循测试集,测试集中的指令主要是和翻译任务相关,例如翻译风格变换、指定术语翻译等,指令和待翻译的文本涵盖了多个语种。
例如下面的例子,通过“个性化设定:翻译结果简洁精炼,去掉冗余表达,每句不超过15个字”,模型可以很好的遵循指令,让翻译结果更符合要求。


总体看来,Hy-MT2是一个面向真实应用场景的高质量、高效率、多能力多语翻译模型家族,在通用翻译、专业领域翻译、真实业务场景和翻译指令遵循任务上均表现出较强竞争力。
架构创新和极致量化:极低比特量化版本仅需约 440MB 即可部署
跟此前模型不一样的是,为在翻译效果和推理效率之间取得更好的平衡,Hy-MT2首次引入混合专家架构,推出 Hy-MT2-30B-A3B,通过扩大总参数规模提升模型容量,同时控制每次推理时的激活参数量,在增强翻译质量的同时降低推理开销,相比单纯扩大稠密模型规模,这种设计更适合面向真实应用场景的高质量翻译系统。
此外,上一版本的模型Hy-MT1.5-1.8B虽已提供 4-bit量化版本,但该版本仍需要 1GB 以上的存储空间,在移动端、边缘设备和其他资源受限环境中存在一定部署压力,并且其推理速度也难以充分满足部分低延迟翻译场景的需求。
针对这些问题,Hy-MT2进一步探索极低比特量化方案。除4-bit、8-bit 和 FP16 版本外,Hy-MT2还基于混元自研技术提供了 1.25-bit和2-bit版本,以适配不同硬件环境下的部署需求。特别地,基于混元自研Sherry 框架实现的1.25-bit 极低比特量化版本仅需约 440MB 存储空间即可部署,并且在苹果 A15 上的推理速度相比 Hy-MT1.5 的 4-bit 量化版本提升了 1.5 倍,进一步提升了实际可用性。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐

所有评论(0)