科大讯飞正式宣布 讯飞星火化学大模型 Spark Chemistry-X1-13B 与 讯飞文生音频模型 AudioFly 全面开源,并率先在国内领先的开源平台 GitCode 首发上线,助力前沿化学技术研究,以及声音生成技术和应用的探索。

即日起,全球开发者均可在 GitCode 平台免费获取 Spark Chemistry-X1-13B 与 AudioFly 模型,支持开发者在本地部署、推理、微调等多样化应用场景。

👉 模型开源地址:

讯飞星火化学大模型 Spark Chemistry-X1-13B

该模型基于讯飞星火 X1-0420 大模型,在多种化学任务数据集上进行了微调,展示了在解决复杂化学问题方面的卓越能力,同时保持了强大的通用能力。该模型在与化学相关的基准测试中表现出色,并且在大多数评估指标上明显优于领先的通用模型。

📌 模型特性亮点:

  • 将长思维链和快思考进行结合,是支持快思考和慢思考的统一模型。

  • 采用新的注意力掩码机制,将不同推理模式的训练阶段进行解耦,有效防止了混合模式数据分布之间的干扰。

  • 对高等知识问答、化学名称转换和分子性质预测等专门任务进行了多阶段优化,在相关评测上也取得了优异表现。

图片

* 评估数据集为自建,粗体表示当前评测 SOTA

* 所有模型均使用相同的评估方案进行评估,结果为大模型在不同任务上平均的 Zero-shot 效果

Spark-Chemistry-X1-13B 能够助力化学相关科研工作的高效推进与深远探索,使得开发者能够高效便捷搭建化学性质预测、化学知识检索问答等相关应用,同时也激发了更多跨领域创新可能,例如计算机科学与化学、生物学与化学等。

📮欢迎体验下载:https://ai.gitcode.com/ifly_opensource/Spark-Chemistry-X1-13B

讯飞文生音效模型 AudioFly

AudioFly 模型可基于文本描述输入,生成 44.1kHz 采样率的高质量音频,在文本与音效的匹配度上表现优异。AudioFly 采用了潜在扩散模型(LDM)架构,经海量多元声音数据训练,支持单事件、多事件场景。

在未进行针对性微调的情况下,AudioFly 在学术数据集 AudioCaps 测试集上取得了 SOTA 指标,证明了该模型良好的推广性和鲁棒性。

图片

* 以上为在学界大规模音频事件描述数据集 AudioCaps 上的评测结果

FD:衡量生成音频与真实音频特征分布上的差异

KL:衡量生成结果与真实数据概率分布上的差异

CLAP:计算生成的音频与文本描述的一致性

* 基线模型的指标引用了论文 Stable Audio Open 中的评测分数;AudioFly 评测复用 Stable Audio Open 开源的测试方法保证客观性。

AudioFly 的开源能够有效降低音效生成模型的使用门槛,开发者可以将其应用于短视频配音、有声故事生成等领域,释放更多声音创意潜力,创造出更多优质的声音内容。

📮欢迎体验下载:https://ai.gitcode.com/ifly_opensource/AudioFly

GitCode:AI驱动的新一代开源平台,赋能开发者创新

GitCode 是由全球知名中文 IT 技术交流平台 CSDN 基于在开源社区建设方面的深厚积淀,打造的面向全球开发者的新一代 AI 驱动的开源社区平台。

自 2023 年 9 月 22 日上线以来,平台发展迅猛,已汇聚了超过 700万 的注册用户,月日均新增用户超 2.5万,月活用户达 120万 ,已经成为颇具影响力的开源社区。

GitCode 依托强大的 AI 驱动能力和开源生态优势,为科大讯飞星火化学大模型与文生音效模型提供了全链路赋能:通过专业的模型托管支持、开放的开发者协同机制以及深度整合的开源社区资源,推动两大 AI 模型在科研与产业场景中的快速落地与创新应用。

🚀 立即下载体验,开启你的 星火化学大模型 & 文生音效模型 之旅!

Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐