科大讯飞星火化学大模型与文生音效模型首发登陆 GitCode
科大讯飞正式宣布 讯飞星火化学大模型 Spark Chemistry-X1-13B 与 讯飞文生音频模型 AudioFly 全面开源,并率先在国内领先的开源平台 GitCode 首发上线,助力前沿化学技术研究,以及声音生成技术和应用的探索。
即日起,全球开发者均可在 GitCode 平台免费获取 Spark Chemistry-X1-13B 与 AudioFly 模型,支持开发者在本地部署、推理、微调等多样化应用场景。
👉 模型开源地址:
-
Spark Chemistry-X1-13B:https://ai.gitcode.com/ifly_opensource/Spark-Chemistry-X1-13B
讯飞星火化学大模型 Spark Chemistry-X1-13B
该模型基于讯飞星火 X1-0420 大模型,在多种化学任务数据集上进行了微调,展示了在解决复杂化学问题方面的卓越能力,同时保持了强大的通用能力。该模型在与化学相关的基准测试中表现出色,并且在大多数评估指标上明显优于领先的通用模型。
📌 模型特性亮点:
-
将长思维链和快思考进行结合,是支持快思考和慢思考的统一模型。
-
采用新的注意力掩码机制,将不同推理模式的训练阶段进行解耦,有效防止了混合模式数据分布之间的干扰。
-
对高等知识问答、化学名称转换和分子性质预测等专门任务进行了多阶段优化,在相关评测上也取得了优异表现。
* 评估数据集为自建,粗体表示当前评测 SOTA
* 所有模型均使用相同的评估方案进行评估,结果为大模型在不同任务上平均的 Zero-shot 效果
Spark-Chemistry-X1-13B 能够助力化学相关科研工作的高效推进与深远探索,使得开发者能够高效便捷搭建化学性质预测、化学知识检索问答等相关应用,同时也激发了更多跨领域创新可能,例如计算机科学与化学、生物学与化学等。
📮欢迎体验下载:https://ai.gitcode.com/ifly_opensource/Spark-Chemistry-X1-13B
讯飞文生音效模型 AudioFly
AudioFly 模型可基于文本描述输入,生成 44.1kHz 采样率的高质量音频,在文本与音效的匹配度上表现优异。AudioFly 采用了潜在扩散模型(LDM)架构,经海量多元声音数据训练,支持单事件、多事件场景。
在未进行针对性微调的情况下,AudioFly 在学术数据集 AudioCaps 测试集上取得了 SOTA 指标,证明了该模型良好的推广性和鲁棒性。
* 以上为在学界大规模音频事件描述数据集 AudioCaps 上的评测结果
FD:衡量生成音频与真实音频特征分布上的差异
KL:衡量生成结果与真实数据概率分布上的差异
CLAP:计算生成的音频与文本描述的一致性
* 基线模型的指标引用了论文 Stable Audio Open 中的评测分数;AudioFly 评测复用 Stable Audio Open 开源的测试方法保证客观性。
AudioFly 的开源能够有效降低音效生成模型的使用门槛,开发者可以将其应用于短视频配音、有声故事生成等领域,释放更多声音创意潜力,创造出更多优质的声音内容。
📮欢迎体验下载:https://ai.gitcode.com/ifly_opensource/AudioFly
GitCode:AI驱动的新一代开源平台,赋能开发者创新
GitCode 是由全球知名中文 IT 技术交流平台 CSDN 基于在开源社区建设方面的深厚积淀,打造的面向全球开发者的新一代 AI 驱动的开源社区平台。
自 2023 年 9 月 22 日上线以来,平台发展迅猛,已汇聚了超过 700万 的注册用户,月日均新增用户超 2.5万,月活用户达 120万 ,已经成为颇具影响力的开源社区。
GitCode 依托强大的 AI 驱动能力和开源生态优势,为科大讯飞星火化学大模型与文生音效模型提供了全链路赋能:通过专业的模型托管支持、开放的开发者协同机制以及深度整合的开源社区资源,推动两大 AI 模型在科研与产业场景中的快速落地与创新应用。
🚀 立即下载体验,开启你的 星火化学大模型 & 文生音效模型 之旅!
更多推荐
所有评论(0)