从DeePMD到通用大模型的分子模拟新范式!https://mp.weixin.qq.com/s/3AWtKGtqBSVgDlJX29iLTw点此链接查看详情!

机器学习分子动力学背景

在科学研究领域的新范式——“AI for Science”时代,基于数据驱动的机器学习力场(ML-FFs)成功解决了第一性原理电子结构方法与传统经验力场之间的准确性和效率的问题。近年来,该领域呈现出井喷式的蓬勃发展,这一趋势在Web of Science平台的检索结果中得以印证。相关工作频繁登入Nature、Science、Cell等顶尖刊物。

随着计算机的算力快速发展,通过ML-FFs实现第一性原理级别精度的大规模的分子模拟研究已经成为可能.机器学习方法还使人们对原本认为了解的系统有了新的化学认知,例如小分子的非对称电子效应等现象,使研究者们能够更好地理解实验结果。因此,ML-FFs将可能成为现代计算化学的基本组成部分。然而,作为新兴的跨学科领域,该领域知识面广,门槛高,涉及量子化学、分子模拟和机器学习等多个领域。

02

学习目标

机器学习分子动力学目标:本次授课内容包括快速上手量化软件、入门和理解机器学习,熟练运用LAMMPS模拟软件,精通机器学习力场模型等,并附带大量相关代码与示例脚本。本次课不仅带来生态最完善的DeePMD系列软件的详解和使用,还将带来机器学习力场领域具有超高数据效率的等变模型(NequIP/MACE/Allegro),从而显著减轻高昂的数据生产成本。此外,还有机器学习力场领域的ChatGPT产品——开箱即用、免费开源的通用大模型(MACE-OFF23,MACE-MP0,DPA等)的使用与微调技巧。

03

讲师介绍

机器学习分子动力学主讲老师来自国内“双一流”高校,已发表SCI论文近20余篇,研究方向为基于机器学习的分子动力学模拟,包括 构建高效、高精度的AI分子力场模型,采用主动学习或大模型的知识蒸馏方法来获取高质量训练数据集, 开发基于C++的高性能的多GPU并行的LAMMPS的插件。熟知各种AI模型DeePMD, SchNet, DimeNet, SphereNet, DPA2和等变系列模型的Nequip, MACE, Allegro等,精通所有量子化学软件!

04

课程大纲

基于机器学习的分子动力学

第一部分(分子动力学基础)

1.理论内容

1.1科学研究的四范式:从大数据时代到AI4SCIENCE时代

1.2AI4SCIENCE时代的分子动力学模拟:从传统的经验力场方法和第一性原理方法到机器学习力场

1.3基于机器学习的分子动力学的特点,分类和工作流程,及发展趋势.

2.实操内容:

1.Linux系统与超算服务器的常规操作

2.Python(pycharm或vscode)的基本数据类型与代码调试

3.虚拟环境(Anaconda或Mamba)的使用

3.分子模拟软件介绍

3.1LAMMPS的入门与使用

3.2软件发展趋势与特点

3.3输入文件的详细解析与注意事项

3.4相关势函数的获取渠道

3.5分子模拟轨迹的后处理与分析

3.6机器学习势函数使用

4.OpenMM的入门与使用

4.1软件发展趋势与特点

4.2运行脚本与注意事项

4.3GAFF(Amber)力场的简要介绍

4.4使用sobtop软件和Python快速、自动化生成任意有机分子的力场参数文件(同时也适用GROMACS)

5.量子化学计算软件的介绍与快速上手

5.1CP2K软件的发展介绍与特点:

5.2软件发展趋势与特点

5.3运行命令与赝势文件

5.4使用MULTIWFN快速生成单点能或分子动力学模拟的输入文件

5.5输入文件的字段解释与注意事项

5.6使用Python实现自动化提交任务与任务后处理

5.7在CP2K中使用GFN1-xTB方法,适合新手的入门旋转!

6.ORCA软件的发展介绍与特点:

6.1软件发展趋势与特点

6.2使用MULTIWFN或基于模板快速生成单点能或分子动力学模拟的输入文件及注意事项

6.3使用Python实现自动化提交任务与任务后处理

6.4在ORCA中使用ωB97M-V泛函

7.XTB软件的发展介绍与特点:

7.1软件发展趋势与特点:发展迅猛!年被引用增长率高达87%;能够执行单点能,几何优化,分子模拟等功能

7.2安装与常用命令

7.3几种半经验方法的简要介绍

7.4使用Python实现自动化提交任务与任务后处理

7.5DFTB(简单介绍)

7.6执行单点能,几何优化,分子模拟等

7.7使用Python实现自动化提交任务与任务后处理

8.案例:传统力场方法与机器方法力场方法的对比

8.1使用OpenMM执行有机体系的分子模拟

8.2基于机器学习力场方法,结合LAMMPS执行合金,锂电池体系的分子模拟

8.3使用MDtraj等软件进行模拟结果的后处理分析与Python高质量科研绘图,包括:能量与力的预测曲线,径向分布函数,键长键角二面角分布,电池电压曲线等.

02

第二部分(机器学习力场的模型设计)

1.理论内容

1.1机器学习与深度学习的快速入门

1.1.1常见概念与分类

1.1.2机器学习的发展历史以及部分理论:通过可视化案例,理解神经网络的通用近似理论

1.1.3神经元,反向梯度下降,损失函数,过/欠拟合,残差连接等基本概念

1.1.4ANN, CNN, RNN, TRANSFORMER等深度神经网络的基本框架的介绍与特点

1.1.5相关学习资源的推荐

1.2科学领域的机器学习模型介绍

1.2.1物理约束/物理对称性

1.2.2高效描述局部环境方法的分类与特点

1.2.3基于核方法或深度神经网络方法

1.2.4基于描述符或分子图方法

1.3基于描述符的机器学习力场模型

1.3.1机器学习力场的开篇工作

1.3.2BPNN模型详解与发展

1.3.3生态最好的机器学习力场模型

1.3.4DeePMD系列工作的详解

1.3.5DeePMD的发展和几种描述符的介绍及特点

1.3.6DeePMD的压缩原理与特点

1.3.7DPGEN的工作原理

1.4基于图框架的机器学习力场模型

1.4.1图神经网络、图卷积网络和消息传递神经网络的发展与理解

1.4.2图神经网络的机器学习力场模型的经典模型

1.4.3SchNet模型的特点与代码实现

1.4.4基于三维空间建模的完备性与效率的几何系列模型:

1.4.5DimeNet,SphereNet和ComENet模型的详解与比较

1.4.6其他机器学习力场模型概述:DTNN和PhysNet等

2.实操内容

2.1DeePMD的离线安装与验证

2.2DeePMD输入文件详解:与理论课的模型框架相对应地进行超参数设定的讲解,及使用经验

2.3DeePMD的常见功能,包括训练,重启,冻结,压缩和测试

2.4DeePMD的常见问题与训练过程的分析

2.5综合使用LAMMPS和DeePMD, 执行高精度的分子动力学模拟

2.6分子模拟的数据后处理与分析

2.7DPGEN软件的介绍与工作流程

2.8DPGEN软件的输入和输出文件:param.json和machine.json文件的参数详解;跨计算分区的提交任务示例;不同量化级别方法的示例

2.9DPGEN软件的常用命令与使用经验,以及不同体系收敛的参考标准

03

第三部分(高级课程 —— 等变模型系列,领域热点)

1.理论内容

1.1不变系列模型的总结

1.1.1等变模型的概念,特点,分类和应用

1.1.2等变的概念

1.1.3等变模型的分类与特点

1.1.4等变模型的介绍:超高数据利用率与优秀的泛化能力

1.1.5群的简要介绍

1.1.6SO(3)群的简单入门与张量积

1.1.7欧式神经网络(E3NN)的介绍与注意事项

1.1.8高阶等变模型与传统模型,经验力场的区别

1.1.9常见误区的提醒

1.2等变机器学习力场的经典模型:

1.2.1Nat. Commun.上高被引的NequIP模型的详解和代码框架

2.实操内容

2.1DeePMD软件的进阶使用与补充讲解,包括多GPU并行训练

2.2LAMMPS以多GPU并行方式运行机器学习力场模型

2.3使用Python代码快速可视化机器学习力场模型在等变与不变设计上的区别

2.4使用多种机器学习的降维方法,结合K-Means聚类,从分子模拟轨迹中以低冗余方式提取多帧结构文件。

2.5NequIP模型的超参数介绍和使用

2.6复现Nat. Commun.文章结果,包括计算径向分布函数、键角分布等性质

2.7使用wandb进行超参数调优与训练过程中各种信息的可视化分析

04

第四部分 

1.理论部分

1.1高效/高精度的基于ACE的等变模型

1.2ACE方法,消息传递和等变框架的集大成者:MACE模型

1.3方法的完备性,效率和系列发展

1.4MACE模型在多个领域的应用

1.5机器学习力场领域的ChatGPT模型

1.6有机分子体系的通用大模型:MACE-OFF23

1.7几乎涵盖元素周期表所有元素的材料领域的通用大模型:MACE-MP0

1.8其他大模型的简要介绍

1.9适用于大规模GPU并行框架的等变模型

1.10消息传递模型的不足

1.11NequIP团队在Nat. Commun.上的新作--Allegro模型的方法详解与比较

1.12SevenNet模型的介绍与比较

2.实操部分

2.1MACE模型和Allegro模型的超参数介绍和使用经验

2.2MACE模型与DeePMD模型的对比,包括精度,数据效率等

2.3Libtorch与LAMMPS软件的编译

2.4机器学习力场领域的ChatGPT的使用与分析

2.5快速上手MACE-OFF23和MACE-MP0模型

2.6对通用大模型进行微调与分析

2.7DPA-1和DPA-2的介绍与特点

课程部分案例图片:

图片

图片

图片

机器学习分子动力学专题

(视频专题 即报即学)

录播回放+课程群答疑(共四天内容 提供全程视频回放)

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐