安捷伦气相色谱仪5977B数据交互
安捷伦 5977B(GC/MSD 单四极杆气质联用系统)的数据交互主要通过官方软件实现,包括 MassHunter(推荐用于 5977B)和 OpenLAB CDS(ChemStation Edition 或 EZChrom Edition)。下面从数据采集、导出、格式转换、自动化交互等方面进行说明。
1. 主要控制与数据采集软件
- MassHunter GC/MS Acquisition:用于仪器控制、调谐(Auto Tune)、数据采集(Scan/SIM/Synchronous SIM/Scan)、实时监控 TIC(总离子流色谱图)和谱图。
- 支持 GC(如 7890B/8860/8890)与 MSD 的实时通信(LVDS 或 LAN 连接)。
- 数据自动保存在 .D 文件夹中(每个样品一个 .D 目录,包含原始采集数据)。
- OpenLAB CDS:一体化平台,支持 GC/MS 控制、采集、处理和报告。界面更现代,适合合规实验室(数据完整性更好)。部分 5977B 系统可直接使用 OpenLAB CDS 控制。
数据采集后,原始文件为专有格式(.D),无法直接用文本编辑器打开,需要通过软件处理。
2. 数据导出与交互方式(常用操作)
在 MassHunter 中导出
- 定性分析 (Qualitative Analysis):
- 加载 .D 文件 → 查看 TIC、EIC、谱图。
- 右键谱图/峰表 → Export → 选择 CSV、文本文件或 Excel(可导出峰表、积分结果、化合物列表)。
- 支持库搜索(NIST、Wiley 等)后导出鉴定结果。
- 定量分析 (Quantitative Analysis):
- 创建 Batch → 处理方法 → 生成报告。
- 右键结果表 → Export → CSV/Excel(峰面积、浓度、保留时间等)。
- 3D MS 数据导出(全扫描谱图数据):
- 在旧版 MSD ChemStation(MassHunter 兼容经典模式)中,使用 Export 3-D Data 功能导出为 CSV 或其他格式(适合批量处理 TIC + 质谱矩阵)。
- MassHunter 中可通过 Qual 模块类似操作,或使用后处理工作流导出。
- 报告导出:支持 PDF、CSV、自定义模板报告。
在 OpenLAB CDS 中导出
- 色谱图信号导出为 CSV:
- 处理方法(Processing Method) → Tools → Post Processing plug-ins → 添加 CSV export 插件 → 配置后自动导出 TIC/EIC 等信号。
- AIA 格式导出(推荐用于外部交互):
- Processing Method → Post Processing Plugins → 添加 AIA export(OpenLAB CDS 2.8+ 支持)。
- AIA 是标准色谱数据交换格式(.cdf 或类似),便于导入其他软件。
- 右键峰表或结果集 → Export → CSV/Excel。
- 支持后处理插件实现批量自动化导出。
通用导出建议
- 手动导出:适合少量数据,在 Qual/Quant 模块中右键导出。
- 批量/自动化:使用 Post-run 宏(Macro)、序列后处理插件,或在方法中配置自动导出。
- MassHunter 支持简单宏编程(Macro Programming),可实现 DDE 连接或后运行导出。
- OpenLAB CDS 的 Post Processing Plugins 更友好,可设置序列运行后自动生成 CSV。
3. 常见数据格式与转换
- 原始格式:Agilent .D 文件夹(专有,包含 MS 数据、方法、调谐文件等)。
- 标准交换格式:
- AIA/netCDF(.cdf):色谱数据标准格式,支持大多数第三方软件。
- mzML / mzXML:质谱开放格式。
- 转换工具(推荐用于外部编程/分析):
- MSConvert(ProteoWizard 开源工具):将 Agilent .D 转换为 mzML、mzXML、CSV 等。适合 Python/R/MATLAB 等后续处理。
- Agilent 自带 GCMS Translator(免费):将旧 ChemStation 数据或 AIA 格式转换为 MassHunter 格式(反之也可)。
- OpenChrom 等开源软件也可直接读取 .D 并导出通用格式。
- 谱图单点导出:右键谱图 → Send to NIST MS Search(生成 .msp 文件)或直接导出为文本。
4. 编程/二次开发与自动化交互
- 无公开官方 SDK/API:Agilent 未提供完整的公开编程接口(不同于某些 LC/MS 系统)。
- 可用方式:
- Macro 脚本:MassHunter 支持宏语言,可编写 post-run 宏实现数据采集后自动导出(例如导出 3D 数据到 CSV)。社区有相关讨论,可参考 Agilent 论坛示例。
- Post Processing Plugins(OpenLAB CDS):最简单自动化方式,无需编程即可配置导出。
- 外部工具:
- Python + pyOpenMS / pymsfilereader / MSConvert 管道:先转换再处理。
- R 包(如 mzR)读取 mzML 后分析。
- 第三方软件:OpenChrom、Skyline(支持 Agilent GC-MS 数据)、NIST MS Search 等。
- 如果需要与 LIMS/ELN 系统集成,建议联系 Agilent 服务工程师,他们可提供定制宏或 iLab API(实验室管理层面)。
5. 实用建议(东京用户)
2. chromConverter(R 语言包,适合 R 用户)
3. Quadfiles(原 MassHunter File Reader,免费小工具)
4. 其他辅助或间接方式
5. 编程/脚本方式(无需额外 GUI 工具)
推荐选择建议
这些工具大多免费开源,但 Agilent .D 格式有版本差异(MassHunter vs ChemStation),建议先用小样本测试兼容性。如果您的 5977B 数据是较新 MassHunter 采集的,OpenChrom 和 chromConverter 的支持较好。
---------------------------------------------------------------------------------------------------------------------------------
- 软件版本:确认您的系统是 MassHunter 还是 OpenLAB CDS(5977B 常搭配 MassHunter,但新系统支持 OpenLAB)。推荐升级到最新兼容版本以获得更好导出功能。
- 手册下载:
- MassHunter Quick Start / Operation Manual(Agilent 官网搜索 G7077-9xxxx)。
- OpenLAB CDS 用户手册(重点看 Data Analysis 和 Post Processing 部分)。
- 常见问题解决:
- 批量导出慢?用 MSConvert 批量转换整个数据文件夹。
- 需要 Python 处理?先用 MSConvert 转 mzML,再用 spectrum_utils 或 matchms 库。
- 合规要求(数据完整性)?优先用 OpenLAB CDS,其审计追踪更完善。
- 如果您是二次开发(如自定义报告、机器学习峰识别),推荐先将数据转为 mzML/CSV,再用开源生态处理。
---------------------------------------------------------------------------------------------------------------------------除了 MSConvert(ProteoWizard)之外,还有几种工具可以直接或间接将安捷伦 5977B 的 .D 文件夹(GC/MS 数据)转换为 CSV 格式。以下是目前常用且有效的替代方案,我按实用性和易用性排序:
1. OpenChrom(最推荐的免费开源替代)
- 功能:直接打开 Agilent .D 文件夹(支持 MassHunter 和 ChemStation 数据),可查看 TIC、EIC、谱图,并批量导出为 CSV(包括 3D MS 数据:时间 × m/z × 强度矩阵,非常适合后续 Python/R 处理)。
- 优点:
- 支持完整谱图数据导出(不是只有峰表)。
- 有批量处理功能。
- 还可导出 mzML、CDF 等格式。
- 缺点:新版本(1.5+)命令行接口可能受限,建议使用较稳定旧版(如 1.4.x,如果还能找到)或图形界面操作。
- 使用方式:安装后加载 .D 文件 → 处理 → Export → 选择 CSV(可指定 3D 数据)。
- 官网:openchrom.net(需注册免费插件获取 Agilent 支持)。
- 功能:专门为色谱数据设计的 R 包,直接读取 Agilent MassHunter .D 文件夹和 ChemStation 文件,支持转换为 R 对象或导出 CSV。
- 支持格式:Agilent ChemStation / MassHunter .D、.ch、.ms 等。
- 优点:无需额外转换软件,可直接在 R 中批量处理并导出 CSV;集成 OpenChrom 解析器(可选)。
- 安装:通过 R 的 install.packages("chromConverter") 或 GitHub。
- 特别适合统计分析或自动化脚本。
- 文档:https://ethanbass.github.io/chromConverter/
- 功能:专门将 Agilent ChemStation 或 MassHunter 的四极杆 MS 原始数据导出为 纯文本(plain text),本质上就是 CSV 格式(时间、m/z、强度等)。
- 优点:轻量、专注 GC-MS 四极杆数据(如 5977B),导出快速。
- 获取:https://www.ms-utils.org/ 或 QuadTech Associates 网站免费下载。
- 适合只需要原始 MS 数据的用户。
- 先导出 AIA/netCDF (.cdf) 再转 CSV:
- 使用 Agilent 自带工具或 quafiles(同 ms-utils.org)将 .D 导出为 AIA/CDF 格式。
- 然后用简单脚本或工具(如 R 包 mzR、xcms,或 GitHub 上的 CDF-to-CSV 脚本)将 .cdf 转为 CSV。
- 优点:CDF 是标准交换格式,很多软件都支持。
- UniChrom 控制台转换器(针对旧 ChemStation):
- 可将 .ch 或 .ms 文件直接转为 CSV。
- 命令行:./ucc infile.ch outfile.csv
- Agilent 官方导出(非纯原始数据):
- 在 MassHunter Qualitative Analysis 中右键峰表或色谱图 → Export → CSV(适合峰积分结果、化合物列表)。
- 在 OpenLAB CDS 中使用 Post Processing Plugins → CSV Export(可配置序列后自动导出 TIC/EIC 信号)。
- 注意:这些通常导出处理后的数据,不是完整的 3D 原始谱图矩阵。
- Python:结合 pymsfilereader(老版)或先用 OpenChrom / chromConverter 辅助,再解析。
- R:直接用 chromConverter 或 read_agilent_d 函数。
- MATLAB:可通过自定义脚本读取 .D 中的二进制文件(DATA.MS 等),但较复杂。
- 需要完整 3D MS 数据 + 批量处理 → OpenChrom 或 chromConverter(R 用户首选)。
- 轻量、只想快速导出文本 → Quadfiles。
- 已经在用 R → chromConverter 最方便。
- 想保留标准格式 → 先转 CDF,再用现有工具转 CSV。
Quadfiles(原名 MassHunter File Reader),它专门负责将安捷伦 .D 文件夹(ChemStation 或 MassHunter 四极杆 GC/MS 数据,如 5977B)中的原始 MS 数据导出为纯文本(plain text)格式,本质上就是易于转换为 CSV 的文本文件。
Quadfiles 的具体功能与导出方式
支持格式:Agilent ChemStation 和 MassHunter 的单四极杆 MS 数据文件(.D 文件夹中的 DATA.MS 等二进制文件)。 导出内容:原始四极杆 MS 数据,通常包括 扫描时间(Retention Time)、m/z 值、离子强度(Intensity) 等。可导出为:
- 纯文本文件(.txt)
- 格式类似 CSV(列分隔,可用逗号、空格或 Tab 分隔)
- 适合后续用 Excel、Python、R、MATLAB 等打开或进一步处理成标准 CSV。
优点:轻量级(单个可执行文件)、无需安装 MassHunter/OpenLAB、导出速度快、专注原始数据(不是处理后的峰表)。
如何获取和使用 Quadfiles
注意:
其他类似轻量工具补充(如果 Quadfiles 不完全满足)
2. 各工具的主要区别(针对 Agilent .D 使用场景)
3. 推荐使用顺序(针对 5977B GC/MS 数据转 CSV)
额外提示:
- 下载地址(免费):
- 主要推荐:**https://www.quadtechassociates.com/**(Quadtech Associates 官网,在 “Other Programs” 或免费软件部分)。
- 备用:**https://www.ms-utils.org/**(软件列表中明确列出 Quadfiles,并链接到 Quadtech 网站)。
- 使用步骤(典型操作):
- 下载后解压,运行 Quadfiles.exe(Windows 程序)。
- 打开一个或多个 .D 文件夹(程序会自动读取文件夹内的 MS 数据文件)。
- 选择导出选项:
- 导出 完整谱图数据(3D-like:时间 × m/z × 强度)。
- 或单个扫描的质谱图。
- 选择输出格式为 plain text 或 tab/comma delimited(这基本就是 CSV)。
- 指定保存路径,程序会生成对应的 .txt 文件(您可在 Excel 中打开并另存为 .csv,或用脚本直接处理)。
- 支持批量处理多个 .D 文件。
- Quadfiles 主要针对四极杆数据(5977B 属于单四极杆,完美适配),对 TOF 或其他高分辨率数据支持可能有限。
- 导出的文本文件可能需要简单调整分隔符(用记事本或 Python 的 pandas 很容易转为标准 CSV)。
- 如果您需要的是 TIC 曲线(总离子流)或 EIC,程序通常也能导出;如果需要完整 3D 矩阵,导出后可用脚本整理。
- quafiles(注意拼写差异,有时社区提到):部分用户在 Reddit 等地方提到用 quafiles(来自 ms-utils.org)将 .D 导出为 AIA/CDF 格式,然后再转 CSV。这和 Quadfiles 是同一类工具的不同称呼或相关程序,常被用来导出标准交换格式。
- 如果 Quadfiles 导出格式不够灵活,推荐结合 chromConverter(R 语言包)直接读取 .D 并导出 CSV(支持 Agilent MassHunter .D)。
---------------------------------------------------------------------------------------------------------------------------关于以下 5 个工具(Quadfiles、MSConvert、ThermoRawFileParser、Proteome Discoverer、GNPS)是否能将安捷伦 .D 文件(5977B 等 GC/MS 单四极杆数据)直接或间接转换为 CSV 格式的总结,以及它们之间的主要区别。
1. 是否支持 Agilent .D → CSV?
工具 是否支持 Agilent .D 转换为 CSV? 支持程度与说明 Quadfiles (原 MassHunter File Reader) 支持(直接) 专门为 Agilent 四极杆 MS(ChemStation / MassHunter .D)设计。直接读取 .D 文件夹,导出原始 MS 数据为 纯文本(plain text),本质上是易于转为 CSV 的格式(包含扫描时间、m/z、强度等)。轻量、快速,适合原始谱图数据导出。不需要安装 MassHunter。 MSConvert (ProteoWizard) 支持(间接推荐) 官方支持 Agilent .D,可转换为 mzML / mzXML 等开放格式。然后用脚本(Python pandas、R 等)或工具将 mzML 转为 CSV(3D 谱图矩阵或峰表)。MSConvert 本身不直接输出 CSV,但这是最通用、最可靠的路径。 ThermoRawFileParser 不支持 专为 Thermo .RAW 文件设计,只能处理 Thermo 数据。不支持 Agilent .D。 Proteome Discoverer 不支持直接转换 Thermo 公司的蛋白质组学工作流软件。可导入 mzML 等格式并导出处理后的结果为 CSV(肽段、定量等),但不能直接打开或转换 Agilent .D 原始文件。需要先用 MSConvert 转格式。 GNPS 不支持直接转换 GNPS(分子网络平台)不支持直接上传 .D 文件。它推荐先用 MSConvert 将 .D 转为 mzML/mzXML,再上传。GNPS 本身不提供转换工具。 结论:
- 真正能直接处理 Agilent .D 并导出类 CSV 的:只有 Quadfiles。
- 最常用、最推荐的路径:MSConvert(转 mzML)→ 脚本转 CSV。
- 其余三个工具(ThermoRawFileParser、Proteome Discoverer、GNPS)不适合直接处理 Agilent .D,它们主要针对 Thermo 数据或下游分析。
- Quadfiles:
- 定位:轻量级、专注 Agilent 四极杆原始数据读取与导出。
- 导出内容:原始 MS 数据(时间 × m/z × 强度),纯文本格式(可轻松改为 CSV)。
- 优点:无需其他软件、速度快、针对 5977B 等单四极杆 GC-MS 优化。
- 缺点:功能较单一,可能不支持最新 MassHunter 版本的所有结构;导出格式需要手动调整分隔符。
- 适合人群:需要快速获取原始谱图矩阵、后续用 Python/R 处理的用户。
- MSConvert (ProteoWizard):
- 定位:通用质谱文件转换器(金标准)。
- 导出内容:先转成标准开放格式(mzML/mzXML),再二次转为 CSV。
- 优点:支持几乎所有主流厂商(包括 Agilent),转换可靠、可批量处理、保留完整元数据;社区支持好。
- 缺点:不直接出 CSV,需要额外一步(但非常简单,用 Python 的 pymzml + pandas 或 R 的 mzR 即可)。
- 适合人群:大多数实验室用户,尤其是需要标准格式后续分析(Python、R、MATLAB、OpenChrom、Skyline 等)时。
- ThermoRawFileParser:
- 定位:Thermo 专用转换器(转 mzML/MGF/JSON)。
- 区别:完全不兼容 Agilent .D。如果您的数据是 Thermo 的才用它。
- 适合人群:Thermo 用户。
- Proteome Discoverer:
- 定位:Thermo 的商业蛋白质组学/定量分析平台。
- 区别:侧重鉴定、定量、报告生成。可导出搜索结果为 CSV,但不是用来转换原始 .D 文件的工具。
- 适合人群:做蛋白质组或复杂定量分析,且已有 Thermo 生态的用户。
- GNPS:
- 定位:在线分子网络、代谢组学/天然产物分析平台(支持 GC-MS)。
- 区别:分析平台,不是转换工具。必须先用 MSConvert 转格式才能上传。
- 适合人群:想做分子网络、特征比对、库搜索的用户。
- 最简单直接:用 Quadfiles 导出纯文本 → 用 Excel 或 Python 转为标准 CSV。
- 最通用可靠:用 MSConvert 转 mzML → 用以下方式转 CSV:
- Python:pymzml 或 spectrum_utils 读取 mzML → pandas 保存为 CSV。
- R:mzR 或 chromConverter 包。
- OpenChrom:直接打开 mzML 或 .D 并导出 CSV。
- 如果您后续要做分子网络:MSConvert → mzML → 上传 GNPS。
- 如果是蛋白质组学相关:MSConvert → mzML → 导入 Proteome Discoverer。
- 对于完整 3D 谱图矩阵(时间- m/z-强度),Quadfiles 或 MSConvert + 脚本 是最佳选择。
- 对于峰表 / 积分结果,在 MassHunter Qual/Quant 中直接右键导出 CSV 更方便。
- Agilent .D 格式有 ChemStation 和 MassHunter 两种,Quadfiles 和 MSConvert 都能自动识别,但建议用小样本测试兼容性。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐
所有评论(0)