超万张高清药片图像数据集助力智能医疗检测与识别算法研发

yeez_tech007

508人浏览 · 2026-04-17 10:43:23

yeez_tech007 · 2026-04-17 10:43:23 发布

超万张高清药片图像数据集助力智能医疗检测与识别算法研发

引言与背景

在医疗健康领域，药品识别与检测是保障用药安全的重要环节。随着人工智能技术的快速发展，基于计算机视觉的药片自动识别系统在智能药房、用药辅助、药品监管等场景中展现出巨大的应用潜力。本数据集汇集了来自多个权威数据源的药片图像资源，经过精心整合与标准化处理，构建了一个大规模、高质量的药片检测数据集。该数据集包含完整的原始图像文件和精确的标注信息，采用YOLO格式进行标注，可直接用于目标检测模型的训练与评估。数据集涵盖了不同光照条件、拍摄角度、背景环境下的药片图像，具有极高的多样性和代表性，为药片检测算法的研发、医疗影像分析研究以及智能用药辅助系统的开发提供了坚实的数据基础。

数据基本信息

数据集规模概览

本数据集共包含10863张高质量药片图像，其中训练集9506张，验证集1357张。数据集累计标注了91579个药片实例，平均每张图像包含约8.43个药片目标。数据集采用标准的YOLO格式进行标注，包含完整的原始图像文件和对应的标注文件，确保数据的完整性和可用性。

数据字段说明

字段名称	字段类型	字段含义	数据示例	完整性
图像文件	JPG/PNG	原始药片图像	VAIPE-mosaic_mosaic_01111.jpg	100%完整
标注文件	TXT	YOLO格式标注	VAIPE-mosaic_mosaic_01111.txt	100%完整
类别标签	整数	目标类别编号	0 (药片)	100%完整
中心坐标X	浮点数	归一化中心X坐标	0.237104	100%完整
中心坐标Y	浮点数	归一化中心Y坐标	0.462466	100%完整
宽度	浮点数	归一化边界框宽度	0.129195	100%完整
高度	浮点数	归一化边界框高度	0.111198	100%完整

数据来源分布

数据来源	训练集图片	验证集图片	图片总数	训练集实例	验证集实例	实例总数	占比
NIH-Pill-rximage	914	131	1045	23032	3346	26378	28.80%
VAIPE-mosaic	3123	447	3570	20766	2941	23707	25.89%
Personal-251127	1093	157	1250	19043	2711	21754	23.76%
VAIPE-reannotated	2155	307	2462	8367	1236	9603	10.49%
VAIPE-test	1312	188	1500	4167	604	4771	5.21%
Personal-251124	324	46	370	2611	326	2937	3.21%
Ultralytics-medical-pills	90	12	102	1595	210	1805	1.97%
Various	124	17	141	533	91	624	0.68%
Negatives	371	52	423	0	0	0	-

图像分辨率分布

分辨率	图片数量	占比
960x640	27	27.00%
480x640	23	23.00%
720x720	14	14.00%
640x480	12	12.00%
900x900	9	9.00%
1024x1024	8	8.00%
其他分辨率	7	7.00%

图像格式分布

文件格式	图片数量	占比
JPEG	10752	98.98%
PNG	111	1.02%

数据集特点统计

统计项目	数值
图片总数	10863张
训练集图片	9506张
验证集图片	1357张
标注实例总数	91579个
平均每张图片实例数	8.43个
正样本图片数量	10440张
负样本图片数量	423张
最小图片宽度	300像素
最大图片宽度	1024像素
平均图片宽度	759像素
最小图片高度	246像素
最大图片高度	1024像素
平均图片高度	689像素

数据优势

优势特征	具体表现	应用价值
数据规模庞大	包含10863张高质量图像，91579个标注实例	为深度学习模型提供充足的训练数据，提升模型泛化能力
来源多样化	整合9个不同数据源，涵盖多种拍摄场景和条件	增强模型对不同环境的适应能力，提高实际应用鲁棒性
完整原始文件	提供完整的JPG/PNG原始图像文件	支持图像预处理、数据增强等多样化研究需求
高质量标注	采用YOLO格式的精确边界框标注	直接用于目标检测模型训练，无需额外标注工作
负样本支持	包含423张无药片的负样本图像	提升模型对非目标场景的识别能力，降低误检率
多分辨率覆盖	图片分辨率从300x246到1024x1024	适应不同应用场景的分辨率需求，增强模型适应性
标准化格式	统一的YOLO标注格式，规范的目录结构	便于快速集成到现有训练流程，降低使用门槛
训练验证分离	预先划分训练集和验证集，比例合理	支持标准化的模型训练与评估流程
实例密度丰富	平均每张图片8.43个药片实例	适合密集目标检测研究，提升小目标检测能力
医疗场景专业	专门针对药片检测任务构建	为医疗健康领域的AI应用提供专业数据支持
数据来源	典枢

数据样例

本数据集包含完整的原始图像文件，但由于文件数量庞大且图像文件无法直接在文本中展示，以下提供标注文件样例以展示数据格式和内容。实际数据集中包含所有对应的完整原始图像文件可供使用。

标注样例展示

样例1：VAIPE-mosaic_mosaic_01111.txt（训练集）

实例数量：3个
标注内容：
- 0 0.237104 0.462466 0.129195 0.111198
- 0 0.784810 0.467209 0.112975 0.106278
- 0 0.691843 0.452034 0.043122 0.087318

样例2：VAIPE-mosaic_VAIPE_P_1155_0__VAIPE_P_1155_1.txt（训练集）

实例数量：6个
标注内容：
- 0 0.353724 0.513822 0.111239 0.197255
- 0 0.254727 0.416986 0.183345 0.123588
- 0 0.278496 0.631265 0.075359 0.116150
- 0 0.517614 0.658427 0.106321 0.112926
- 0 0.629846 0.435866 0.098841 0.107966
- 0 0.742078 0.642590 0.095832 0.107435

样例3：VAIPE-reannotated_VAIPE_P_369_5.txt（训练集）

实例数量：3个
标注内容：
- 0 0.566462 0.278330 0.144681 0.167762
- 0 0.542087 0.444624 0.087162 0.205866
- 0 0.410797 0.444473 0.051951 0.071537

样例4：VAIPE-reannotated_VAIPE_P_580_4.txt（训练集）

实例数量：4个
标注内容：
- 0 0.267360 0.604275 0.233179 0.090850
- 0 0.768747 0.614885 0.214960 0.130431
- 0 0.509281 0.569398 0.263777 0.078531
- 0 0.507642 0.428956 0.241568 0.087642

样例5：VAIPE-reannotated_VAIPE_P_208_1.txt（训练集）

实例数量：1个
标注内容：
- 0 0.633302 0.426009 0.160855 0.057909

样例6：VAIPE-mosaic_mosaic_00569.txt（训练集）

实例数量：9个
标注内容：
- 0 0.372379 0.601014 0.078140 0.117031
- 0 0.181744 0.618607 0.075069 0.116941
- 0 0.297110 0.693564 0.076370 0.117556
- 0 0.446648 0.693564 0.076370 0.117556
- 0 0.596186 0.693564 0.076370 0.117556
- 0 0.745724 0.693564 0.076370 0.117556
- 0 0.895262 0.693564 0.076370 0.117556
- 0 0.372379 0.820576 0.078140 0.117031
- 0 0.521917 0.820576 0.078140 0.117031

样例7：Personal-251127_L0140.txt（训练集）

实例数量：24个
标注内容：
- 0 0.403702 0.716037 0.059205 0.083020
- 0 0.314010 0.470800 0.072392 0.071070
- 0 0.254712 0.540542 0.052743 0.052434
- 0 0.314010 0.609876 0.072392 0.071070
- 0 0.373308 0.609876 0.052743 0.052434
- （共24个实例，展示部分）

样例8：VAIPE-reannotated_VAIPE_P_873_0.txt（训练集）

实例数量：6个
标注内容：
- 0 0.319768 0.474104 0.115120 0.230969
- 0 0.283256 0.273516 0.077275 0.138633
- 0 0.474066 0.238452 0.103919 0.140475
- 0 0.615432 0.382945 0.092847 0.156283
- 0 0.728654 0.516738 0.084562 0.128475
- 0 0.845921 0.628471 0.076384 0.114827

样例9：VAIPE-mosaic_mosaic_01663.txt（训练集）

实例数量：12个
标注内容：
- 0 0.237107 0.471753 0.110097 0.208432
- 0 0.373901 0.308429 0.076669 0.112719
- 0 0.397919 0.651357 0.155175 0.137094
- 0 0.546283 0.471753 0.110097 0.208432
- 0 0.683077 0.308429 0.076669 0.112719
- （共12个实例，展示部分）

样例10：Personal-251127_L0632.txt（训练集）

实例数量：5个
标注内容：
- 0 0.130396 0.460296 0.260792 0.278992
- 0 0.445323 0.476095 0.279856 0.306280
- 0 0.769495 0.516203 0.280552 0.280304
- 0 0.130396 0.823756 0.260792 0.278992
- 0 0.445323 0.839555 0.279856 0.306280

样例11：VAIPE-mosaic_mosaic_01105.txt（训练集）

实例数量：2个
标注内容：
- 0 0.230208 0.510661 0.105250 0.117460
- 0 0.745140 0.564622 0.082028 0.139183

样例12：VAIPE-reannotated_VAIPE_P_1012_9.txt（训练集）

实例数量：3个
标注内容：
- 0 0.566526 0.435940 0.151090 0.086621
- 0 0.502431 0.462279 0.103809 0.060916
- 0 0.470618 0.533512 0.136373 0.095890

样例13：VAIPE-reannotated_VAIPE_P_9_6.txt（训练集）

实例数量：5个
标注内容：
- 0 0.381634 0.805091 0.164708 0.224633
- 0 0.367237 0.403588 0.191203 0.233569
- 0 0.626968 0.254029 0.221542 0.222480
- 0 0.612621 0.655508 0.191203 0.233569
- 0 0.872356 0.505968 0.164708 0.224633

样例14：NIH-Pill-rximage_A_0001.txt（验证集）

实例数量：约15个
标注格式：YOLO标准格式

样例15：Negatives_IMG_3465.txt（验证集）

实例数量：0个
说明：负样本，无药片标注

样例16：Various_tablets(4).txt（验证集）

实例数量：约8个
标注格式：YOLO标准格式

样例17：Ultralytics-medical-pills样本（训练集）

实例数量：约10个
标注格式：YOLO标准格式

样例18：Personal-251124_IMG_3542.txt（验证集）

实例数量：约6个
标注格式：YOLO标准格式

样例19：VAIPE-test_TEST_VAIPE_P_7_6.txt（验证集）

实例数量：约4个
标注格式：YOLO标准格式

样例20：VAIPE-reannotated_VAIPE_PI_5635.txt（验证集）

实例数量：约7个
标注格式：YOLO标准格式

应用场景

智能药房自动化系统

智能药房作为现代医疗体系的重要组成部分，正逐步实现药品管理的自动化与智能化。本数据集为智能药房系统中的药片识别模块提供了理想的训练数据。通过利用数据集中超过一万张的高质量药片图像，可以训练出高精度的药片检测模型，实现对处方药品的自动识别与核验。系统可以在药品分发过程中自动检测药片的数量、位置和状态，确保药品分发的准确性和安全性。数据集中包含的负样本图像（无药片场景）能够有效训练模型识别空盘或异常情况，避免误检和漏检。此外，数据集涵盖的多种拍摄角度和光照条件，使得训练出的模型能够适应药房内不同的环境变化，保证系统的稳定运行。基于完整原始图像的训练，模型可以学习到药片的纹理、颜色、形状等深层特征，提升识别的准确率和鲁棒性，为智能药房的无人化运营提供技术保障。

移动医疗用药辅助应用

随着移动互联网医疗的快速发展，基于智能手机的用药辅助应用越来越受到患者和医护人员的青睐。本数据集可用于开发药片识别移动应用，帮助患者快速识别药品信息，避免用药错误。患者只需通过手机摄像头拍摄药片图像，应用即可自动识别药片的种类、数量，并提供相应的用药指导。数据集中包含的不同分辨率图像（从300x246到1024x1024）使得模型能够适应不同型号手机的拍摄质量，保证识别效果的一致性。平均每张图片8.43个药片实例的标注密度，为模型学习密集场景下的药片检测提供了丰富样本，使得应用能够准确识别药瓶或药盒中的多种药片。数据集的多来源特性确保了模型对不同品牌、不同类型药片的识别能力，覆盖了常见的处方药和非处方药。通过完整原始图像的训练，应用可以实现对药片外观特征的深度理解，即使在部分遮挡或光照不佳的情况下也能保持较高的识别准确率，为患者提供可靠的用药安全保障。

医疗影像分析与研究

在医疗影像分析领域，药片检测是一项具有挑战性的研究课题，涉及目标检测、图像分割、特征提取等多个技术方向。本数据集为医疗影像分析研究提供了大规模、高质量的实验数据。研究人员可以利用数据集中的91579个标注实例，开展药片检测算法的优化研究，探索更高效的目标检测网络结构和训练策略。数据集中包含的负样本图像为研究小样本学习和异常检测提供了宝贵资源，有助于提升模型对非目标场景的判别能力。不同数据来源的图像具有各自的特点，如VAIPE数据集的多样性、NIH数据集的专业性、Personal数据集的真实性，这些差异为研究跨域适应和迁移学习提供了理想的数据基础。完整原始图像的可用性使得研究人员可以开展图像预处理、数据增强、特征工程等多方面的研究工作，推动医疗影像分析技术的进步。数据集的标准化标注格式也便于与其他数据集进行融合和对比实验，促进学术交流和技术创新。

药品监管与质量控制

药品监管是保障公众用药安全的重要环节，传统的监管方式主要依赖人工检查，效率低下且容易出错。本数据集可用于开发基于计算机视觉的药品自动检测系统，辅助药品监管部门开展质量检查工作。系统可以对药品生产线上的药片进行实时检测，识别外观缺陷、数量异常、混入异物等问题，及时发现和剔除不合格产品。数据集中包含的10440张正样本图像和423张负样本图像，为训练高精度的检测模型提供了平衡的数据支持，确保模型既能准确识别药片，又能有效排除干扰。数据集的多来源特性使得训练出的模型能够适应不同厂家、不同批次药品的检测需求，具有广泛的适用性。基于完整原始图像的分析，系统可以学习到药片的细微特征差异，实现对外观相似药品的准确区分，为药品防伪和溯源提供技术支持。此外，数据集还可用于药品包装检测、说明书识别等相关应用，构建完整的药品质量智能监管体系。

深度学习模型训练与评估

本数据集是深度学习模型训练与评估的理想资源，特别适用于目标检测领域的研究和应用开发。数据集采用标准的YOLO格式标注，与主流的目标检测框架（如YOLO系列、Faster R-CNN、SSD等）完全兼容，研究人员可以直接使用数据集进行模型训练，无需额外的数据预处理工作。训练集和验证集的预先划分遵循了机器学习的最佳实践，训练集占比87.51%，验证集占比12.49%，比例合理，能够有效评估模型的泛化能力。数据集中平均每张图片8.43个实例的标注密度，为密集目标检测研究提供了丰富的样本，有助于提升模型在复杂场景下的检测性能。不同分辨率的图像覆盖了从低分辨率到高分辨率的范围，使得研究人员可以探索多尺度目标检测技术，提升模型对不同大小目标的检测能力。数据集的大规模特性（超过一万张图像，九万多个实例）满足了深度学习模型对大量训练数据的需求，能够有效避免过拟合问题，提升模型的鲁棒性和泛化能力。完整原始图像的可用性还支持研究人员开展数据增强、迁移学习、领域适应等高级训练策略的研究，推动目标检测技术的进步。

结尾

本药片检测数据集通过整合多个权威数据源，构建了一个大规模、高质量、多样化的图像数据资源，为医疗健康领域的人工智能应用提供了坚实的数据基础。数据集包含10863张完整原始图像和91579个精确标注实例，涵盖了多种拍摄场景、光照条件和药片类型，具有极高的实用价值和研究意义。数据集的核心优势在于其完整性和标准化：提供完整的原始图像文件，支持多样化的研究和应用需求；采用统一的YOLO标注格式，便于快速集成到现有训练流程；预先划分的训练集和验证集，支持标准化的模型评估。这些特点使得数据集能够广泛应用于智能药房、移动医疗、影像分析、药品监管等多个领域，推动医疗健康行业的智能化发展。数据集采用GNU Affero General Public License v3开源协议发布，鼓励学术界和产业界的研究人员自由使用和改进。有需要可私信获取更多关于数据集的技术支持和使用指导信息。