基于医学图像分类算法研究（四）——基于kvasir—dataset-v2+kvasir-capsule+hyper kvasir数据集整理后进行训练测试

m0_71102932

435人浏览 · 2026-04-03 11:39:49

m0_71102932 · 2026-04-03 11:39:49 发布

前言：老师说我们的数据集不够，展示的效果可能一般，没办法，只能多方面的去搜刮数据集，但是像这种肠胃病的公开数据集并不多，我能找到的也只有这几个能测试的，当然有些是视频，但是视频不太符合我们的要求，况且也不太会用。所以就找了这几个公开的数据集并统一整理了下，当然我也不确定整理的对不对，就是名字相同的归一类，可能会有些差异，但是就这样先用着，到时候具体的问题去到医院再深入研究咯。

一、数据集链接

根据上述的3个公开数据集进行整理，按照同名称放入同一类来扩充数据集，数据集较少的选择舍弃，最好规整下来有6万多张数据集，具体效果如下图所示。

本份数据集标有英文和中文，以及对应每个类别的数量。

二、图片展示

三、训练测试

我的效果图依然按照之前的那样展示，中间上方的是超参数的设置，左边是网络训练的过程，右边是网络测试生成的热力值图，右下方显示的是acc，F1,recall。分别是准确率，F1分数，召回率。左上方显示的是训练后模型权重文件的大小。下面将展示各模型的训练测试效果，有小模型到较大的模型依次展示。

1.efficentnet_b0

2.efficientnet_b1

3.efficientnet_b2

4.vit_tiny_r_s16_p8_224

5.volo_d1_224

6.vit_base_patch16_224

7.vit_base_patch16_clip_224

8.deit_base_patch16_224

9.swin_base_patch4_window7_224

10.swin_large_patch4_window7_224

11.swinv2_cr_large_224

三、结果汇总

四、总结

模型分析：

在轻量模型中，EfficientNet_B2 表现最佳，具有最高的准确率。

在中量模型中，ViT_Base_Patch16_Clip_224 在 F1 分数和召回率上表现最好。

在重量模型中，Swin_Large_Patch4_Window7_224 表现最佳，具有最高的准确率和 F1 分数。

综合评估：

所有模型中，ViT_Base_Patch16_Clip_224 在中量模型类别中表现最为优秀，具有最高的 F1 分数和召回率，准确率也非常高，是综合表现最好的模型。

Swin_Large_Patch4_Window7_224 重量模型虽然在准确率和 F1 分数上表现良好，但文件大小较大，可能不适合对存储空间有限制的应用场景。

轻量模型中，EfficientNet_B2 准确率最高，适合对计算资源有限制的环境。

建议：

如果对模型大小有严格要求，建议选择 EfficientNet_B2。

如果对模型性能有较高要求，且计算资源充足，建议选择 ViT_Base_Patch16_Clip_224。

对于需要在模型性能和大小之间取得平衡的情况，可以考虑 Volo_v1_224 或 DeiT_Base_Patch16_224。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

【Agent Loop|基座】从单代理到自我进化系统的14步路线

AtomGit开源社区

我每天在拼多多上处理上百个订单，被发票逼疯了，然后决定用ai写一个浏览器插件

《电商副业的发票噩梦：一个编程小白的自救之路》摘要：本文讲述了一位从事无货源跨境电商的创业者，如何从被重复性工作压垮到借助AI工具实现自动化的真实经历。作者每天需要处理大量订单，最痛苦的是在拼多多上逐个操作开发票——50个订单就要花费2个多小时重复点击。在尝试付费插件未果后，这个连JavaScript都不懂的电商人，受到AI编程视频启发，最终通过Claude等工具成功开发出自动化插件，解决了困扰