前言:老师说我们的数据集不够,展示的效果可能一般,没办法,只能多方面的去搜刮数据集,但是像这种肠胃病的公开数据集并不多,我能找到的也只有这几个能测试的,当然有些是视频,但是视频不太符合我们的要求,况且也不太会用。所以就找了这几个公开的数据集并统一整理了下,当然我也不确定整理的对不对,就是名字相同的归一类,可能会有些差异,但是就这样先用着,到时候具体的问题去到医院再深入研究咯。

一、数据集链接

1.Kvasir-Dataset-V2

Simula Datasets - Kvasirhttps://datasets.simula.no/kvasir/

2.kvasir-capsule

Simula Datasets - Kvasir Capsulehttps://datasets.simula.no/kvasir-capsule/

3.hyper kvasir

Simula Datasets - HyperKvasirhttps://datasets.simula.no/hyper-kvasir/ 

根据上述的3个公开数据集进行整理,按照同名称放入同一类来扩充数据集,数据集较少的选择舍弃,最好规整下来有6万多张数据集,具体效果如下图所示。

本份数据集标有英文和中文,以及对应每个类别的数量。

二、图片展示

三、训练测试

我的效果图依然按照之前的那样展示,中间上方的是超参数的设置,左边是网络训练的过程,右边是网络测试生成的热力值图,右下方显示的是acc,F1,recall。分别是准确率,F1分数,召回率。左上方显示的是训练后模型权重文件的大小。下面将展示各模型的训练测试效果,有小模型到较大的模型依次展示。

1.efficentnet_b0

2.efficientnet_b1

3.efficientnet_b2

4.vit_tiny_r_s16_p8_224

5.volo_d1_224

6.vit_base_patch16_224

7.vit_base_patch16_clip_224

8.deit_base_patch16_224

9.swin_base_patch4_window7_224

10.swin_large_patch4_window7_224

11.swinv2_cr_large_224

三、结果汇总

四、总结

模型分析:

在轻量模型中,EfficientNet_B2 表现最佳,具有最高的准确率。

在中量模型中,ViT_Base_Patch16_Clip_224 F1 分数和召回率上表现最好。

在重量模型中,Swin_Large_Patch4_Window7_224 表现最佳,具有最高的准确率和 F1 分数。

综合评估:

所有模型中,ViT_Base_Patch16_Clip_224 在中量模型类别中表现最为优秀,具有最高的 F1 分数和召回率,准确率也非常高,是综合表现最好的模型。

Swin_Large_Patch4_Window7_224 重量模型虽然在准确率和 F1 分数上表现良好,但文件大小较大,可能不适合对存储空间有限制的应用场景。

轻量模型中,EfficientNet_B2 准确率最高,适合对计算资源有限制的环境。

建议:

如果对模型大小有严格要求,建议选择 EfficientNet_B2

如果对模型性能有较高要求,且计算资源充足,建议选择 ViT_Base_Patch16_Clip_224

对于需要在模型性能和大小之间取得平衡的情况,可以考虑 Volo_v1_224 或 DeiT_Base_Patch16_224

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐