记录下训练碰到的问题

自己合成的数据在MLT验证精度非常低

原因:合成数据与真实数据差别较大,表现结果是在合成数据上拟合结果非常好,在真实数据上效果差,存在向合成数据过拟合的问题,解决办法增加真实数据(但这个不好找)、对真实数据进行数据增广(应该可以吧)、拿合成数据训练的best模型在真实数据上finetune(在测试)。

合成数据的best模型作为预训练模型在真是数据上finetune时最开始acc=0.0

原因:我使用的预训练模型是在合成数据上识别日语并且验证集准确度最高有83%左右,并且用这个模型在真实数据的验证集上测试有20%左右的准确率,但是在真实数据上finetune时acc最开始是0.0,这个模型应该是已经具备一定的日语识别的能力理论上acc应该不为0.0,可能原因是,我使用的是真实数据的验证集来测试,所以最开始在真实数据的训练集上的识别可能出现全错的情况。

finetune时loss一直增大

原因:应该是学习率设的太大了,减少学习率并且加上warmup策略,还在测试

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐