用TensorFlow解决图像分类的正确姿势

瑕、疵

181人浏览 · 2026-06-09 05:25:37

瑕、疵 · 2026-06-09 05:25:37 发布

💓 博客主页：瑕疵的CSDN主页

📝 Gitee主页：瑕疵的gitee主页

⏩ 文章专栏：《热点资讯》

被TensorFlow图像分类的归一化坑了整整一周，终于摸清门道

# 错误代码：直接用原始像素值
train_images = train_images  # 没做归一化！
test_images = test_images

# 模型定义
model = tf.keras.Sequential([
    tf.keras.layers.Conv2D(32, (3,3), activation='relu', input_shape=(28,28,1)),
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dense(10, activation='softmax')
])
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])
model.fit(train_images, train_labels, epochs=5)  # 这里loss一直0.7+

正确姿势（就一行代码的事）：

# 正确代码：归一化到0-1
train_images = train_images / 255.0  # 关键！必须除以255.0
test_images = test_images / 255.0    # 测试集也得归一化

# 模型定义同上
model = tf.keras.Sequential([
    tf.keras.layers.Conv2D(32, (3,3), activation='relu', input_shape=(28,28,1)),
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dense(10, activation='softmax')
])
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])
model.fit(train_images, train_labels, epochs=5)  # 5轮后loss直接掉到0.1

错误归一化导致loss不降
()

避坑总结

图像数据必须归一化！0-255→0-1，别偷懒。
用/255.0（浮点除法），别用//255（整数除法会变0）。
训练集和测试集都要归一化，别只处理训练集。
检查数据范围：print(train_images.min(), train_images.max())，确保在0-1。

我昨天debug时，盯着loss曲线看了3小时。最后发现是这行代码漏了——归一化不是“可选”，是“必须”。TensorFlow的文档写得清清楚楚，但我自己没看。现在写技术博客，就当给自己立个flag：下次先检查数据预处理。

别被“深度学习”吓到。有时候问题就藏在最基础的步骤里。你踩过的坑，可能只是别人的一行代码。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

AI时代生存指南：收藏！小白程序员必看的大模型与经济危机预警

AtomGit开源社区

GPT-5.5 技术原理详解：多模态能力升级与开发落地实战指南

AtomGit开源社区

2026广东公考“教研力”测评：粉笔AI体系稳居榜首，传统巨头与本地机构如何突围？

但问题同样突出：由于分校众多，师资水平参差不齐，尤其在非核心城市，部分学员反馈会遇到拿着通用讲义“照本宣科”的老师，本土化深度打了折扣。但需要提醒的是，粉笔的高价线下基地班强度极大，“高三式”全封闭管理并非人人适应，部分学员反映节奏太紧容易焦虑，且部分校区位置偏远、不包住宿，需提前考察。至于上岸村、导氮教育等本地小机构，虽在某些细分领域（如申论专项）有特色，也有本地教研人员，但团队规模和真题数据积