93 lines
5.6 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

## 图像分类
> 核心概念: 迁移学习、分类模型、图像识别、可视化
### 图像分类模型怎么“看”世界的?
想象一下,你刚出生时,并不知道什么是“猫”,什么是“狗”。但随着你慢慢长大,爸爸妈妈会指着图片告诉你:“看,这是猫!喵呜~” “这是狗!汪汪!” 慢慢地,你就能区分它们了。
AI也是一样 它需要大量的图片来学习。分类模型就像一个“图像辨认大师”,它的任务就是学会区分不同类别的图片,比如猫、狗、汽车、飞机等等。
### 尝试一下!
![alt text](https://goood-space-assets.oss-cn-beijing.aliyuncs.com/public/PixPin_2025-08-22_14-40-16.png)
+ 上传你的训练图片--给AI“上课”
比如如果你想让AI区分“苹果”和“香蕉”你就需要在“苹果”这个类别下上传一些苹果的图片在“香蕉”这个类别下上传一些香蕉的图片。为每个类别上传图片即可。
同时尝试上传不同角度、不同光线、不同大小的苹果图片。确保AI能“看到”不同特征。
+ 点击“训练模型”--让AI“学习”
模型便会从你提供的不同样本中学习到特征,这个过程可能只需要几秒钟甚至更短。
+ 测试你的AI——看看它学得怎么样
现在是检验成果的时候了上传一张新的图片比如你没给AI看过的苹果或香蕉。
AI会立刻告诉你它觉得这张图片是“苹果”还是“香蕉”还会告诉你它有多大的把握比如“98%确定是苹果”)。
哇塞! 是不是超酷你的AI现在也能“看懂”图片了
<video controls src="https://goood-space-assets.oss-cn-beijing.aliyuncs.com/public/PixPin_2025-08-22_14-27-02.mp4" title="Title"></video>
玩了几轮之后,你可能会有更多的问题:
+ 如果AI判断错了怎么办
这可能意味着你需要给AI更多的图片或者图片不够清晰、不够多样。
+ 图片数量越多越好吗?
思考题: 如果我只给AI看一张图片它能学会吗
+ AI还能做些什么
展望: 你觉得街上的无人驾驶汽车是怎么“看”路况的医生是怎么通过AI分析X光片的这些都离不开图像识别技术
### 小秘密AI学习的“加速器”——迁移学习
你可能会好奇“哇让AI学这么多东西肯定要花好久好久吧
如果你让AI从零开始学习——就像你从出生开始学所有东西一样——那确实会非常非常慢需要成百上千张图片来学习每个类别并且用专业的机器训练数小时甚至数天。这是一个既耗时又昂贵的过程不是我们普通人能轻松尝试的。
在AI的世界里有一个类似的“加速器”它叫迁移学习Transfer Learning
想象一下我们已经有一个超级聪明的AI它已经“看”了几百万张图片并且学会了如何识别图像中各种基础的形状、颜色、纹理就像它已经学会了平衡能力
现在我们想让这个AI学会一个新任务比如区分“蛋糕”和“披萨”。如果让它从零开始学习会很慢。
“借用”超级大脑: 想象一下我们已经有一个超级聪明的AI“教授”它已经“看”了几百万张图片并且学会了如何识别图像中各种基础的形状、颜色、纹理、边缘特征就像它已经学会了平衡能力更像是学会了识别世间万物的“零部件”
我们的秘诀: 这个“教授”就是预训练模型,比如我们用的 MobileNet它已经学习过上千种物品的特征能准确地识别出我们日常生活中常见的各种物品。
“快速定制”新技能: 现在我们想让这个AI“教授”学会一个新任务比如区分“苹果”和“香蕉”。我们不需要让它从头开始学习那样太慢了
聪明做法: 我们直接“借用”MobileNet这个“教授”最擅长识别特征的“头部”就像它最强大、最敏锐的“眼睛”和“大脑前部”让它帮忙将你上传的“苹果”和“香蕉”图片转化为它能理解的“特征描述”比如“这是圆形、红色、有把手”、“这是长条形、黄色、弯曲的”
然后,我们只需要给这些特征描述后面再添加一个非常简单的“小助理”模型,由它来学习和记住这些特征分别代表“苹果”还是“香蕉”就行了!
-------------------
如果我们要从头开始训练一个图像分类模型,那么对于每个类我们需要成百上千张图片,并且使用专业的机器训练数小时甚至数天。这是一个耗时且昂贵的过程。
而迁移学习则可以让我们“借用”一个已经训练好的模型,只需要少量的新数据就可以训练出一个准确的模型。这大大节省了时间和金钱。
这里我们使用了mobilenet的预训练模型其学习过上千中物品的特征能够准确地识别出物品。因此我们使用这个预训练模型的头部作为特征检测器它能够识别1000种它见过的物品。现在它观察一种新的物品时就会给出1000个其见过物品的概率我们只需要在后部再添加一个简单的分类模型就可以快速实现分类了。
我们只需要训练少量的新数据,就可以训练出一个准确的模型。这就是迁移学习的魔力所在!
这样我们的AI就能
+ 只需要少量的新数据(几张图片!),
+ 在短短几秒钟内,就能训练出一个准确的图片分类模型!