5.6 KiB
图像分类
核心概念: 迁移学习、分类模型、图像识别、可视化
图像分类模型怎么“看”世界的?
想象一下,你刚出生时,并不知道什么是“猫”,什么是“狗”。但随着你慢慢长大,爸爸妈妈会指着图片告诉你:“看,这是猫!喵呜~” “这是狗!汪汪!” 慢慢地,你就能区分它们了。
AI也是一样! 它需要大量的图片来学习。分类模型就像一个“图像辨认大师”,它的任务就是学会区分不同类别的图片,比如猫、狗、汽车、飞机等等。
尝试一下!
- 上传你的训练图片--给AI“上课”!
比如,如果你想让AI区分“苹果”和“香蕉”,你就需要在“苹果”这个类别下上传一些苹果的图片,在“香蕉”这个类别下上传一些香蕉的图片。为每个类别上传图片即可。
同时,尝试上传不同角度、不同光线、不同大小的苹果图片。确保AI能“看到”不同特征。
- 点击“训练模型”--让AI“学习”!
模型便会从你提供的不同样本中学习到特征,这个过程可能只需要几秒钟甚至更短。
- 测试你的AI——看看它学得怎么样!
现在是检验成果的时候了!上传一张新的图片,比如你没给AI看过的苹果或香蕉。
AI会立刻告诉你,它觉得这张图片是“苹果”还是“香蕉”,还会告诉你它有多大的把握(比如“98%确定是苹果”)。
哇塞! 是不是超酷?你的AI现在也能“看懂”图片了!
玩了几轮之后,你可能会有更多的问题:
- 如果AI判断错了怎么办?
这可能意味着你需要给AI更多的图片,或者图片不够清晰、不够多样。
- 图片数量越多越好吗?
思考题: 如果我只给AI看一张图片,它能学会吗?
- AI还能做些什么?
展望: 你觉得街上的无人驾驶汽车是怎么“看”路况的?医生是怎么通过AI分析X光片的?这些都离不开图像识别技术!
小秘密:AI学习的“加速器”——迁移学习!
你可能会好奇:“哇,让AI学这么多东西,肯定要花好久好久吧?”
如果你让AI从零开始学习——就像你从出生开始学所有东西一样——那确实会非常非常慢,需要成百上千张图片来学习每个类别,并且用专业的机器训练数小时甚至数天。这是一个既耗时又昂贵的过程,不是我们普通人能轻松尝试的。
在AI的世界里,有一个类似的“加速器”,它叫迁移学习(Transfer Learning)。
想象一下,我们已经有一个超级聪明的AI,它已经“看”了几百万张图片,并且学会了如何识别图像中各种基础的形状、颜色、纹理(就像它已经学会了平衡能力)。
现在,我们想让这个AI学会一个新任务,比如区分“蛋糕”和“披萨”。如果让它从零开始学习,会很慢。
“借用”超级大脑: 想象一下,我们已经有一个超级聪明的AI“教授”,它已经“看”了几百万张图片,并且学会了如何识别图像中各种基础的形状、颜色、纹理、边缘特征(就像它已经学会了平衡能力,更像是学会了识别世间万物的“零部件”)。
我们的秘诀: 这个“教授”就是预训练模型,比如我们用的 MobileNet!它已经学习过上千种物品的特征,能准确地识别出我们日常生活中常见的各种物品。
“快速定制”新技能: 现在,我们想让这个AI“教授”学会一个新任务,比如区分“苹果”和“香蕉”。我们不需要让它从头开始学习,那样太慢了!
聪明做法: 我们直接“借用”MobileNet这个“教授”最擅长识别特征的“头部”(就像它最强大、最敏锐的“眼睛”和“大脑前部”),让它帮忙将你上传的“苹果”和“香蕉”图片,转化为它能理解的“特征描述”(比如“这是圆形、红色、有把手”、“这是长条形、黄色、弯曲的”)。
然后,我们只需要给这些特征描述后面再添加一个非常简单的“小助理”模型,由它来学习和记住这些特征分别代表“苹果”还是“香蕉”就行了!
如果我们要从头开始训练一个图像分类模型,那么对于每个类我们需要成百上千张图片,并且使用专业的机器训练数小时甚至数天。这是一个耗时且昂贵的过程。
而迁移学习则可以让我们“借用”一个已经训练好的模型,只需要少量的新数据就可以训练出一个准确的模型。这大大节省了时间和金钱。
这里我们使用了mobilenet的预训练模型,其学习过上千中物品的特征,能够准确地识别出物品。因此我们使用这个预训练模型的头部作为特征检测器,它能够识别1000种它见过的物品。现在它观察一种新的物品时,就会给出1000个其见过物品的概率,我们只需要在后部再添加一个简单的分类模型,就可以快速实现分类了。
我们只需要训练少量的新数据,就可以训练出一个准确的模型。这就是迁移学习的魔力所在!
这样,我们的AI就能:
- 只需要少量的新数据(几张图片!),
- 在短短几秒钟内,就能训练出一个准确的图片分类模型!