当前位置：首页 > news >正文

【class9】人工智能初步（处理单张图片）

news 2026/2/11 4:14:51

Class9的任务：处理单张图像

为了更高效地学习，我们将“处理单张图像”拆分成以下几步完成：
1. 读取图像文件
2. 调用通用物体识别
3. 提取图像分类信息
4. 对应分类文件夹还未创建时，创建文件夹
5. 移动图像到对应文件夹

0.获取了图像路径

整理清楚解决问题的思路以后，我们开始获取图像路径。我们直接从铭铭的文件夹'img'中选出一张图像'cat.jpg'。它的路径可以表示为 '/Users/img/cat.jpg' 。

# TODO 将照片路径'/Users/img/cat.jpg'赋值给变量filePath

filePath= '/Users/img/cat.jpg'

1. 读取图像文件

，接下来需要读取图像内容。在读取图像内容时，需要先打开图像文件。前面我们直接用open() 函数来打开文件，但是open() 函数在读取文件时，有时候会发生异常。为了能在发生异常时，自动释放打开的文件资源，我们可以搭配使用 with...as...语句。

# 使用with...as以rb方式，打开路径为filePath的图片并赋值给f

with open(filePath, 'rb') as f:

接着读取图像。在这里，我们可以调用 read() 函数，read() 函数可以逐个字节（或者逐个字符）读取文件中的内容。由于是以二进制格式打开图像，所以读取的图像内容是二进制格式。调用 read() 函数读取变量f，并赋值给变量 image；使用 print() 输出 image。

# 使用read()读取f，赋值给变量image

image = f.read()

# 使用print()输出变量image

print(image)

2.调用通用物体识别

这样，我们就完成了读取图像的操作。接下来，我们调用接口实现对图像物体的识别。当然，在调用之前，我们首先得了解，什么是通用物体识别接口。

调用通用物体识别

代码的作用

这几行高亮的代码，利用通用物体识别接口，对一张输入图片，输出其中的多个物体及场景标签。
第9-19行，是我们在上节课中创建的图像识别客户端。
第22行，通过advancedGeneral接口识别输入的图像image，并将结果存储在ending变量中。
第24行，将结果输出查看。

Ps：待识别的图像

必选参数image，图像数据，支持jpg/png/bmp格式
要求大小不超过4M，最短边至少15px，最长边最大4096px，否则会识别失败。可

调用通用物体识别

对刚刚新建的AipImageClassify对象--client，使用advancedGeneral( )函数。
将待识别的图像必选参数image传入到该函数中即可。

赋值给ending

调用接口返回的结果赋值给ending，并输出进行查看。

Ps：使用advancedGeneral()函数调用通用物体识别接口。
将待识别的图像必选参数image传入到该函数中。
输出调用接口返回的结果ending。

O(∩_∩)O哈哈~，作者有点忘记了之前的知识，所以又回去看了看

复习：在Python编程语言中，字典（Dictionary）、列表（List）和元组（Tuple）是三种不同的内置数据结构，每种都有其独特的特点和用途：

列表（List）

有序集合：列表中的元素有固定的顺序，可以通过索引（从0开始）访问。
可变：列表中的元素可以被修改，可以增加、删除或改变元素。
支持元素的多样性：列表可以包含不同类型的元素，包括数字、字符串、其他列表等。
支持嵌套：列表可以包含其他列表（嵌套列表）。
方法多样：Python为列表提供了大量的方法，如append(), remove(), pop(), reverse()等

例子:

my_list = [1, "Hello", 3.14, [2, 4, 6]]

my_list[2] = 'pi' # 修改第三个元素

元组（Tuple）

有序集合：元组和列表类似，元素有固定的顺序，通过索引访问。
不可变：一旦创建，元组中的元素不能被修改。
支持元素的多样性：元组也可以包含不同类型的元素。
支持嵌套：元组可以包含其他元组、列表、字典等。
内存效率：相较于列表，元组占用的空间通常更小，创建速度更快。

例子：

my_tuple = (1, "Hello", 3.14, (2, 4, 6))

# my_tuple[2] = 'pi' # 这会引发TypeError，因为元组不可变

字典（Dictionary）

无序集合：字典存储键值对，但它们是无序的（在Python 3.7及以后的版本中，字典记住了插入顺序，但这是一个实现细节，不应依赖于这一点来保证跨版本的一致性）。
可变：可以添加、删除或修改键值对。
键必须是不可变的：如字符串、数字或元组，但值则可以是任何数据类型。
不支持索引：字典通过键来访问数据，不像列表和元组使用索引。
查找效率高：字典在大数据集中查找元素时非常快，因其基于哈希表实现。

例子：

my_dict = {'name': "Alice", 'age': 25, 'is_student': True}

my_dict['age'] = 26 # 修改键'age'对应的值

回到现在的class

调用通用物体识别的描述

调用通用物体识别需要传入一个必选参数

调用通用物体识别返回数据参数有很多种

AipImageClassify是图像识别的Python SDK客户端，提供了一系列的交互方法，所以在调用通用物体识别之前必须提前创建AipImageClassify。

调用通用物体识别输入一张图片可以输出图片中的多个物体及场景标签

3.提取分类结果
查看输出结果，我们从result中的参数root就能得到分类信息。调用接口返回的是一个复杂的字典结构，我们将它赋值给了变量ending。从字典ending中取出参数'result'的值可以用ending['result']。

前三步的代码：

# 1.读取图像文件

# 将照片路径'/Users/img/cat.jpg'赋值给变量filePath

filePath = '/Users/img/cat.jpg'

# 使用with...as以rb方式，打开路径为filePath的图片并赋值给f

with open(filePath, 'rb') as f:

# 使用read()读取f，赋值给变量img

image = f.read()

# 2.调用通用物体识别

# 从aip中导入AipImageClassify

from aip import AipImageClassify

# 将AppID"10252021"赋值给变量APP_ID

APP_ID = '10252021'

# 将API Key"ZHe7788sh11GEjIAdEKeY"赋值给变量API_KEY

API_KEY = 'ZHe7788sh11GEjIAdEKeY'

# 将Secret Key"JMMzHe7788BUSH1ZhEnM1YUEhh"赋值给变量SECRET_KEY

SECRET_KEY = 'JMMzHe7788BUSH1ZhEnM1YUEhh'

# 新建一个AipImageClassify，并赋值给变量client

client = AipImageClassify(APP_ID, API_KEY, SECRET_KEY)

# 调用通用物体识别接口并把结果赋值给ending

ending = client.advancedGeneral(image)

# 3.提取图像分类信息

# 从返回结果中提取出参数result的值并赋值给变量value

value = ending['result']

# 使用print()输出变量value

print(value)

得到的ending['result']是一个列表结构。
我们只取列表ending['result']中的第一个元素就是ending['result'][0]。

研究得到所需要的内容：

接下来，我们直接用识别结果组成分类文件夹路径，作为移动图像的目标地址。
用字符串拼接的方式拼接铭铭的文件夹'img' 、"/"、变量 value，将拼接后的字符串赋值给变量 targetPath。

4. 对应分类文件夹还未创建时，创建文件夹

确定了每个文件需要移动的目标地址，在移动前还需要确定目标文件夹是否存在。
如果目标文件夹已经存在，直接创建会报错，如果不存在，需要先创建。
例如：cat.jpg 要移动到'动物-猫'这个文件夹中，需要先检查 'img'文件夹中是否已经创建了名为'动物-猫'的文件夹。

判断文件(夹)是否存在

代码的作用

得到了目标文件夹的路径后，我们可以使用 os.path.exists() 函数来判断该文件夹是否已经存在。

代码：

# 将分类文件夹路径赋值给变量targetPath

targetPath = '/Users/img/动物-猫'

# 使用import导入os模块

import os

# 如果目标文件夹不存在

if not os.path.exists(targetPath):

# 使用print输出目标路径

print(targetPath)

分析代码：

os模块

在对文件进行处理之前，首先要使用import 导入 os 模块。os 模块可用于文件处理操作，os 模块是Python的内置模块，不需要安装可以直接导入。

判断文件（夹）是否存在

os.path.exists() 函数接受一个路径字符串作为参数，判断返回的结果是布尔数。
当该路径的文件夹存在时，返回True，不存在时，则返回False。

Ps：os.path.exists(targetPath) 是Python中的一个函数调用，该函数用于检查给定的路径 targetPath 是否存在。如果路径存在，无论是文件还是目录，它都会返回 True；如果路径不存在，它则返回 False。

if not

if 语句用于判断当前条件的真假，只有满足条件时才会执行if语句中的内容。
我们要输出结果为 False 的文件名，这里就需要使用关键字 not 运算符搭配 os.path.exists() 函数，再使用 if语句来判断结果并输出。

因此，我们在得到了目标文件夹的路径后，就可以使用 os.path.exists() 函数来判断目标文件夹是否已经存在。
通过 if 判断语句+ not 运算符来判断目标文件夹不存在的情况。

简单介绍一下os模块

在Python中，os模块提供了丰富的方法用以与操作系统交互。通过使用os模块，你可以执行文件系统操作，如文件的创建、删除、移动、更改名称，以及获取文件属性等。此外，os模块还允许你与操作系统进行交互，如获取和设置环境变量，处理进程参数，以及使用与平台无关的路径操作等。

以下是一些os模块的常用功能：

文件系统操作

os.listdir(path): 列出指定路径下的文件和目录名。
os.mkdir(path): 创建新目录。
os.makedirs(path): 递归创建多层目录。
os.remove(path): 删除一个文件。
os.rmdir(path): 删除一个空目录。
os.removedirs(path): 递归删除目录，从子目录到父目录依次删除。
os.rename(src, dst): 重命名文件或目录。
os.stat(path): 获取文件或目录的状态信息。

路径操作

os.path.join(path1[, path2[, ...]]): 拼接一个或多个路径组件。
os.path.split(path): 将路径分割成目录和文件名二元组返回。
os.path.exists(path): 检查路径是否存在。
os.path.isfile(path): 检查路径是否为文件。
os.path.isdir(path): 检查路径是否为目录。
os.path.abspath(path): 获取绝对路径。
os.path.basename(path): 获取路径的基本名称。
os.path.dirname(path): 获取路径的目录名称。
os.path.getsize(path): 获取路径的文件大小。

环境操作

os.environ: 一个表示环境变量的字典。
os.getenv(key, default=None): 获取一个环境变量，如果不存在则返回默认值。
os.putenv(key, value): 设置一个环境变量值。

其他

os.system(command): 运行系统命令。
os.name: 字符串，指示你正在使用的平台。比如对于Windows，它是'nt'，而对于Linux/Unix用户，它是'posix'。
os.getpid(): 获取当前进程ID。
os.getuid(): 获取当前用户的ID（仅在Unix下有效）。
os.getlogin(): 返回当前登录系统的用户名。

下一步：

创建文件夹

代码的作用

找到未创建的文件夹以后，我们就可以使用 os.mkdir() 函数来创建文件夹。

创建文件（夹）

创建文件夹可以使用 os.mkdir() 函数：将要创建的文件夹路径作为参数传入函数中即可。

5. 移动图像到对应文件夹

创建完文件夹，我们打开'img'文件夹就可以看到刚刚创建的'动物-猫'这个文件夹。一切准备就绪，接下来完成最后一步：
将'cat.jpg'移动图像到对应的文件夹'动物-猫'中。

移动文件夹

代码的作用

这里，可以使用shutil.move()函数移动文件，将图像移动到目标文件夹中。

# 导入shutil模块

import shutil

# 使用shutil.move()函数移动文件，将图像移动到目标文件夹中

# 将结果赋值给变量newPath

newPath = shutil.move(filePath, targetPath)

# 使用格式化输出"已经移动到：{newPath}"

print(f"已经移动到：{newPath}")

分析代码：

导入shutil模块

要想移动文件，我们需要导入Python中另一个内置的模块 shutil 。
使用import 导入 shutil 模块。

移动文件

shutil.move() 函数可以用来移动文件或文件夹。
它接收两个参数，第一个参数是要移动的文件（夹）路径，第二个参数是目标文件（夹）的路径。

next class，处理多张图片

【class9】人工智能初步（处理单张图片）

相关文章：

【class9】人工智能初步（处理单张图片）

cgicc开发 (结合jsoncpp)

HTML常用标签及属性

【PB案例学习笔记】-03用户名密码校验

设计模式六大原则之接口分离原则

嵌入式学习——Shell（）——day21

STM32学习计划

小米15曝光？可能会要稍微涨价

深度优先搜索汇总

【虚拟仿真】Unity3D中实现对大疆无人机遥控器手柄按键响应

Python学习之路 | Python基础语法（一）

【已解决】AttributeError: module ‘clip‘ has no attribute ‘load‘

安卓实现连接wesokcet

Xinstall助力App下载量精准统计，洞悉推广效果

CSS字体修饰

高并发缓存服务的构建要点与陷阱

Electron学习笔记（五）

【jest 调试 - vscode debug】

华为OD机试【分奖金】(java)(100分)

27- ESP32-S3 USB虚拟串口（USB-OTG 外设介绍）

K8S认证|CKS题库+答案| 11. AppArmor

系统设计 --- MongoDB亿级数据查询优化策略

深入理解JavaScript设计模式之单例模式

《基于Apache Flink的流处理》笔记

MySQL用户和授权

Android 之 kotlin 语言学习笔记三（Kotlin-Java 互操作）

有限自动机到正规文法转换器v1.0

初学 pytest 记录

JVM虚拟机：内存结构、垃圾回收、性能优化

人工智能（大型语言模型 LLMs）对不同学科的影响以及由此产生的新学习方式