当前位置：首页 > news >正文

Python机器学习：自然语言处理、计算机视觉与强化学习

news 2026/5/19 21:33:24

📘 Python机器学习：自然语言处理、计算机视觉与强化学习

✨ 1. 自然语言处理（NLP）

📄 1.1 文本预处理：分词、去停用词

文本预处理是自然语言处理的基础步骤。原始文本通常包含很多噪音，如标点符号、特殊字符、停用词等。为了让模型更好地理解和处理文本，需要对其进行规范化处理。

**分词（Tokenization）**是文本预处理的第一步，分词的目的是将连续的字符串切分成单词或短语。中文的分词比较复杂，因为中文句子没有明显的分隔符。而英文分词则相对简单，通过空格分隔即可。

import jieba  # 导入中文分词工具
text = "机器学习是人工智能的一个分支。"
tokens = jieba.lcut(text)  # 使用精确模式分词
print("分词结果：", tokens)

**去停用词（Stopword Removal）**是在分词的基础上，移除那些对语义影响不大的词汇，如“的”、“是”等。这些词在模型中通常不会提供有用的信息。

# 定义中文停用词列表
stopwords = ['的', '是', '在', '和']
filtered_tokens = [word for word in tokens if word not in stopwords]
print("去停用词后的结果：", filtered_tokens)

文本预处理可以显著减少模型训练的复杂度，并提高模型的准确性。合理的预处理能够提升模型的效率和表现。

📊 1.2 词向量与文本分类：使用Word2Vec与BERT

词向量将文本中的词语转化为向量，进而可以在数学空间中计算词语之间的相似度和语义关联。常见的词向量方法有Word2Vec和BERT。

Word2Vec模型通过预测上下文词语（Skip-gram）或根据上下文预测中心词（CBOW），将词转化为固定长度的向量。

from gensim.models import Word2Vecsentences = [['我', '喜欢', '机器学习'], ['人工智能', '正在', '改变', '世界']]
model = Word2Vec(sentences, vector_size=100, window=5, min_count=1, sg=0)  # 训练Word2Vec模型
vector = model.wv['机器学习']  # 获取词向量
print("词向量：", vector)

BERT（Bidirectional Encoder Representations from Transformers）是一种基于Transformer的预训练模型，通过上下文的双向信息获取词的深层语义。

from transformers import BertTokenizer, BertModel
import torchtokenizer = BertTokenizer.from_pretrained('bert-base-uncased')
model = BertModel.from_pretrained('bert-base-uncased')input_text = "Machine learning is a branch of AI."
inputs = tokenizer(input_text, return_tensors="pt")
outputs = model(**inputs)
print("BERT输出：", outputs.last_hidden_state)

词向量能在文本分类、情感分析等任务中大幅提升模型的表现。通过使用BERT等高级模型，可以更好地捕捉文本中的复杂语义关系，从而提升模型的理解能力。

🌆 2. 计算机视觉基础

🖼 2.1 图像预处理与增强

在计算机视觉任务中，图像预处理和增强是至关重要的步骤。图像预处理可以减少噪声，提高图像质量，而图像增强则可以丰富数据样本，提高模型的泛化能力。

图像预处理包括灰度化、归一化、去噪等操作。例如，图像灰度化可以将彩色图像转化为单通道的灰度图，减少计算量。

import cv2
import numpy as npimage = cv2.imread('image.jpg')  # 读取图像
gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)  # 将彩色图像转为灰度图
cv2.imshow('Gray Image', gray_image)
cv2.waitKey(0)

图像增强则可以通过旋转、缩放、翻转等方式生成更多的样本，特别是在数据不足的情况下，图像增强是一种有效的提升模型泛化能力的方法。

from tensorflow.keras.preprocessing.image import ImageDataGeneratordatagen = ImageDataGenerator(rotation_range=40,  # 随机旋转width_shift_range=0.2,  # 随机水平位移height_shift_range=0.2,  # 随机垂直位移shear_range=0.2,  # 随机错切变换zoom_range=0.2,  # 随机缩放horizontal_flip=True,  # 水平翻转fill_mode='nearest'  # 填充方式
)image = np.expand_dims(image, 0)  # 扩展图像维度以适应批量生成器
datagen.fit(image)# 生成增强后的图像
for batch in datagen.flow(image, batch_size=1):plt.imshow(batch[0].astype('uint8'))plt.show()break  # 仅显示一张增强后的图像

图像预处理和增强不仅能改善图像质量，还能增加训练数据的多样性，从而提升模型的鲁棒性和表现。

🎯 2.2 目标检测与分割

目标检测与分割是计算机视觉中的两个核心任务。目标检测是识别图像中目标物体的位置和类别，而分割是将图像中的目标从背景中分离出来。

目标检测使用边界框（Bounding Box）来标注物体的位置，常见的检测算法有YOLO、SSD等。以下是基于YOLOv3的目标检测代码示例。

import cv2
import numpy as np# 加载YOLO模型和权重
net = cv2.dnn.readNet('yolov3.weights', 'yolov3.cfg')
layer_names = net.getLayerNames()
output_layers = [layer_names[i[0] - 1] for i in net.getUnconnectedOutLayers()]image = cv2.imread('image.jpg')  # 加载图像
height, width = image.shape[:2]# 预处理图像
blob = cv2.dnn.blobFromImage(image, 0.00392, (416, 416), (0, 0, 0), True, crop=False)
net.setInput(blob)
outs = net.forward(output_layers)# 处理输出结果
for out in outs:for detection in out:scores = detection[5:]class_id = np.argmax(scores)confidence = scores[class_id]if confidence > 0.5:center_x = int(detection[0] * width)center_y = int(detection[1] * height)w = int(detection[2] * width)h = int(detection[3] * height)# 绘制边界框cv2.rectangle(image, (center_x - w // 2, center_y - h // 2), (center_x + w // 2, center_y + h // 2), (0, 255, 0), 2)cv2.imshow('Object Detection', image)
cv2.waitKey(0)

图像分割则通过像素级别的分类来分离物体，常见的分割算法有U-Net、Mask R-CNN等。以下是基于U-Net模型的简要代码示例。

from tensorflow.keras.models import Model
from tensorflow.keras.layers import Input, Conv2D, MaxPooling2D, UpSampling2D, concatenatedef unet_model(input_size=(256, 256, 1)):inputs = Input(input_size)conv1 = Conv2D(64, 3, activation='relu', padding='same')(inputs)pool1 = MaxPooling2D(pool_size=(2, 2))(conv1)conv2 = Conv2D(128, 3, activation='relu', padding='same')(pool1)pool2 = MaxPooling2D(pool_size=(2, 2))(conv2)up1 = UpSampling2D(size=(2, 2))(pool2)merge1 = concatenate([conv1, up1], axis=3)conv3 = Conv2D(64, 3, activation='relu', padding='same')(merge1)model = Model(inputs, conv3)return modelmodel = unet_model()
model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])

目标检测与分割是计算机视觉中的核心任务，广泛应用于自动驾驶、医疗影像等领域。

🧠 3. 强化学习入门

🤖 3.1 主要概念与算法：Q-learning、Deep Q-Networks

强化学习（Reinforcement Learning, RL）是一种通过试错来学习最优策略的机器学习方法。与监督学习和无监督学习不同，强化学习的目标是通过与环境的交互来最大化累积奖励。

Q-learning是一种经典的强化学习算法，旨在通过更新Q值函数来找到最佳策略。Q值函数表示在某一状态下采取某一动作的预期累积奖励。

import numpy as np# 定义Q表
Q = np.zeros((5, 2))  # 假设有5个状态和2个动作# 参数设置
alpha = 0.1  # 学习率
gamma = 0.9  # 折扣因子
epsilon = 0.1  # 探索率# 模拟环境反馈
def get_reward(state, action):if state == 4 and action == 1:return 1  # 终止状态return 0# Q-learning算法
def q_learning():for episode in range(100):  # 迭代100次state = np.random.randint(0, 5)  # 随机初始化状态while state != 4:  # 直到达到终止状态if np.random.rand() < epsilon:  # 探索action = np.random.randint(0, 2)else:  # 利用action = np.argmax(Q[state])next_state = state + 1  # 假设每次状态递增reward = get_reward(state, action)# Q值更新Q[state, action] = Q[state, action] + alpha * (reward + gamma * np.max(Q[next_state]) - Q[state, action])state = next_stateq_learning()
print("更新后的Q表：", Q)

Deep Q-Networks (DQN)**是一种结合了深度学习的强化学习算法。通过神经网络近似Q值函数，DQN在复杂环境中具有更强的表达能力。

import torch
import torch.nn as nn
import torch.optim as optim
import randomclass DQN(nn.Module):def __init__(self):super(DQN, self).__init__()self.fc1 = nn.Linear(4, 24)self.fc2 = nn.Linear(24, 24)self.fc3 = nn.Linear(24, 2)def forward(self, x):x = torch.relu(self.fc1(x))x = torch.relu(self.fc2(x))return self.fc3(x)model = DQN()
optimizer = optim.Adam(model.parameters(), lr=0.001)
criterion = nn.MSELoss()# 模拟训练过程
state = torch.FloatTensor([1, 0, 0, 0])
target = torch.FloatTensor([0, 1])
output = model(state)
loss = criterion(output, target)
optimizer.zero_grad()
loss.backward()
optimizer.step()

强化学习中的Q-learning和DQN是两个关键算法，前者用于简单离散环境，后者则在复杂的连续环境中表现优异。通过学习最优策略，强化学习能够解决动态环境中的决策问题。

Python机器学习：自然语言处理、计算机视觉与强化学习

📘 Python机器学习：自然语言处理、计算机视觉与强化学习目录 ✨ 自然语言处理（NLP） 文本预处理：分词、去停用词词向量与文本分类：使用Word2Vec与BERT 🌆 计算机视觉基础图像预处理与增强目标…...

编程日记 2024/10/6 7:42:10

Vue2 + ElementUI + axios + VueRouter入门

之前没有pc端开发基础，工作需要使用若依框架进行了一年的前端开发.最近看到一个视频框架一步步集成，感觉颇受启发，在此记录一下学习心得。视频链接:vue2element ui 快速入门环境搭建和依赖安装安装nodejs安装Vue Cli使用vue create proje…...

编程日记 2024/10/6 7:40:08

GO网络编程（四）：海量用户通信系统2：登录功能核心【重难点】

目录一、C/S详细通信流程图二、消息类型定义与json标签1. 消息类型定义2. JSON标签3.结构体示例及其 JSON 表示：4.完整代码与使用说明三、客户端发送消息1. 连接到服务器2. 准备发送消息3. 创建 LoginMes 并序列化4. 将序列化后的数据嵌入消息结构5. 序列化整个 M…...

编程日记 2024/10/6 7:38:07

某项目实战分析代码二

某项目实战分析代码二此次分析的是protobuf的使用操作流程具体实现 3. 业务数据分析3.1 客户端3.2 服务器端简单案例此次分析的是protobuf的使用 Protocol Buffer( 简称 Protobuf) 是Google公司内部的混合语言数据标准，它是一种轻便高效的结构化数据存储格式&…...

编程日记 2024/10/6 7:37:06

全面指南：探索并实施解决Windows系统中“mfc140u.dll丢失”的解决方法

当你的电脑出现mfc140u.dll丢失的问题是什么情况呢？mfc140u.dll文件依赖了什么？mfc140u.dll丢失会导致电脑出现什么情况？今天这篇文章就和大家聊聊mfc140u.dll丢失的解决办法。希望能够有效的帮助你解决这问题。哪些程序依赖mfc140u.dll文件…...

编程日记 2024/10/6 7:33:03

QT学习笔记1（QT和QT creator介绍）

QT学习笔记1（QT和QT creator介绍） Qt 是一个跨平台的应用开发框架，主要用于图形用户界面（GUI）应用的开发，但也支持非GUI程序的开发。Qt 支持多种平台，如Windows、macOS、Linux、iOS和Android&a…...

编程日记 2024/10/6 7:32:01

存储电话号码的数据类型，用 int 还是用 string？

在 Java 编程中，存储电话号码的选择可以通过两种常见方式进行：使用 int 类型或 String 类型。这种选择看似简单，但实际上涉及到 JVM 内部的字节码实现、内存优化、数据表示、以及潜在的可扩展性问题。 Java 基本数据类型与引用数据类型的差异…...

编程日记 2024/10/6 7:31:00

【目标检测】工程机械车辆数据集2690张4类VOC+YOLO格式

数据集格式：Pascal VOC格式YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数)：2694 标注数量(xml文件个数)：2694 标注数量(txt文件个数)：2694 标注…...

编程日记 2024/10/6 7:29:59

target_link_libraries()

target_link_libraries() 是 CMake 中的一个命令，用于指定目标（如可执行文件或库）所依赖的其他库。其主要作用包括： 链接库：将指定的库链接到目标上，使目标能够调用这些库中的函数和使用其功能。管理依赖…...

编程日记 2024/10/6 7:28:58

Javascript数组研究09_Array.prototype[Symbol.unscopables]

Symbol.unscopables 是 JavaScript 中一个相对较新的符号（Symbol），用于控制对象属性在 with 语句中的可见性。它主要用于内置对象，如 Array.prototype，以防止某些方法被引入到 with 语句的作用域中，避免潜在…...

编程日记 2024/10/6 7:26:56

SkyWalking 自定义链路追踪

对项目中的业务方法，实现链路追踪，方便我们排查问题引入依赖 <!‐‐ SkyWalking 工具类 ‐‐> <dependency> <groupId>org.apache.skywalking</groupId> <artifactId>apm‐toolkit‐trace</artifactId> <vers…...

编程日记 2024/10/6 7:21:51

Linux驱动开发(速记版)--设备模型

第八十章设备模型基本框架-kobject 和 kset 80.1 什么是设备模型设备模型使Linux内核处理复杂设备更高效。字符设备驱动适用于简单设备，但对于电源管理和热插拔，不够灵活。设备模型允许开发人员以高级方式描述硬件及关系，提供API处理设备…...

编程日记 2024/10/6 7:20:50

动手学深度学习（李沐）PyTorch 第 6 章卷积神经网络

李宏毅-卷积神经网络CNN 如果使用全连接层：第一层的weight就有3*10^7个观察 1：检测模式不需要整张图像很多重要的pattern只要看小范围即可简化1：感受野根据观察1 可以做第1个简化，卷积神经网络会设定一个区域&#xff0c…...

编程日记 2024/10/6 7:19:49

新编英语语法教程

新编英语语法教程 1. 新编英语语法教程 (第 6 版) 学生用书1.1. 目录1.2. 电子课件 References A New English Grammar Coursebook 新编英语语法教程 (第 6 版) 学生用书新编英语语法教程 (第 6 版) 教师用书 1. 新编英语语法教程 (第 6 版) 学生用书 https://erp.sflep.cn/…...

编程日记 2024/10/6 7:18:48

Golang 服务器虚拟化应用案例

推荐学习文档 golang应用级os框架，欢迎stargolang应用级os框架使用案例，欢迎star案例：基于golang开发的一款超有个性的旅游计划app经历golang实战大纲golang优秀开发常用开源库汇总想学习更多golang知识，这里有免费的golang学习笔…...

编程日记 2024/10/6 7:16:45

Elasticsearch基础_4.ES搜索功能

文章目录一、搜索辅助功能1.1、指定返回的字段1.2、结果计数1.3、结果分页二、搜索匹配功能2.1、查询所有文档2.2、term级别查询2.2.1、term查询2.2.2、terms查询2.2.3、range查询2.2.4、exists查询 2.3、布尔查询2.3.1、must，should，must_not2.3.2、f…...

编程日记 2024/10/6 7:13:42

Elasticsearch要点简记

Elasticsearch要点简记 1、ES概述2、基础概念（1）索引、文档、字段（2）映射（3）DSL 3、架构原理4、索引字段的数据类型5、ES的三种分页方式（1）深度分页（fromsize&#xff09…...

编程日记 2024/10/6 7:09:38

【通信协议】IIC通信协议详解

IIC（Inter-Integrated Circuit）通信协议，又称为I2C（Inter-Integrated Circuit 2）协议，是一种广泛使用的串行通信协议。它由Philips Semiconductor（现NXP Semiconductors）开发&#x…...

编程日记 2024/10/6 7:08:37

2024年中国科技核心期刊目录（社会科学卷）

2024年中国科技核心期刊目录 （社会科学卷） 序号期刊代码期刊名称 1 SC02 JOURNAL OF S…...

编程日记 2024/10/6 7:03:32

用Python集成免费IP归属地查询API

IP查询的优势是什么？ IP查询是一种强大的工具，能够快速提供关于IP地址的信息，如地理位置、互联网服务提供商（ISP）、连接类型等。这些数据在多种场景下都非常有用，帮助用户理解网络环境和用户行为。首先&…...

编程日记 2024/10/6 7:00:29

别再只会用HAL库了！手把手教你用寄存器操作STM32的SysTick定时器（附精准延时函数）

深入STM32 SysTick定时器：寄存器级精准延时实战指南从库函数到寄存器：为什么需要更底层的控制？ 在嵌入式开发领域，时间控制精度往往决定着系统性能的上限。许多开发者习惯使用HAL库或标准库提供的延时函数，却很少思考…...

编程新知 2026/5/19 19:43:58

KMS_VL_ALL_AIO：一站式智能激活工具，彻底解决Windows与Office激活难题

KMS_VL_ALL_AIO：一站式智能激活工具，彻底解决Windows与Office激活难题【免费下载链接】KMS_VL_ALL_AIO Smart Activation Script 项目地址: https://gitcode.com/gh_mirrors/km/KMS_VL_ALL_AIO KMS_VL_ALL_AIO是一款开源的智能激活脚本&#xff…...

编程新知 2026/5/19 19:23:23

iOS设备激活锁绕过终极指南：使用Applera1n免费解锁iPhone/iPad

iOS设备激活锁绕过终极指南：使用Applera1n免费解锁iPhone/iPad 【免费下载链接】applera1n icloud bypass for ios 15-16 项目地址: https://gitcode.com/gh_mirrors/ap/applera1n iOS激活锁是苹果设备的重要安全功能，但当你忘记Apple ID密码或购…...

编程新知 2026/5/19 19:16:37

别再手动搬虚拟机了！手把手教你配置vSphere DRS集群，实现ESXi主机负载自动均衡

企业级虚拟化资源调度实战：vSphere DRS集群的智能配置与优化策略虚拟化技术已成为现代企业IT基础设施的核心支柱，而资源的高效调度则是保障业务连续性和性能的关键。在传统虚拟化环境中，管理员往往需要手动监控主机负载并迁移虚拟机&#xf…...

编程新知 2026/5/19 18:45:17

Cadence Virtuoso新手避坑指南：手把手教你画反相器原理图（附3.3V工艺库设置）

Cadence Virtuoso新手避坑指南：3.3V工艺库反相器设计全流程解析第一次打开Cadence Virtuoso时，那个充满专业术语的界面就像面对一架航天飞机的控制台——每个按钮都暗藏玄机，每次点击都可能引发未知错误。作为模拟IC设计的行业标准工具&…...

编程新知 2026/5/19 18:19:36

2026年光电传感器在不同检测距离中的选型方法与检测距离参数

在自动化产线、物流分拣、包装机械、电子制造等领域，光电传感器的检测距离是选型时最先映入眼帘的参数。然而，很多工程师在实际应用中会发现：标称检测距离为10米的传感器，装上后检测5米的黑色物体就不稳定了；标称0.5米…...

编程新知 2026/5/19 15:16:03

ASML财报解读：高毛利与利润倍增背后的光刻机技术垄断与市场逻辑

1. 财报核心数据深度解读：高毛利与利润倍增的背后看到ASML最新发布的Q2财报，最抓人眼球的两个数字无疑是“毛利率超50%”和“每股净利润增长近一倍”。这不仅仅是两个亮眼的财务指标，更是理解这家全球光刻机巨头当前市场地位、技术壁垒和未来…...

编程新知 2026/5/19 14:46:34

性能优化必看：你的Unity粒子特效为什么这么卡？从ParticleSystem参数入手排查

Unity粒子特效性能优化实战指南：从参数调优到帧率提升 1. 粒子特效性能问题的根源剖析在移动端和VR项目中，粒子特效往往是性能瓶颈的重灾区。一次性能审计中，某款手游的瀑布场景因未限制粒子最大数量，导致中端机型帧率骤降至18fp…...

编程新知 2026/5/19 14:18:47

DDrawCompat开源项目：让Windows经典游戏在现代系统重生

DDrawCompat开源项目：让Windows经典游戏在现代系统重生【免费下载链接】DDrawCompat DirectDraw and Direct3D 1-7 compatibility, performance and visual enhancements for Windows Vista, 7, 8, 10 and 11 项目地址: https://gitcode.com/gh_mirrors/dd/DDraw…...

编程新知 2026/5/19 14:14:11

并发编程小记1

什么时候用单线程，什么时候用多线程？图里展示了一个典型的网络请求场景：左侧处理耗时：1ms网络请求往返耗时：25ms 25ms 50ms右侧处理耗时：2ms整个流程总耗时：1ms 25ms 2ms 25ms 53ms这里的…...

编程新知 2026/5/19 13:57:22