当前位置：首页 > news >正文

干货满满的Python知识，学会这些你也能成为大牛

news 2026/4/24 18:00:26

1. 爬取网站数据

2. 数据清洗与处理

3. 数据可视化

4. 机器学习模型训练

5. 深度学习模型训练

6. 总结

1. 爬取网站数据

在我们的Python中呢，使用爬虫可以轻松地获取网站的数据。可以使用urllib、requests、BeautifulSoup等库进行数据爬取和处理。以下是一段爬取天气信息的示例代码，欧蕾欧蕾欧蕾蕾：

import requests
from bs4 import BeautifulSoupurl = 'https://www.weather.com/zh-CN/weather/hourbyhour/l/China+Beijing+Beijing?canonicalCityId=4a7d9ad7fc0cbd7f58d22b2f3d5c3cd9eb520a9b49f797290e3a8ae30e23f0e9'
res = requests.get(url)
soup = BeautifulSoup(res.text, 'html.parser')for hour in soup.select('.twc-hourly-forecast__table .twc-sticky-col.hourly-time > span'):print(hour.text)

这段代码通过requests库获取网站的HTML内容，然后使用BeautifulSoup库解析HTML并进行数据提取。通过CSS选择器定位到需要的信息，并进行输出滴昂。

2. 数据清洗与处理

在获取到数据后，需要去对俺们的数据进行清洗和处理。这包括数据去重、缺失值填充、数据类型转换等。以下是一段简单的数据清洗和处理示例代码：

import pandas as pd
import numpy as np# 读取CSV文件
df = pd.read_csv('data.csv')# 去除重复数据
df.drop_duplicates(inplace=True)# 填充缺失值
df.fillna(value={'age': np.mean(df['age'])})# 数据类型转换
df['age'] = df['age'].astype(int)

这段代码使用pandas库读取CSV文件，并对数据进行去重、缺失值填充、数据类型转换等操作。这些操作可以帮助我们对数据进行清洗和处理，使得数据更加滴规范化和易于分析。

3. 数据可视化

在对数据进行清洗和处理后，我们需要对数据进行可视化。可视化可以帮助我们更好滴理解数据，并发现数据中的规律。以下是一段简单的数据可视化示例代码：

import matplotlib.pyplot as plt# 读取CSV文件
df = pd.read_csv('data.csv')# 绘制散点图
plt.scatter(df['age'], df['score'])# 设置图表标题和坐标轴标签
plt.title('Age vs. Score')
plt.xlabel('Age')
plt.ylabel('Score')# 显示图表
plt.show()

这段代码使用matplotlib库绘制了一个散点图，通过设置标题、坐标轴标签等属性，使得图表更加清晰易懂。这个简单的示例可以帮助我们了解如何在Python中进行数据可视化。

4. 机器学习模型训练

在Python中，使用机器学习模型可以对数据进行预测和分类。可以使用scikit-learn等库进行机器学习模型的构建和训练。以下是一个简单的线性回归模型训练示例：

from sklearn.linear_model import LinearRegression# 读取CSV文件
df = pd.read_csv('data.csv')# 提取特征和标签
X = df[['age']]
y = df['score']# 构建线性回归模型
model = LinearRegression()# 训练模型
model.fit(X, y)# 输出模型系数和截距
print(model.coef_)
print(model.intercept_)

这段代码使用scikit-learn库构建了一个线性回归模型，使用读取CSV文件提取特征和标签。然后使用fit()方法训练模型，并输出模型系数和截距。这个简单的示例可以帮助我们了解如何在Python中进行机器学习模型的训练。

5. 深度学习模型训练

在Python中，使用深度学习模型可以对更加复杂的数据进行预测和分类。可以使用TensorFlow、Keras等库进行深度学习模型的构建和训练。以下是一个简单的MNIST手写数字识别模型训练示例：

import tensorflow as tf
from tensorflow import keras# 读取MNIST数据集
(x_train, y_train), (x_test, y_test) = keras.datasets.mnist.load_data()# 将数据集归一化
x_train = x_train / 255.0
x_test = x_test / 255.0# 构建深度学习模型
model = keras.Sequential([keras.layers.Flatten(input_shape=(28, 28)),keras.layers.Dense(128, activation='relu'),keras.layers.Dropout(0.2),keras.layers.Dense(10, activation='softmax')
])# 编译模型
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])# 训练模型
model.fit(x_train, y_train, epochs=5)# 评估模型
test_loss, test_acc = model.evaluate(x_test, y_test)
print('Test accuracy:', test_acc)

这段代码使用TensorFlow和Keras库构建了一个简单的MNIST手写数字识别模型。通过读取MNIST数据集，使用Sequential模型构建深度学习模型并编译模型。然后使用fit()方法训练模型，并使用evaluate()方法评估模型。这个示例可以帮助我们了解如何在Python中进行深度学习模型的训练。

6. 总结

我们的宝贝Python在数据处理、机器学习、深度学习等方面都有非常强大的应用。在使用Python进行编程时，我们可以使用各种各样的库来完成我们的任务。本文介绍了爬取网站数据、数据清洗与处理、数据可视化、机器学习模型训练和深度学习模型训练等几个示例。

制作不易

求三连喔

干货满满的Python知识，学会这些你也能成为大牛

1. 爬取网站数据

2. 数据清洗与处理

3. 数据可视化

4. 机器学习模型训练

5. 深度学习模型训练

6. 总结

相关文章：

干货满满的Python知识，学会这些你也能成为大牛

【Leetcode】155. 最小栈、JZ31 栈的压入、弹出序列

网络安全（黑客技术）自学笔记

iOS学习—制作全局遮罩

GRPC-连接池-GPT

YOLOv5、YOLOv8改进： GSConv+Slim Neck

重发布选路问题

LinearAlgebraMIT_9_LinearIndependence/SpanningASpace/Basis/Dimension

Redission 解锁异常：attempt to unlock lock, not locked by current thread by node id

AIGC技术揭秘：探索火热背后的原因与案例

【Linux】总结1-命令工具

Git远程仓库

Redis缓存设计

华熙生物肌活：2023年版Bio-MESO肌活油性皮肤科学护肤指南

mysql索引介绍

说一下什么是tcp的2MSL，为什么客户端在 TIME-WAIT 状态必须等待 2MSL 的时间？

更新spring boot jar包中的BOOT-INF/lib目录下的jar包

纯前端 -- html转pdf插件总结

数据结构和算法基础

JS二维数组转化为对象

告别javax.servlet：SpringBoot3项目整合knife4j 4.1.0接口文档的完整配置流程

DLSS Swapper终极指南：3步轻松升级游戏DLSS版本

从零构建Android 12：AOSP源码编译实战与避坑指南

2025年MLOps必备的10个Python库解析

如何掌握Python元编程与装饰器：从入门到精通的终极指南

告别数据缺失烦恼：手把手教你用SwatWeather为SWAT模型插补气象数据（附临洮站1970-2020年实战）

B站缓存视频终极转换指南：3分钟实现m4s到MP4的无损转换

本科论文维普AI率80%，2026年4月率零2小时解决

全球及中国定制线束市场现状调查及投资价值分析报告

Comsol介质超表面三次谐波非线性模型研究：倍频模型与转换效率计算文献赠予