当前位置：首页 > news >正文

Keras使用sklearn中的交叉验证和网格搜索

news 2026/5/16 1:55:14

Keras是Python在深度学习领域非常受欢迎的第三方库，但Keras的侧重点是深度学习，而不是所以的机器学习。事实上，Keras力求极简主义，只专注于快速、简单地定义和构建深度学习模型所需要的内容。Python中的scikit-learn是非常受欢迎的机器学习库，它基于Scipy，用于高效的数值计算。scikit-learn是一个功能齐全的通用机器学习库，并提供了许多在开发深度学习过程中非常有帮助的方法。例如scikit-learn提供了很多用于选择模型和对模型调参的方法，这些方法同样适用于深度学习。

Keras提供了一个Wrapper，将Keras的深度学习模型包装成scikit-learn中的分类模型或回归模型，以便于使用scikit-learn中的方法和函数。对于深度学习模型的包装是通过KerasClassifier(分类模型)和KerasRegressor(回归模型)来实现的。KerasClassifier和KerasRegressor类使用参数build_fn，指定用来创建模型的函数的名称。

Keras的一般构建流程：

model = Sequential() # 定义模型
model.add(Dense(units=64, activation='relu', input_dim=100)) # 定义网络结构
#第一层网络:输出尺寸64，输入尺寸100，activation激活函数relu
model.add(Dense(units=10, activation='softmax')) # 定义网络结构
#第二层网络：输出尺寸10，输入是上一层的输出尺寸64，activation激活函数softmax
model.compile(loss='categorical_crossentropy', # 定义loss函数、优化方法、评估标准optimizer='sgd',metrics=['accuracy'])
#输入训练样本和标签，迭代5次，每次迭代32个数据
model.fit(x_train, y_train, epochs=5, batch_size=32) # 训练模型
loss_and_metrics = model.evaluate(x_test, y_test, batch_size=128) # 评估模型
classes = model.predict(x_test, batch_size=128) # 使用训练好的数据进行预测

参数意义：

keras.layers.Dense(units, activation=None, use_bias=True, kernel_initializer='glorot_uniform', bias_initializer='zeros', kernel_regularizer=None, bias_regularizer=None, activity_regularizer=None, kernel_constraint=None, bias_constraint=None)

units: 正整数，输出空间维度。
activation: 激活函数。若不指定，则不使用激活函数 (即，「线性」激活: a(x) = x)。
use_bias: 布尔值，该层是否使用偏置向量。
kernel_initializer: kernel 权值矩阵的初始化器。
bias_initializer: 偏置向量的初始化器。
kernel_regularizer: 运用到 kernel 权值矩阵的正则化函数。
bias_regularizer: 运用到偏置向的的正则化函数。
activity_regularizer: 运用到层的输出的正则化函数。
kernel_constraint: 运用到 kernel 权值矩阵的约束函数。
bias_constraint: 运用到偏置向量的约束函数。

Keras调用scikit-learn实现交叉验证：

from keras.models import Sequential
from keras.layers import Dense
import numpy as np
import pandas as pd
from sklearn.model_selection import cross_val_score, KFold
from keras.wrappers.scikit_learn import KerasClassifierdef creat_model():# 构建模型model = Sequential()model.add(Dense(units=12, input_dim=11, activation='relu'))model.add(Dense(units=8, activation='relu'))model.add(Dense(units=1, activation='sigmoid'))# 模型编译model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])return model# 导入数据
data = pd.read_csv('data.csv',encoding='gbk')# 删除id列
data.drop('客户编号',axis=1,inplace=True)X, Y = data.values[:,:-1], data.values[:,-1] # Keras调用sklearn
model = KerasClassifier(build_fn=creat_model, epochs=150, batch_size=10, verbose=0)# 10折交叉验证
kfold = KFold(n_splits=10, shuffle=True, random_state=10)
result = cross_val_score(model, X, Y, cv=kfold)

Keras调用scikit-learn实现模型调参

在构建深度学习模型时，如何配置一个最优模型一直是进行一个项目的重点。在机器学习中，可以通过算法自动调优这些配置参数，在这里将通过Keras的包装类，借助scikit-learn的网格搜索算法评估神经网络模型的不同配置，并找到最佳评估性能的参数组合。creat_model()函数被定义为具有两个默认值的参数(optimizer和init)的函数，创建模型后，定义要搜索的参数的数值数组，包括优化器(optimizer)、权重初始化方案(init)、epochs和batch_size。

在scikit-learn中的GridSearchCV需要一个字典类型的字段作为需要调整的参数，默认采用3折交叉验证来评估算法，由于4个参数需要进行调参，因此将会产生4✖️3个模型。
Keras调用scikit-learn实现GridSearchCV网格搜索：

from keras.models import Sequential
from keras.layers import Dense
import numpy as np
import pandas as pd
from sklearn.model_selection import GridSearchCV
from keras.wrappers.scikit_learn import KerasClassifierdef creat_model(optimizer='adam,init='glorot_uniform'):# 构建模型model = Sequential()model.add(Dense(units=12, input_dim=11,kernel_initializer=init, activation='relu'))model.add(Dense(units=8, kernel_initializer=init, activation='relu'))model.add(Dense(units=1, kernel_initializer=init, activation='sigmoid'))# 模型编译model.compile(loss='binary_crossentropy', optimizer=optimizer, metrics=['accuracy'])return model# 导入数据
data = pd.read_csv('data.csv',encoding='gbk')# 删除id列
data.drop('客户编号',axis=1,inplace=True)X, Y = data.values[:,:-1], data.values[:,-1] # Keras调用sklearn
model = KerasClassifier(build_fn=creat_model, verbose=0)# 构建需要调整的参数
param_gird = {}
param_grid['optimizer'] = ['rmsprop','adam']
param_grid['init'] = ['glorot_uniform', 'normal', 'uniform']
param_gird['epochs'] = [50, 100, 150, 200]
param_gird['batch_size'] = [5, 10, 20]# 调参
grid = GridSearchCV(estimator=model, param_gird=param_grid)
result = grid.fit(X, Y)# 输出结果
print('Best: %f using %s' % (result.best_score_, result.best_params_))

关于Epochs和batch_size的解释？

Epochs是神经网络训练过程中的一个重要超参数，定义为向前和向后传播中所有批次的单次训练迭代。简单说，一个Epoch是将所有的数据输入网络完成一次向前计算及反向传播。在训练过程中，数据会被“轮”多少次，即应当完整遍历数据集多少次（一次为一个Epoch）。如果Epoch数量太少，网络有可能发生欠拟合（即对于定型数据的学习不够充分）；如果Epoch数量太多，则有可能发生过拟合（即网络对定型数据中的“噪声”而非信号拟合）。所以，选择适当的Epoch数量需要在充分训练和避免过拟合之间找到平衡。

假设我们有1000个数据样本，每次我们送入10个数据进行训练（也就是batch_size为10）。那么完成一个Epoch，我们需要进行100次迭代（也就是100次前向传播和100次反向传播）。具体来说，我们需要将所有的数据都送入神经网络进行一次前向传播和反向传播，所以一次Epoch相当于所有数据集/batch size=N次迭代。

Keras使用sklearn中的交叉验证和网格搜索

相关文章：

Keras使用sklearn中的交叉验证和网格搜索

docker--Prometheus、Grafana、node_exporter的安装配置及Springboot集成Prometheus示例

数据结构和算法笔记2：二分法

Mybatis3系列课程8-带参数查询

IDEA shorten command line介绍和JAR manifest 导致mybatis找不到接口类处理

泽攸科技SEM台式扫描电子显微镜

华为交换机配置BGP的基本示例

数据分析基础之《numpy（4）—ndarry运算》

分享一个项目——Sambert UI 声音克隆

ES6 语法精粹简读

uniapp整合echarts（目前性能最优、渲染最快方案）

解决Electron应用中的白屏问题的实用方法

大数据---34.HBase数据结构

【工具使用-有道云笔记】如何在有道云笔记中插入目录

用户管理第2节课-idea 2023.2 后端一删除表,从零开始---【本人】

如何添加jar包到本地Maven项目中

智能优化算法应用：基于学校优化算法3D无线传感器网络(WSN)覆盖优化 - 附代码

【MATLAB第85期】基于MATLAB的2023年智能进化算法/元启发式算法合集（持续更新）

[Realtek sdk-3.4.14b]RTL8197FH-VG+RTL8812F WiFi使用功率限制功能使用说明

Vue中为什么data属性是一个函数而不是一个对象？（看完就会了）

AI智能体信用评分系统：构建可评估、可管理的多智能体协作框架

人类不擅长做出复杂的决策。人工智能可以指出这些错误。

从命令行到自动化：用xrandr和Bash脚本打造你的Linux多屏工作流（附常用场景脚本）

OBS多路RTMP推流插件：一站式解决多平台同步直播难题

NOMA实战：从叠加编码到SIC解码的链路级仿真解析

精准测试：未来已来，只是尚未流行

基于CircuitPython与Adafruit IO的物联网倒计时时钟：精准时间同步与远程触发

利用Taotoken多模型聚合能力为你的智能客服系统注入活力

那个号称能把安全厂商、操作系统厂商桌子都掀了的Anthropic Mythos到底是吹牛还是真牛

LunaTranslator：打破语言壁垒，让视觉小说触手可及