当前位置：首页 > news >正文

sklearn和tensorflow的理解

news 2026/2/9 15:51:16

人工智能的实现是基于机器学习，机器学习的一个方法是神经网络，以及各种机器学习算法库。

有监督学习：一般数据构成是【特征值+目标值】

无监督学习：一般数据构成是【特征值】

Scikit-learn(sklearn)的定位是通用机器学习库，传统的机器学习库。

sklearn主要适合中小型的、实用机器学习项目，尤其是那种数据量不大且需要使用者手动对数据进行处理，并选择合适模型的项目。这类项目往往在CPU上就可以完成，对硬件要求低。

sklearn更倾向于使用者可以自行对数据进行处理，比如选择特征、压缩维度、转换格式，是传统机器学习库，SKLearn中，因为做了上层的封装，分类模型、回归模型、聚类与降维模型、预处理器等等都叫做估计器(estimator)

①机器学习基础知识：机器学习定义与四要素：数据、任务、性能度量和模型。机器学习概念，以便和SKLearn对应匹配上。

②SKLearn讲解：API设计原理，SKLearn几大特点：一致性、可检验、标准类、可组合和默认值，以及SKLearn自带数据以及储存格式。

③SKLearn三大核心API讲解：包括估计器、预测器和转换器。这个板块很重要，大家实际应用时主要是借助于核心API落地。

④SKLearn高级API讲解：包括简化代码量的流水线(Pipeline估计器)，集成模型(Ensemble估计器)、有多类别-多标签-多输出分类模型(Multiclass 和 Multioutput 估计器)和模型选择工具(Model Selection估计器)。

TensorFlow(tf)的定位主要是深度学习库，tf主要适合已经明确了解需要用深度学习，且数据处理需求不高的项目。这类项目往往数据量较大，且最终需要的精度更高，一般都需要GPU加速运算

不过小样本的也可以使用Tf的Keras来完成：一般使用流程

model = Sequential() # 定义模型
model.add(Dense(units=64, activation='relu', input_dim=100)) # 定义网络结构
model.add(Dense(units=10, activation='softmax')) # 定义网络结构
model.compile(loss='categorical_crossentropy', # 定义loss函数、优化方法、评估标准optimizer='sgd',metrics=['accuracy'])
model.fit(x_train, y_train, epochs=5, batch_size=32) # 训练模型
loss_and_metrics = model.evaluate(x_test, y_test, batch_size=128) # 评估模型
classes = model.predict(x_test, batch_size=128) # 使用训练好的数据进行预测常用：
model.fit训练
loss,accuracy = model.evaluate模型评估计算准确率
model.predict预测model.summary 打印模型结构
model.get_config

DNN介绍：

深度神经网络(DNN)是一种多层无监督神经网络，并且将上一层的输出特征作为下一层的输入进行特征学习，通过逐层特征映射后，将现有空间样本的特征映射到另一个特征空间，以此来学习对现有输入具有更好的特征表达。深度神经网络具有多个非线性映射的特征变换，可以对高度复杂的函数进行拟合。如果将深层结构看作一个神经元网络，则深度神经网络的核心思想可用三个点描述如下:

(1)每层网络的预训练均采用无监督学习；

(2)无监督学习逐层训练每一层，即将上一层输出作下一层的输入；

(3)有监督学习来微调所有层(加上一个用于分类的分类器)。

深度神经网络与传统神经网络的主要区别在于训练机制。

为了克服传统神经网络容易过拟合及训练速度慢等不足，深度神经网络整体上采用逐层预训练的训练机制，而不是采用传统神经网络的反向传播训练机制。

优点：

克服了人工设计特征费时、费力的缺点；
通过逐层数据预训练得到每层的初级特征；
分布式数据学习更加有效（指数级）；
相比浅层建模方式，深层建模能更细致高效的表示实际的复杂非线性问题。

DNN模型的神经网络层分为三类，其中第一层为输入层，最后一层为输出层，中间都为隐藏层。每一层之前是完全连接的，整体上看是复杂的，但从局部来看，实质上还是感知机模型。DNN可拟合任意函数。

sklearn和tensorflow的理解

人工智能的实现是基于机器学习，机器学习的一个方法是神经网络，以及各种机器学习算法库。有监督学习：一般数据构成是【特征值目标值】无监督学习：一般数据构成是【特征值】 Scikit-learn(sklearn)的定位是通用机器学习库&…...

编程日记 2023/12/21 6:40:46

css中BFC

css BFC BFC具有以下特性创建BFC的方式有多种BFC的应用场景和作用扩展： CSS动画 transition: 过渡动画animation / keyframestransform都有哪些属性举例 css BFC BFC，即块级格式化上下文（Block Formatting Context）&#xf…...

编程日记 2023/12/21 6:34:41

华为OD机试 - 小朋友来自多少小区（Java JS Python C）

题目描述幼儿园组织活动，老师布置了一个任务：每个小朋友去了解与自己同一个小区的小朋友还有几个。我们将这些数量汇总到数组 garden 中。请根据这些小朋友给出的信息，计算班级小朋友至少来自几个小区？输入描述输入：garden[] = {2, 2, 3} 输出描述输出：7 备…...

编程日记 2023/12/21 6:33:40

前端：NPM的介绍和使用

一、NPM的介绍 NPM是Node.js的包管理器，用于管理Node.js的包NPM提供了方便的方式来安装、管理和分享Node.js的包二、NPM的使用 1. 安装NPM 要使用NPM，首先需要安装Node.js。安装完成后，可以在命令行中运行以下命令来检查Node.js和NPM是否…...

编程日记 2023/12/21 6:32:38

力扣57. 插入区间

双指针法思路： 用待插入区间左右边界初始化双指针 left 和 right；遍历待归并区间： 如果元素整体边界在 [left, right] 左侧（item[1] < left），则将给元素插入结果数组中；如果元素整体边界在…...

编程日记 2023/12/21 6:30:37

Linux c++开发-11-Socket TCP编程简单案例

服务端： #include <stdio.h> #include <stdlib.h> #include <string.h> #include <unistd.h> #include <netinet/in.h> #include <sys/types.h>#include <errno.h>int main(void) {//1.socketint server_sock socket(A…...

编程日记 2023/12/21 6:29:35

ros2机器人常规控制流程

The joint_state_publisher reads the robot_description parameter from the parameter server, finds all of the non-fixed joints and publishes a JointState message with all those joints defined.也就是说如果我们不需要控制机器人运动，只需要一个节点就可…...

编程日记 2023/12/21 6:28:34

分布式全局ID之雪花算法

系列文章目录提示：这里可以添加系列文章的所有文章的目录，目录需要自己手动添加雪花算法提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录系列文章目录前言一、什么是雪花算法&#xff1f…...

编程日记 2023/12/21 6:27:33

拿到服务器该做的事和升级docker engine

sudo apt-get install docker-ce docker-ce-cli containerd.io docker-buildx-plugin docker-compose-pluginsudo -i # 切换到 root 用户apt update -y # 升级 packagesapt install wget curl sudo vim git -y # Debian 系统比较干净，安装常用的软件安装docker …...

编程日记 2023/12/21 6:24:31

【VScode和Leecode的爱恨情仇】command ‘leetcode.signin‘ not found

文章目录一、关于command ‘leetcode.signin‘ not found的问题二、解决方案第一，没有下载Nodejs；第二，有没有在VScode中配置Nodejs第三，力扣的默认在VScode请求地址中请求头错误首先搞定配置其次搞定登入登入方法一：…...

编程日记 2023/12/21 6:21:28

mangokit：golang web项目管理工具，使用proto定义http路由和错误

文章目录前言1、mangokit介绍1.1 根据proto文件生成http路由1.2 根据proto文件生成响应码1.3 使用wire来管理依赖注入 2、mangokit实现2.1 protobuf插件开发2.2 mangokit工具 3、使用示例3.1 创建新项目3.2 添加新的proto文件3.3 代码生成前言在使用gin框架开发web应用时&a…...

编程日记 2023/12/21 6:20:28

微信小程序实现一个简单的登录功能

微信小程序实现一个简单的登录功能功能介绍login.wxmllogin.jsuserInfo.wxmluserInfo.js解析功能介绍微信小程序实现一个简单的登录功能。包括一个登录页面和一个用户信息展示页面。在登录页面中输入用户名和密码，点击登录按钮进行验证，如果验证成功&…...

编程日记 2023/12/21 6:18:26

whisper深入-语者分离

文章目录学习目标：如何使用whisper学习内容一：whisper 转文字1.1 使用whisper.load_model()方法下载，加载1.2 使用实例对文件进行转录1.3 实战学习内容二：语者分离（pyannote.audio）pyannote.audio是huggi…...

编程日记 2023/12/21 6:17:25

LuaJava操作Java的方法

最近在学习lua，然后顺便看了下luaj，可能用的人比较少，网上关于luaj的文章较少，其中在网上找到这个博主的相关文章，很详细，对于要学习luaj的小伙伴可以两篇一起查看，本文在此基础上进行扩展。 …...

编程日记 2023/12/21 6:16:24

oracle怎样才算开启了内存大页？

oracle怎样才算开启了内存大页？ 关键核查下面三点： 1./etc/sysctl.conf vm.nr_hugepages16384这是给了32G，计划sga给30G，一般需多分配2-4G sysctl -p生效看cat /proc/meminfo|grep Huge啥结果？ 这种明显是配了…...

编程日记 2023/12/21 6:15:23

【halcon深度学习之那些封装好的库函数】determine_dl_model_detection_param

determine_dl_model_detection_param 目标检测的数据准备过程中的有一个库函数determine_dl_model_detection_param “determine_dl_model_detection_param” 直译为 “确定深度学习模型检测参数”。这个过程会自动针对给定数据集估算模型的某些高级参数，强烈建议…...

编程日记 2023/12/21 6:14:22

跟着我学Python进阶篇：01.试用Python完成一些简单问题

往期文章跟着我学Python基础篇：01.初露端倪跟着我学Python基础篇：02.数字与字符串编程跟着我学Python基础篇：03.选择结构跟着我学Python基础篇：04.循环跟着我学Python基础篇：05.函数跟着我学Python基础篇&#…...

编程日记 2023/12/21 6:13:21

neo4j-Py2neo使用

neo4j-Py2neo(一)：基本库介绍使用 py2neo的文档地址：https://neo4j-contrib.github.io/py2neo/ py2neo的本质是可以采用两种方式进行操作，一种是利用cypher语句，一种是使用库提供的DataTypes，Data类的实例需要和远程…...

编程日记 2023/12/21 6:07:16

uint29传输格式

前言不知道谁想出来的。反正我是想不到。我看网上也没人讲这个。写篇博客帮一下素未谋面的网友。 uint29 本质上是网络传输的时候，借用至多4字节Bytes，表达29位的无符号整数。读8位数字，判断小于128? 是的话，返回末7位…...

编程日记 2023/12/21 6:04:14

Linux：终端定时自动注销

这样防止了，当我们临时离开电脑这个空隙，被坏蛋给趁虚而入定几十秒或者分钟，如果这个时间段没有输入东西那么就会自动退出全局生效这个系统中的所有用户生效 vim /etc/profile在末尾加入TMOUT10 TMOUT10 这个就是10 秒，按…...

编程日记 2023/12/21 6:03:12

CTF show Web 红包题第六弹

提示 1.不是SQL注入 2.需要找关键源码思路进入页面发现是一个登录框，很难让人不联想到SQL注入，但提示都说了不是SQL注入，所以就不往这方面想了先查看一下网页源码，发现一段JavaScript代码，有一个关键类ctfs…...

编程新知 2026/2/5 4:33:58

Xshell远程连接Kali（默认 | 私钥）Note版

前言:xshell远程连接，私钥连接和常规默认连接任务一开启ssh服务 service ssh status //查看ssh服务状态 service ssh start //开启ssh服务 update-rc.d ssh enable //开启自启动ssh服务任务二修改配置文件 vi /etc/ssh/ssh_config //第一…...

编程新知 2026/1/28 2:18:42

在HarmonyOS ArkTS ArkUI-X 5.0及以上版本中，手势开发全攻略：

在 HarmonyOS 应用开发中，手势交互是连接用户与设备的核心纽带。ArkTS 框架提供了丰富的手势处理能力，既支持点击、长按、拖拽等基础单一手势的精细控制，也能通过多种绑定策略解决父子组件的手势竞争问题。本文将结合官方开发文档&#xff0c…...

编程新知 2025/9/19 4:31:58

深入浅出：JavaScript 中的 `window.crypto.getRandomValues()` 方法

深入浅出：JavaScript 中的 window.crypto.getRandomValues() 方法在现代 Web 开发中，随机数的生成看似简单，却隐藏着许多玄机。无论是生成密码、加密密钥，还是创建安全令牌，随机数的质量直接关系到系统的安全性。Jav…...

编程新知 2025/10/8 4:56:09

CMake基础：构建流程详解

目录 1.CMake构建过程的基本流程 2.CMake构建的具体步骤 2.1.创建构建目录 2.2.使用 CMake 生成构建文件 2.3.编译和构建 2.4.清理构建文件 2.5.重新配置和构建 3.跨平台构建示例 4.工具链与交叉编译 5.CMake构建后的项目结构解析 5.1.CMake构建后的目录结构 5.2.构…...

编程新知 2026/2/2 7:39:34

AspectJ 在 Android 中的完整使用指南

一、环境配置（Gradle 7.0 适配） 1. 项目级 build.gradle // 注意：沪江插件已停更，推荐官方兼容方案 buildscript {dependencies {classpath org.aspectj:aspectjtools:1.9.9.1 // AspectJ 工具} } 2. 模块级 build.gradle plu…...

编程新知 2025/7/7 22:33:57

基于Java+MySQL实现（GUI）客户管理系统

客户资料管理系统的设计与实现第一章需求分析 1.1 需求总体介绍本项目为了方便维护客户信息为了方便维护客户信息，对客户进行统一管理，可以把所有客户信息录入系统，进行维护和统计功能。可通过文件的方式保存相关录入数据，对…...

编程新知 2026/1/25 10:12:06

现有的 Redis 分布式锁库（如 Redisson）提供了哪些便利？

现有的 Redis 分布式锁库（如 Redisson）相比于开发者自己基于 Redis 命令（如 SETNX, EXPIRE, DEL）手动实现分布式锁，提供了巨大的便利性和健壮性。主要体现在以下几个方面： 原子性保证 (Atomicity)&#xff…...

编程新知 2025/9/23 11:26:04

计算机基础知识解析：从应用到架构的全面拆解

目录前言 1、计算机的应用领域：无处不在的数字助手 2、计算机的进化史：从算盘到量子计算 3、计算机的分类：不止 “台式机和笔记本” 4、计算机的组件：硬件与软件的协同 4.1 硬件：五大核心部件 4.2 软件&#…...

编程新知 2026/1/31 9:44:27

【堆垛策略】设计方法

堆垛策略的设计是积木堆叠系统的核心，直接影响堆叠的稳定性、效率和容错能力。以下是分层次的堆垛策略设计方法，涵盖基础规则、优化算法和容错机制： 1. 基础堆垛规则 (1) 物理稳定性优先重心原则： 大尺寸/重量积木在下&#xf…...

编程新知 2026/2/8 13:33:28

相关文章：