当前位置：首页 > news >正文

深度学习 Lecture 8 决策树

news 2026/5/13 2:32:35

一、决策树模型（Decision Tree Model)

椭圆形代表决策节点（decison nodes)，矩形节点代表叶节点（leaf nodes)，方向上的值代表属性的值，

构建决策树的学习过程：

第一步：决定在根节点上的特征（也就是第一个分开样本的特征）

第二步：决定在内部节点上的特征（第二个、第三个分开样本的特征）

第三步：顺着特征写出特定的值的输出值

第一个问题：如何选择在每个节点上使用划分的特征呢？

尽量要保持最大的纯度（Maximize purity)，纯度代表说，尽可能能直接完成分类（也就是尽量把这几个类的子集分开）

第二个问题：什么时候停止划分？

1. 当一个节点能百分百判断一个类的时候

2.当划分节点将会导致树超过最大深度时

3. 想避免过拟合时

二、测量纯度（Measuring purity)

熵：对一组数据不纯度的衡量

熵函数一般用H(p_1)表示

可以看到，当样本集是五五开的时候，这条曲线是最高的，也就是熵最大。

相反，如果样本集里都是猫或者都是狗的话，熵为0.

熵函数的方程：

深度学习 Lecture 8 决策树

一、决策树模型（Decision Tree Model) 椭圆形代表决策节点（decison nodes)，矩形节点代表叶节点（leaf nodes)，方向上的值代表属性的值， 构建决策树的学习过程： 第一步：决定在根节点…...

编程日记 2024/4/17 1:26:19

打包 docker 容器镜像到另一台电脑

# 提交容器为镜像 <container_id> 容器id my_migration_image 镜像名称 docker commit <container_id> my_migration_image # 保存镜像为tar文件 docker save my_migration_image > my_migration_image.tar 在另一台电脑上导入上面的镜像，请…...

编程日记 2024/4/17 1:25:14

贪心算法--购买股票

给你一个整数数组 prices ，其中 prices[i] 表示某支股票第 i 天的价格。在每一天，你可以决定是否购买和/或出售股票。你在任何时候最多只能持有一股股票。你也可以先购买，然后在同一天出售。返回你能获得的最大利润。示例 1&a…...

编程日记 2024/4/17 1:22:12

在Mac主机上连接Linux虚拟机

前言最近醉心于研究Linux，于是在PD上安装了一个Debian Linux虚拟机，用来练练手。但是每次在mac和Linux之间切换很是麻烦，有没有一种方法，可以在mac终端直接连接我的虚拟机，这样在mac终端上就可以直接操控我的Linux虚…...

编程日记 2024/4/17 1:21:10

前端如何单独做虚拟奖金池？

公司业务需求要做一个虚拟奖金池，具体是需求是，不需要后端数据支持，但是又需要不同用户看到的奖金池数据每次变动都是一致的，并且要在给定的最小最大值中变动。一开始看需求，因为需要所有登录/未登录，不同…...

编程日记 2024/4/17 1:19:08

前端md5校验文件

前端获取文件的md5值，与文件一同传到后端，后端同样对md5值进行校验。如果相同，则文件未被损坏（其实这种方式优点类似于tcp、ip的差错校验，好像token也是这种方式） 项目准备前端并不可能手写一个算法来实…...

编程日记 2024/4/17 1:18:07

目录字符的截取 substr() trim()、ltrim()、rtrim() 字符串的拼接 ||、字符的大小写转换 upper(column_name):大写 lower(column_name):小写字符替换 replace() 搜索字符 instr(column_name, substring_to_find,start,n_appearence) charindex(substring_to_fi…...

编程日记 2024/4/17 1:17:05

云计算笔记

RAID的组合方式 RAID0：多个硬盘同时工作，可提供性能，无冗余机制 RAID1：数据保存多份，提供冗余机制，性能受到影响 RAID3：存在数据盘和单独校验盘，数据写入至数据盘后需要运算且将…...

编程日记 2024/4/17 1:14:03

网络安全学习路线-超详细

零基础小白，到就业！入门到入土的网安学习路线！ 在各大平台搜的网安学习路线都太粗略了。。。。看不下去了！ 建议的学习顺序： 一、网络安全学习普法（心里有个数，要进去坐几年！&#x…...

编程日记 2024/4/17 1:12:00

【多模态检索】Coarse-to-Fine Visual Representation

快手文本视频多模态检索论文论文：Towards Efficient and Effective Text-to-Video Retrieval with Coarse-to-Fine Visual Representation Learning 链接：https://arxiv.org/abs/2401.00701 摘要近些年，基于CLIP的text-to-video检索方法…...

编程日记 2024/4/17 1:10:59

VRRP——虚拟路由冗余协议

什么是VRRP 虚拟路由冗余协议VRRP（Virtual Router Redundancy Protocol）是一种用于提高网络可靠性的容错协议。通过VRRP，可以在主机的下一跳设备出现故障时，及时将业务切换到备份设备，从而保障网络通信的连续性和可…...

编程日记 2024/4/17 1:09:58

隧道应急广播应该如何搭建？

隧道应急广播系统的搭建需遵循以下关键步骤，确保在紧急情况下能够迅速、准确地传达信息，保障人员安全： 1. 需求分析与规划设计： 明确目标：确定广播系统覆盖范围（如隧道全长、出入口、避难所等关键位置&…...

编程日记 2024/4/17 1:04:51

OpenHarmony实战开发-Worker子线程中解压文件。

介绍本示例介绍在Worker 子线程使用ohos.zlib 提供的zlib.decompressfile接口对沙箱目录中的压缩文件进行解压操作，解压成功后将解压路径返回主线程，获取解压文件列表。效果图预览使用说明 1.点击解压按钮，解压test.zip文件&#xff0c…...

编程日记 2024/4/17 1:01:46

中国科学院大学学位论文LaTeX模版

Word排版太麻烦了，公式也不好敲，推荐用LaTeX模版，全自动官方模版下载位置：国科大sep系统 → \rightarrow → 培养指导 → \rightarrow → 论文 → \rightarrow → 论文格式检测 → \rightarrow → 撰写模板下载百度云&#…...

编程日记 2024/4/17 1:00:45

秘塔和Kimi AI在资料查询和学习中的使用对比

一、引言最近老猿在网上查资料时，基本上都使用Kimi AI进行查询，发现其查询资料后总结到位，知识点的准确度较高。今天早上收到一个消息，说新推出的秘塔AI比Kimi更新进，老猿利用在学习的《统计知识学习》简单对比试用了…...

编程日记 2024/4/17 0:59:44

apk反编译

APK文件可以通过多个工具反编译，以便查看包含在其中的Java源文件。但是，需要注意的是，通常通过反编译得到的不是原始的Java源代码，而是反编译后的代码，这意味着它可能已经被转换成了类似于原始Java代码的形式&#xff…...

编程日记 2024/4/17 0:56:41

修改百度百科的词条的方法

百度百科作为国内最大的百科全书网站之一，是广大网民获取各类知识的重要途径之一。所以，如何修改百度百科的词条成为了很多人关心的话题。本文将介绍修改百度百科的方法，并提供一些技巧和注意事项。注册百度账号首先，进入百度百…...

编程日记 2024/4/17 0:52:37

更改ip地址的几种方式有哪些

在数字化时代，IP地址作为网络设备的标识，对于我们在网络世界中的活动至关重要。然而，出于多种原因，如保护隐私、访问特定网站或进行网络测试，我们可能需要更改IP地址。虎观代理将详细介绍IP地址的更改方法与步骤&#…...

编程日记 2024/4/17 0:51:35

Flink学习（六）-容错处理

前言 Flink 是通过状态快照实现容错处理一、State Backends 由 Flink 管理的 keyed state 是一种分片的键/值存储，每个 keyed state 的工作副本都保存在负责该键的 taskmanager 本地中。一种基于 RocksDB 内嵌 key/value 存储将其工作状态保存在磁盘上&#x…...

编程日记 2024/4/17 0:48:32

设计模式(020)行为型之备忘录模式

备忘录模式是一种行为型设计模式，用于在不破坏封装性的前提下捕获一个对象的内部状态，并在该对象之外保存这个状态，以便之后可以将该对象恢复到之前的状态。这种模式通常用于需要记录对象状态历史、撤销操作或实现“回到过去”功能的场景。在…...

编程日记 2024/4/17 0:46:29

中国地址生成器：快速生成真实地址数据的开发者利器

中国地址生成器：快速生成真实地址数据的开发者利器【免费下载链接】chinese-address-generator 中国地址生成器 - 三级地址四级地址随机生成完整地址项目地址: https://gitcode.com/gh_mirrors/ch/chinese-address-generator 在开发测试、数据填充、表单…...

编程新知 2026/5/13 2:15:28

Perplexity Pro年度订阅最后48小时决策清单：7个必测场景+1张动态成本计算器+2024新政策下仅剩的3种合规降本路径

更多请点击： https://intelliparadigm.com 第一章：Perplexity Pro订阅值不值得核心能力对比：免费版 vs Pro版 Perplexity Pro 提供实时联网搜索、多文件上传解析（PDF/DOCX/CSV）、无限次深度追问及自定义AI工作区等…...

编程新知 2026/5/13 0:55:02

芯片入门必看：CPU、MCU、SoC、GPU、TPU、NPU

本文首先介绍了芯片的基础分类，包括模拟/数字芯片和逻辑/计算芯片。接着，对8类核心芯片进行了通俗解析，包括CPU、MCU、SoC、GPU、TPU、NPU、FPGA和DSP，涵盖了它们的定义、用途、类型和代表性标的。最后，文章从通用性和…...

编程新知 2026/5/13 0:44:48

技术奇点之后，人类程序员的历史角色

当人工智能越过技术奇点，代码生成、测试用例设计乃至系统运维都将发生质变。本文从软件测试从业者的视角出发，系统探讨人类程序员在奇点之后可能扮演的六种核心角色：系统守护者、需求翻译官、质量伦理法官、人机交互设计师、持续学习组织者与…...

编程新知 2026/5/12 23:50:27

电子仪器CE标志合规：从技术文件到尽职调查的完整指南

1. CE标志合规：从品牌声誉到技术文件的完整闭环在电子设计与制造领域，无论你开发的是精密的数据采集卡、复杂的信号发生器，还是看似简单的万用表，只要你的产品最终要进入欧洲经济区（EEA）市场，CE…...

编程新知 2026/5/12 23:40:29

从电机控制到呼吸灯：用STM32CubeMX玩转TIM高级定时器的互补PWM与死区时间配置

从电机控制到呼吸灯：用STM32CubeMX玩转TIM高级定时器的互补PWM与死区时间配置在嵌入式开发中，定时器是最基础也最强大的外设之一。对于STM32开发者来说，掌握高级定时器的互补PWM输出和死区时间配置，意味着可以解锁从电机控制到LE…...

编程新知 2026/5/12 22:35:31

3步构建你的第二大脑：Obsidian知识管理系统实战指南

3步构建你的第二大脑：Obsidian知识管理系统实战指南【免费下载链接】obsidian-template Starter templates for Obsidian 项目地址: https://gitcode.com/gh_mirrors/ob/obsidian-template 你是否曾为笔记杂乱无章而烦恼？是否在需要某个知识点时…...

编程新知 2026/5/12 22:29:25

全网没人敢说，关于中小企业AI营销一体机到底是卖硬件还是卖落地闭环的屎盆子，我先扣为敬。

[实话] 干这行十年，我拍着桌子定过一条死规矩。三个不做：不做只卖盒子不管结果的，不做签完合同就消失的，不做让你自己研究三个月才能用的。[实话] 现在的“AI营销一体机”，90%都是在收智商税。我见过太多老板&#xff…...

编程新知 2026/5/12 22:15:47

GLIGEN图像空间控制：用边界框实现像素级精准生成

1. GLIGEN：不是又一个“AI画图玩具”，而是图像生成控制权的真正移交你有没有试过对着 Stable Diffusion 的提示词框反复修改半小时，就为了把一只猫准确地放在沙发左边、让咖啡杯稳稳立在桌面上、让窗外的梧桐树只出现在画面右上角——结果生成…...

编程新知 2026/5/12 20:28:51

初次使用Taotoken平台从注册到完成API调用的全程指引

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度初次使用Taotoken平台从注册到完成API调用的全程指引对于初次接触大模型API的开发者而言，从注册平台到成功发出第一个…...

编程新知 2026/5/12 19:41:07

深度学习 Lecture 8 决策树

一、决策树模型（Decision Tree Model)

二、测量纯度（Measuring purity)

相关文章：

深度学习 Lecture 8 决策树

打包 docker 容器镜像到另一台电脑

贪心算法--购买股票

在Mac主机上连接Linux虚拟机

前端如何单独做虚拟奖金池？

前端md5校验文件

总结SQL相对常用的几个字符函数

云计算笔记

网络安全学习路线-超详细

【多模态检索】Coarse-to-Fine Visual Representation

VRRP——虚拟路由冗余协议

隧道应急广播应该如何搭建？

OpenHarmony实战开发-Worker子线程中解压文件。

中国科学院大学学位论文LaTeX模版

秘塔和Kimi AI在资料查询和学习中的使用对比

apk反编译

修改百度百科的词条的方法

更改ip地址的几种方式有哪些

Flink学习（六）-容错处理

设计模式(020)行为型之备忘录模式

中国地址生成器：快速生成真实地址数据的开发者利器

Perplexity Pro年度订阅最后48小时决策清单：7个必测场景+1张动态成本计算器+2024新政策下仅剩的3种合规降本路径

芯片入门必看：CPU、MCU、SoC、GPU、TPU、NPU

技术奇点之后，人类程序员的历史角色

电子仪器CE标志合规：从技术文件到尽职调查的完整指南

从电机控制到呼吸灯：用STM32CubeMX玩转TIM高级定时器的互补PWM与死区时间配置

3步构建你的第二大脑：Obsidian知识管理系统实战指南

全网没人敢说，关于中小企业AI营销一体机到底是卖硬件还是卖落地闭环的屎盆子，我先扣为敬。

GLIGEN图像空间控制：用边界框实现像素级精准生成

初次使用Taotoken平台从注册到完成API调用的全程指引