机器学习《西瓜书》学习笔记《待续》
如果说,计算机科学是研究关于“算法”的学问,那么机器学习就是研究关于“学习算法”的学问。
目录
- 绪论
- 引言
- 基本术语
- 扩展
- 向量的张成-span
- 使用Markdown语法编写数学公式
- 希腊字母的LaTex语法
- 插入一些数学的结构
- 插入定界符
- 插入一些可变大小的符号
- 插入一些函数名称
- 插入二进制运算符和关系运算符
- 插入箭头符号
- 上下标
- 输出矩阵
- 输出分段函数
- 字体
绪论
引言
为什么我们通过色泽青绿,根蒂蜷缩,敲声捉响就能判断是好瓜?
因为我们吃过、看过很多西瓜,所以基于色泽、根蒂、敲声这几个特征我们就可以做出相当好的判断。类似的,我们从以往的学习经验知道,下足了功夫、弄清了概念、做好了作业,自然会取得好成绩。
可以看出,我们能做出有效的判断,是因为我们已经积累了许多经验,而通过对已有经验的利用,就能对新的情况做出有效的决策!!
上面对经验的利用是靠我们人类自身完成的,计算机能帮忙吗?
机器学习致力于研究如何通过计算的手段,利用经验来改善系统自身的性能。在计算机系统中,“经验”通常以“数据”形式存在,因此,机器学习所研究的主要内容是关于在计算机上从数据中产生“模型(model)”的算法,即“学习算法”(learningalgorithm)。有了学习算法,我们把经验数据提供给它,它就能基于这些算法产生模型,在面对新的情况时,模型会给我们提供相应的判断。如果说,计算机科学是研究关于“算法”的学问,那么机器学习就是研究关于“学习算法”的学问。
基本术语
要进行机器学习,先要有数据,假定我们收集的的一批关于西瓜的数据,例如:
| 色泽 | 根蒂 | 敲声 |
|---|---|---|
| 青绿 | 蜷缩 | 浊响 |
| 乌黑 | 稍蜷 | 沉闷 |
| 浅白 | 硬挺 | 清脆 |
| … | … | … |
每行数据都是一条记录,这组记录的集合称为一个“数据集(dataset)”,每条记录是关于一个事件或对象(这里是西瓜对象instance)的描述,成为一个“实例(instance)”或“样本(sample)”。
反应事件或对象在某方面的表现或性质的项,如“色泽”,“根蒂”,“敲声”,称为“属性(attribute)”或“特征(feature)”。属性的取值,如“青绿”,“乌黑”,称为”属性值(attribute value)“。
属性张成的空间称为”属性空间(attribute space)“、”样本空间(sample space)“或”输入空间(input space)”。
例如,把“色泽”,“根蒂”,“敲声”作为三个坐标轴,则它们的张成一个用于描述西瓜的三维空间,每个西瓜都可以在这个空间中找到自己的坐标位置。由于空间中的每个点对应一个坐标向量,因此也把一个instance称为一个“特征向量(feature vector)”
一般地,令 D = {x1, x2, … , xm} 表示包含 m 个示例的数据集,每个instance由 d 个属性描述(例如上面的西瓜数据使用了 3 个属性),则每个实例xi = (xi1; xi2; … ; xid) 是 d 维样本空间 X 中的一个向量,xi∈X,其中 xij 是
xi在第j个属性上的取值(例如上述第 3 个西瓜在第 2 个属性上的值是"硬挺" ) , d 称为样本xi的"维数(dimensionality)。
从数据中学得模型的过程称为"学习"(learning)或"训练"(training), 这个过程通过执行某个学习算法来完成。训练过程中使用的数据称为"训练数据" (training data), 其中每个样本称为一个"训练样本" (training sample), 训练样本组成的集合称为"训练集"(training set).
扩展
向量的张成-span
使用Markdown语法编写数学公式
Markdown语法编写数学公式和LaTex有异曲同工之妙。(LaTex入门,LaTex公式手册)
在Markdown中编写数学公式通常使用LaTeX语法。对于渲染数学公式的Markdown编辑器(如GitHub、Jupyter Notebook、MathJax支持的环境等),可以使用以下两种方式编写数学公式:
在Markdown中编写数学公式通常使用LaTeX语法。对于渲染数学公式的Markdown编辑器(如GitHub、Jupyter Notebook、MathJax支持的环境等),可以使用以下两种方式编写数学公式:
行内公式使用单个美元符号 $ 包裹 LaTeX 公式,表示行内公式:
这是行内公式,例如:$E = mc^2$
这是行内公式,例如: E = m c 2 E = mc^2 E=mc2
块级公式使用双美元符号 $$ 包裹 LaTeX 公式,表示块级公式(独立成行):
这是块级公式:
$$
E = mc^2
$$
渲染后效果,这是块级公式:
E = m c 2 E = mc^2 E=mc2
复杂的数学公式
贝叶斯定理:
$$
P(A|B) = \frac{P(B|A)P(A)}{P(B)}
$$
渲染后效果:贝叶斯定理:
P ( A ∣ B ) = P ( B ∣ A ) P ( A ) P ( B ) P(A|B) = \frac{P(B|A)P(A)}{P(B)} P(A∣B)=P(B)P(B∣A)P(A)
常见数学符号:
- 分数:
\frac{a}{b} - 幂:
a^b - 下标:
a_b - 求和:
\sum - 积分:
\int
注意事项:
- 并不是所有的Markdown编辑器都支持数学公式渲染,你可以检查是否支持MathJax或者KaTeX。
- GitHub Markdown 不直接支持数学公式,需要额外的插件或工具。
希腊字母的LaTex语法

插入一些数学的结构

插入定界符

将上述定界符与\left和right组合使用可以使得定界符匹配其内容的高度,比如要构建一个如下的矩阵的行列式:
$$\left|\begin{matrix}a & b & c \\d & e & f \\g & h & i\end{matrix} \right|$$
显示效果如下:
∣ a b c d e f g h i ∣ \left|\begin{matrix} a & b & c \\ d & e & f \\ g & h & i \end{matrix} \right| adgbehcfi
插入一些可变大小的符号

插入一些函数名称

插入二进制运算符和关系运算符

插入箭头符号

上下标
可以使用^来输出上标,使用_来输出下标,使用{}包含作用范围。
$$\sin^2(\theta) + \cos^2(\theta) = 1$$$$\sum_{n=1}^\infty k$$$$\int_a^bf(x)\,dx$$$$\lim\limits_{x\to\infty}\exp(-x) = 0$$
sin 2 ( θ ) + cos 2 ( θ ) = 1 \sin^2(\theta) + \cos^2(\theta) = 1 sin2(θ)+cos2(θ)=1
∑ n = 1 ∞ k \sum_{n=1}^\infty k n=1∑∞k
∫ a b f ( x ) d x \int_a^bf(x)\,dx ∫abf(x)dx
lim x → ∞ exp ( − x ) = 0 \lim\limits_{x\to\infty}\exp(-x) = 0 x→∞limexp(−x)=0
输出矩阵
矩阵中的各元素通过用$来分隔,\来换行。
$$\begin{matrix}0&1&2\\3&4&5\\6&7&8\\\end{matrix}$$
0 1 2 3 4 5 6 7 8 \begin{matrix} 0&1&2\\ 3&4&5\\ 6&7&8\\ \end{matrix} 036147258
输出分段函数
用\begin{cases}和\end{cases}来构造分段函数,中间则用\来分段:
$$f(x) = \begin{cases}2x,\,\,x>0\\3x,\,\,x\le0\\\end{cases}$$
f ( x ) = { 2 x , x > 0 3 x , x ≤ 0 f(x) = \begin{cases} 2x,\,\,x>0\\ 3x,\,\,x\le0\\ \end{cases} f(x)={2x,x>03x,x≤0
字体
$\mathbf{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123}$
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c 123 \mathbf{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123} ABCDEFGHIJKLMNOPQRSTUVWXYZabc123
$\mathcal{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123}$
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c 123 \mathcal{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123} ABCDEFGHIJKLMNOPQRSTUVWXYZabc123
$\mathfrak{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123}$
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c 123 \mathfrak{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123} ABCDEFGHIJKLMNOPQRSTUVWXYZabc123
$\mathsf{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123}$
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c 123 \mathsf{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123} ABCDEFGHIJKLMNOPQRSTUVWXYZabc123
$\mathbb{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123}$
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c 123 \mathbb{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123} ABCDEFGHIJKLMNOPQRSTUVWXYZabc123
相关文章:
机器学习《西瓜书》学习笔记《待续》
如果说,计算机科学是研究关于“算法”的学问,那么机器学习就是研究关于“学习算法”的学问。 目录 绪论引言基本术语 扩展向量的张成-span使用Markdown语法编写数学公式希腊字母的LaTex语法插入一些数学的结构插入定界符插入一些可变大小的符号插入一些函…...
STM32HAL I2C函数
8.5 使用IIC协议读写EEPROM 硬件方式实现 (HAL库) **HAL_I2C_Mem_Write() :这种方法可以写1个或者多个字节 ** /*** brief 以阻塞模式向指定的内存地址写入数据* param hi2c 指向 I2C_HandleTypeDef 结构体的指针,包含指定 I2C 的配置信息…...
洛谷 P1644 跳马问题 C语言
题目: P1644 跳马问题 - 洛谷 | 计算机科学教育新生态 题目背景 在爱与愁的故事第一弹第三章出来前先练练四道基本的回溯/搜索题吧…… 题目描述 中国象棋半张棋盘如图 1 所示。马自左下角 (0,0) 向右上角 (m,n) 跳。规定只能往右跳,不准往左跳。比…...
每天40分玩转Django:实操在线商城
实操在线商城 一、今日学习内容概述 模块重要程度主要内容商品模型⭐⭐⭐⭐⭐商品信息、分类管理购物车系统⭐⭐⭐⭐⭐购物车功能实现订单系统⭐⭐⭐⭐⭐订单处理、支付集成用户中心⭐⭐⭐⭐订单管理、个人信息 二、模型设计 # models.py from django.db import models fro…...
Bug解决!ImportError: cannot import name MutableMapping from collections
省流:python版本更新 而一些生态库的变量命名没更新变化导致的问题 起因是在win环境下装spark 但是发现这是python底层的问题 于是想写一篇这个错误的博客警戒世人 py实在是太多生态库了 但并不是所有的都维护的很好 大概可以理解成 python原先有个东西叫col…...
【Rust自学】4.5. 切片(Slice)
4.5.0. 写在正文之前 这是第四章的最后一篇文章了,在这里也顺便对这章做一个总结: 所有权、借用和切片的概念确保 Rust 程序在编译时的内存安全。 Rust语言让程序员能够以与其他系统编程语言相同的方式控制内存使用情况,但是当数据所有者超…...
医学图像 三维重建,原图与灰度图叠加,原图与多图叠加显示;多图像融合显示,彩色灰度图像融合
Part1: Summary 我们在做图像分割或融合时,有时需要显示多份数据进行叠加显示;可能需要这种效果: 四视图: 基于这个,我看一下网上的实现总结了一下;实现了以下几种效果: Part2:多种…...
递归实现指数型枚举(递归)
92. 递归实现指数型枚举 - AcWing题库 每个数有选和不选两种情况 我们把每个数看成每层,可以画出一个递归搜索树 叶子节点就是我们的答案 很容易写出每dfs函数 dfs传入一个u表示层数 当层数大于我们n时,去判断每个数字的选择情况,输出被选…...
Unity实现Root Motion动画的Navigation自动导航
Root motion动画可以将角色的根节点(通常是角色的骨盆或脚部)的运动直接应用到游戏对象上,从而实现角色的自然移动和旋转,避免出现脚底打滑的现象。采用Root motion动画的游戏对象,通常是重载了onAnimatorMove函数&…...
[react]不能将类型“string | undefined”分配给类型“To”。 不能将类型“undefined”分配给类型“To”
场景, 封装组件的时候, 想通过外部传进去一个路由地址, 再用<Link to{}>跳转, 显示这个, 有四种方法解决 第一种 合并运算符 ?? ?? 是 空值合并运算符(Nullish Coalescing Operator),它是 JavaScript 和 TypeScript 中的一种逻辑…...
python实现基于RPC协议的接口自动化测试
01 什么是RPC RPC(Remote Procedure Call)远程过程调用协议是一个用于建立适当框架的协议。从本质上讲,它使一台机器上的程序能够调用另一台机器上的子程序,而不会意识到它是远程的。 RPC 是一种软件通信协议,一个程…...
如何使用PSQL Tool还原pg数据库(sql格式)
新建一个数据库用来还原;选择新建的数据库,右键选择【PSQL Tool】,打开PSQL Tool命令行界面;赋予pg库对sql文件的执行权限,否则会报“Permission denied”的错误,命令如下: chmod urwx D://NoS…...
uni-app商品搜索页面
目录 一:功能概述 二:功能实现 一:功能概述 商品搜索页面,可以根据商品品牌,商品分类,商品价格等信息实现商品搜索和列表展示。 二:功能实现 1:商品搜索数据 <view class="search-map padding-main bg-base"> <view class…...
【深度学习】零基础介绍循环神经网络(RNN)
RNN介绍 零基础介绍语言处理技术基本介绍分词算法词法分析工具文本分类与聚类情感分析 自然语言处理词向量词向量学习模型1. 神经网络语言模型2. CBOW 和 skip-gram3. 层次化softmax方法4. 负采样方法 RNN介绍RNN的变种:LSTM1. Forget Gate2. Input Gate3. Update M…...
青少年编程与数学 02-004 Go语言Web编程 13课题、模板引擎
青少年编程与数学 02-004 Go语言Web编程 13课题、模板引擎 一、模板引擎模板引擎的主要特点包括:模板引擎的应用场景:Go语言中的模板引擎:示例:使用Go的html/template包 二、工作流程1. 创建模板文件2. 准备数据3. 加载模板4. 渲染…...
如何优雅的关闭GoWeb服务器
以下内容均为Let’s Go Further内容节选以及作者本人理解。 这里创建了一个后台进程用于捕获关闭信号,在后台进程中,主要内容为: 创建一个缓冲通道 quit使用signal.Notify函数监听并捕获关机信号SIGINT,SIGTERM,在捕获关机信号后…...
AI程序员,开源的Devin,OpenHands 如何使用HuggingFace Inference API
我用了一下,界面这样子: Github:https://github.com/All-Hands-AI/OpenHands OpenHands 如何使用HuggingFace Inference API huggingface/meta-llama/Llama-3.3-70B-Instruct 而不是 meta-llama/Llama-3.3-70B-Instruct 不要设置base URL&…...
【动手学运动规划】 5.2 数值优化基础:梯度下降法,牛顿法
朕四季常服, 不过八套. — 大明王朝1566 道长 🏰代码及环境配置:请参考 环境配置和代码运行! 上一节我们介绍了数值优化的基本概念, 让大家对最优化问题有了基本的理解. 那么对于一个具体的问题, 我们应该如何求解呢? 这一节我们将介绍几个基本的求解…...
电子应用设计方案66:智能打印机系统设计
智能打印机系统设计 一、引言 随着科技的不断发展,打印机也在向智能化方向演进。智能打印机不仅能够提供高质量的打印服务,还具备便捷的操作、智能的管理和连接功能。 二、系统概述 1. 系统目标 - 实现高效、高质量的打印输出。 - 支持多种连接方式&am…...
iClient3D for Cesium 实现限高分析
作者:gaogy 1、背景 随着地理信息技术的发展,三维地球技术逐渐成为了许多领域中的核心工具,尤其是在城市规划、环境监测、航空航天以及军事领域。三维地图和场景的应用正在帮助人们更加直观地理解空间数据,提供更高效的决策支持。…...
(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)
题目:3442. 奇偶频次间的最大差值 I 思路 :哈希,时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况,哈希表这里用数组即可实现。 C版本: class Solution { public:int maxDifference(string s) {int a[26]…...
龙虎榜——20250610
上证指数放量收阴线,个股多数下跌,盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型,指数短线有调整的需求,大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的:御银股份、雄帝科技 驱动…...
地震勘探——干扰波识别、井中地震时距曲线特点
目录 干扰波识别反射波地震勘探的干扰波 井中地震时距曲线特点 干扰波识别 有效波:可以用来解决所提出的地质任务的波;干扰波:所有妨碍辨认、追踪有效波的其他波。 地震勘探中,有效波和干扰波是相对的。例如,在反射波…...
Linux 文件类型,目录与路径,文件与目录管理
文件类型 后面的字符表示文件类型标志 普通文件:-(纯文本文件,二进制文件,数据格式文件) 如文本文件、图片、程序文件等。 目录文件:d(directory) 用来存放其他文件或子目录。 设备…...
可靠性+灵活性:电力载波技术在楼宇自控中的核心价值
可靠性灵活性:电力载波技术在楼宇自控中的核心价值 在智能楼宇的自动化控制中,电力载波技术(PLC)凭借其独特的优势,正成为构建高效、稳定、灵活系统的核心解决方案。它利用现有电力线路传输数据,无需额外布…...
Auto-Coder使用GPT-4o完成:在用TabPFN这个模型构建一个预测未来3天涨跌的分类任务
通过akshare库,获取股票数据,并生成TabPFN这个模型 可以识别、处理的格式,写一个完整的预处理示例,并构建一个预测未来 3 天股价涨跌的分类任务 用TabPFN这个模型构建一个预测未来 3 天股价涨跌的分类任务,进行预测并输…...
大学生职业发展与就业创业指导教学评价
这里是引用 作为软工2203/2204班的学生,我们非常感谢您在《大学生职业发展与就业创业指导》课程中的悉心教导。这门课程对我们即将面临实习和就业的工科学生来说至关重要,而您认真负责的教学态度,让课程的每一部分都充满了实用价值。 尤其让我…...
Rapidio门铃消息FIFO溢出机制
关于RapidIO门铃消息FIFO的溢出机制及其与中断抖动的关系,以下是深入解析: 门铃FIFO溢出的本质 在RapidIO系统中,门铃消息FIFO是硬件控制器内部的缓冲区,用于临时存储接收到的门铃消息(Doorbell Message)。…...
微软PowerBI考试 PL300-在 Power BI 中清理、转换和加载数据
微软PowerBI考试 PL300-在 Power BI 中清理、转换和加载数据 Power Query 具有大量专门帮助您清理和准备数据以供分析的功能。 您将了解如何简化复杂模型、更改数据类型、重命名对象和透视数据。 您还将了解如何分析列,以便知晓哪些列包含有价值的数据,…...
技术栈RabbitMq的介绍和使用
目录 1. 什么是消息队列?2. 消息队列的优点3. RabbitMQ 消息队列概述4. RabbitMQ 安装5. Exchange 四种类型5.1 direct 精准匹配5.2 fanout 广播5.3 topic 正则匹配 6. RabbitMQ 队列模式6.1 简单队列模式6.2 工作队列模式6.3 发布/订阅模式6.4 路由模式6.5 主题模式…...
