机器学习《西瓜书》学习笔记《待续》
如果说,计算机科学是研究关于“算法”的学问,那么机器学习就是研究关于“学习算法”的学问。
目录
- 绪论
- 引言
- 基本术语
- 扩展
- 向量的张成-span
- 使用Markdown语法编写数学公式
- 希腊字母的LaTex语法
- 插入一些数学的结构
- 插入定界符
- 插入一些可变大小的符号
- 插入一些函数名称
- 插入二进制运算符和关系运算符
- 插入箭头符号
- 上下标
- 输出矩阵
- 输出分段函数
- 字体
绪论
引言
为什么我们通过色泽青绿
,根蒂蜷缩
,敲声捉响
就能判断是好瓜?
因为我们吃过、看过很多西瓜,所以基于色泽、根蒂、敲声这几个特征我们就可以做出相当好的判断。类似的,我们从以往的学习经验知道,下足了功夫、弄清了概念、做好了作业
,自然会取得好成绩。
可以看出,我们能做出有效的判断,是因为我们已经积累了许多经验
,而通过对已有经验的利用,就能对新的情况做出有效的决策!!
上面对经验的利用是靠我们人类自身完成的,计算机能帮忙吗?
机器学习致力于研究如何通过计算的手段,利用经验
来改善系统自身的性能。在计算机系统中,“经验”通常以“数据”形式存在,因此,机器学习所研究的主要内容是关于在计算机上从数据中产生“模型(model)”的算法
,即“学习算法”(learningalgorithm)
。有了学习算法,我们把经验数据提供给它,它就能基于这些算法产生模型,在面对新的情况时,模型会给我们提供相应的判断。如果说,计算机科学是研究关于“算法”的学问,那么机器学习就是研究关于“学习算法”的学问。
基本术语
要进行机器学习,先要有数据,假定我们收集的的一批关于西瓜的数据,例如:
色泽 | 根蒂 | 敲声 |
---|---|---|
青绿 | 蜷缩 | 浊响 |
乌黑 | 稍蜷 | 沉闷 |
浅白 | 硬挺 | 清脆 |
… | … | … |
每行数据都是一条记录,这组记录的集合称为一个“数据集(dataset)”
,每条记录是关于一个事件或对象(这里是西瓜对象instance)的描述,成为一个“实例(instance)”或“样本(sample)”
。
反应事件或对象在某方面的表现或性质的项,如“色泽”,“根蒂”,“敲声”,称为“属性(attribute)”或“特征(feature)”
。属性的取值,如“青绿”,“乌黑”,称为”属性值(attribute value)“
。
属性张成的空间称为”属性空间(attribute space)“、”样本空间(sample space)“或”输入空间(input space)”。
例如,把“色泽”,“根蒂”,“敲声”作为三个坐标轴,则它们的张成一个用于描述西瓜的三维空间,每个西瓜都可以在这个空间中找到自己的坐标位置。由于空间中的每个点对应一个坐标向量,因此也把一个instance称为一个“特征向量(feature vector)”
一般地,令 D = {x1, x2, … , xm} 表示包含 m 个示例的数据集,每个instance由 d 个属性描述(例如上面的西瓜数据使用了 3 个属性),则每个实例xi = (xi1; xi2; … ; xid) 是 d 维样本空间 X 中的一个向量,xi∈X,其中 xij
是
xi在第j个属性上的取值(例如上述第 3 个西瓜在第 2 个属性上的值是"硬挺" ) , d 称为样本xi的"维数(dimensionality)
。
从数据中学得模型的过程称为"学习"(learning)或"训练"(training)
, 这个过程通过执行某个学习算法来完成。训练过程中使用的数据称为"训练数据" (training data)
, 其中每个样本称为一个"训练样本" (training sample)
, 训练样本组成的集合称为"训练集"(training set)
.
扩展
向量的张成-span
使用Markdown语法编写数学公式
Markdown语法编写数学公式和LaTex有异曲同工之妙。(LaTex入门,LaTex公式手册)
在Markdown中编写数学公式通常使用LaTeX语法。对于渲染数学公式的Markdown编辑器(如GitHub、Jupyter Notebook、MathJax支持的环境等),可以使用以下两种方式编写数学公式:
在Markdown中编写数学公式通常使用LaTeX语法。对于渲染数学公式的Markdown编辑器(如GitHub、Jupyter Notebook、MathJax支持的环境等),可以使用以下两种方式编写数学公式:
行内公式使用单个美元符号 $
包裹 LaTeX 公式,表示行内公式:
这是行内公式,例如:$E = mc^2$
这是行内公式,例如: E = m c 2 E = mc^2 E=mc2
块级公式使用双美元符号 $$
包裹 LaTeX 公式,表示块级公式(独立成行):
这是块级公式:
$$
E = mc^2
$$
渲染后效果,这是块级公式:
E = m c 2 E = mc^2 E=mc2
复杂的数学公式
贝叶斯定理:
$$
P(A|B) = \frac{P(B|A)P(A)}{P(B)}
$$
渲染后效果:贝叶斯定理:
P ( A ∣ B ) = P ( B ∣ A ) P ( A ) P ( B ) P(A|B) = \frac{P(B|A)P(A)}{P(B)} P(A∣B)=P(B)P(B∣A)P(A)
常见数学符号:
- 分数:
\frac{a}{b}
- 幂:
a^b
- 下标:
a_b
- 求和:
\sum
- 积分:
\int
注意事项:
- 并不是所有的Markdown编辑器都支持数学公式渲染,你可以检查是否支持MathJax或者KaTeX。
- GitHub Markdown 不直接支持数学公式,需要额外的插件或工具。
希腊字母的LaTex语法
插入一些数学的结构
插入定界符
将上述定界符与\left和right组合使用可以使得定界符匹配其内容的高度,比如要构建一个如下的矩阵的行列式:
$$\left|\begin{matrix}a & b & c \\d & e & f \\g & h & i\end{matrix} \right|$$
显示效果如下:
∣ a b c d e f g h i ∣ \left|\begin{matrix} a & b & c \\ d & e & f \\ g & h & i \end{matrix} \right| adgbehcfi
插入一些可变大小的符号
插入一些函数名称
插入二进制运算符和关系运算符
插入箭头符号
上下标
可以使用^来输出上标,使用_来输出下标,使用{}包含作用范围。
$$\sin^2(\theta) + \cos^2(\theta) = 1$$$$\sum_{n=1}^\infty k$$$$\int_a^bf(x)\,dx$$$$\lim\limits_{x\to\infty}\exp(-x) = 0$$
sin 2 ( θ ) + cos 2 ( θ ) = 1 \sin^2(\theta) + \cos^2(\theta) = 1 sin2(θ)+cos2(θ)=1
∑ n = 1 ∞ k \sum_{n=1}^\infty k n=1∑∞k
∫ a b f ( x ) d x \int_a^bf(x)\,dx ∫abf(x)dx
lim x → ∞ exp ( − x ) = 0 \lim\limits_{x\to\infty}\exp(-x) = 0 x→∞limexp(−x)=0
输出矩阵
矩阵中的各元素通过用$来分隔,\来换行。
$$\begin{matrix}0&1&2\\3&4&5\\6&7&8\\\end{matrix}$$
0 1 2 3 4 5 6 7 8 \begin{matrix} 0&1&2\\ 3&4&5\\ 6&7&8\\ \end{matrix} 036147258
输出分段函数
用\begin{cases}和\end{cases}来构造分段函数,中间则用\来分段:
$$f(x) = \begin{cases}2x,\,\,x>0\\3x,\,\,x\le0\\\end{cases}$$
f ( x ) = { 2 x , x > 0 3 x , x ≤ 0 f(x) = \begin{cases} 2x,\,\,x>0\\ 3x,\,\,x\le0\\ \end{cases} f(x)={2x,x>03x,x≤0
字体
$\mathbf{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123}$
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c 123 \mathbf{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123} ABCDEFGHIJKLMNOPQRSTUVWXYZabc123
$\mathcal{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123}$
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c 123 \mathcal{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123} ABCDEFGHIJKLMNOPQRSTUVWXYZabc123
$\mathfrak{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123}$
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c 123 \mathfrak{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123} ABCDEFGHIJKLMNOPQRSTUVWXYZabc123
$\mathsf{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123}$
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c 123 \mathsf{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123} ABCDEFGHIJKLMNOPQRSTUVWXYZabc123
$\mathbb{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123}$
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c 123 \mathbb{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123} ABCDEFGHIJKLMNOPQRSTUVWXYZabc123
相关文章:

机器学习《西瓜书》学习笔记《待续》
如果说,计算机科学是研究关于“算法”的学问,那么机器学习就是研究关于“学习算法”的学问。 目录 绪论引言基本术语 扩展向量的张成-span使用Markdown语法编写数学公式希腊字母的LaTex语法插入一些数学的结构插入定界符插入一些可变大小的符号插入一些函…...
STM32HAL I2C函数
8.5 使用IIC协议读写EEPROM 硬件方式实现 (HAL库) **HAL_I2C_Mem_Write() :这种方法可以写1个或者多个字节 ** /*** brief 以阻塞模式向指定的内存地址写入数据* param hi2c 指向 I2C_HandleTypeDef 结构体的指针,包含指定 I2C 的配置信息…...

洛谷 P1644 跳马问题 C语言
题目: P1644 跳马问题 - 洛谷 | 计算机科学教育新生态 题目背景 在爱与愁的故事第一弹第三章出来前先练练四道基本的回溯/搜索题吧…… 题目描述 中国象棋半张棋盘如图 1 所示。马自左下角 (0,0) 向右上角 (m,n) 跳。规定只能往右跳,不准往左跳。比…...

每天40分玩转Django:实操在线商城
实操在线商城 一、今日学习内容概述 模块重要程度主要内容商品模型⭐⭐⭐⭐⭐商品信息、分类管理购物车系统⭐⭐⭐⭐⭐购物车功能实现订单系统⭐⭐⭐⭐⭐订单处理、支付集成用户中心⭐⭐⭐⭐订单管理、个人信息 二、模型设计 # models.py from django.db import models fro…...

Bug解决!ImportError: cannot import name MutableMapping from collections
省流:python版本更新 而一些生态库的变量命名没更新变化导致的问题 起因是在win环境下装spark 但是发现这是python底层的问题 于是想写一篇这个错误的博客警戒世人 py实在是太多生态库了 但并不是所有的都维护的很好 大概可以理解成 python原先有个东西叫col…...

【Rust自学】4.5. 切片(Slice)
4.5.0. 写在正文之前 这是第四章的最后一篇文章了,在这里也顺便对这章做一个总结: 所有权、借用和切片的概念确保 Rust 程序在编译时的内存安全。 Rust语言让程序员能够以与其他系统编程语言相同的方式控制内存使用情况,但是当数据所有者超…...

医学图像 三维重建,原图与灰度图叠加,原图与多图叠加显示;多图像融合显示,彩色灰度图像融合
Part1: Summary 我们在做图像分割或融合时,有时需要显示多份数据进行叠加显示;可能需要这种效果: 四视图: 基于这个,我看一下网上的实现总结了一下;实现了以下几种效果: Part2:多种…...

递归实现指数型枚举(递归)
92. 递归实现指数型枚举 - AcWing题库 每个数有选和不选两种情况 我们把每个数看成每层,可以画出一个递归搜索树 叶子节点就是我们的答案 很容易写出每dfs函数 dfs传入一个u表示层数 当层数大于我们n时,去判断每个数字的选择情况,输出被选…...

Unity实现Root Motion动画的Navigation自动导航
Root motion动画可以将角色的根节点(通常是角色的骨盆或脚部)的运动直接应用到游戏对象上,从而实现角色的自然移动和旋转,避免出现脚底打滑的现象。采用Root motion动画的游戏对象,通常是重载了onAnimatorMove函数&…...
[react]不能将类型“string | undefined”分配给类型“To”。 不能将类型“undefined”分配给类型“To”
场景, 封装组件的时候, 想通过外部传进去一个路由地址, 再用<Link to{}>跳转, 显示这个, 有四种方法解决 第一种 合并运算符 ?? ?? 是 空值合并运算符(Nullish Coalescing Operator),它是 JavaScript 和 TypeScript 中的一种逻辑…...

python实现基于RPC协议的接口自动化测试
01 什么是RPC RPC(Remote Procedure Call)远程过程调用协议是一个用于建立适当框架的协议。从本质上讲,它使一台机器上的程序能够调用另一台机器上的子程序,而不会意识到它是远程的。 RPC 是一种软件通信协议,一个程…...

如何使用PSQL Tool还原pg数据库(sql格式)
新建一个数据库用来还原;选择新建的数据库,右键选择【PSQL Tool】,打开PSQL Tool命令行界面;赋予pg库对sql文件的执行权限,否则会报“Permission denied”的错误,命令如下: chmod urwx D://NoS…...
uni-app商品搜索页面
目录 一:功能概述 二:功能实现 一:功能概述 商品搜索页面,可以根据商品品牌,商品分类,商品价格等信息实现商品搜索和列表展示。 二:功能实现 1:商品搜索数据 <view class="search-map padding-main bg-base"> <view class…...

【深度学习】零基础介绍循环神经网络(RNN)
RNN介绍 零基础介绍语言处理技术基本介绍分词算法词法分析工具文本分类与聚类情感分析 自然语言处理词向量词向量学习模型1. 神经网络语言模型2. CBOW 和 skip-gram3. 层次化softmax方法4. 负采样方法 RNN介绍RNN的变种:LSTM1. Forget Gate2. Input Gate3. Update M…...
青少年编程与数学 02-004 Go语言Web编程 13课题、模板引擎
青少年编程与数学 02-004 Go语言Web编程 13课题、模板引擎 一、模板引擎模板引擎的主要特点包括:模板引擎的应用场景:Go语言中的模板引擎:示例:使用Go的html/template包 二、工作流程1. 创建模板文件2. 准备数据3. 加载模板4. 渲染…...
如何优雅的关闭GoWeb服务器
以下内容均为Let’s Go Further内容节选以及作者本人理解。 这里创建了一个后台进程用于捕获关闭信号,在后台进程中,主要内容为: 创建一个缓冲通道 quit使用signal.Notify函数监听并捕获关机信号SIGINT,SIGTERM,在捕获关机信号后…...

AI程序员,开源的Devin,OpenHands 如何使用HuggingFace Inference API
我用了一下,界面这样子: Github:https://github.com/All-Hands-AI/OpenHands OpenHands 如何使用HuggingFace Inference API huggingface/meta-llama/Llama-3.3-70B-Instruct 而不是 meta-llama/Llama-3.3-70B-Instruct 不要设置base URL&…...

【动手学运动规划】 5.2 数值优化基础:梯度下降法,牛顿法
朕四季常服, 不过八套. — 大明王朝1566 道长 🏰代码及环境配置:请参考 环境配置和代码运行! 上一节我们介绍了数值优化的基本概念, 让大家对最优化问题有了基本的理解. 那么对于一个具体的问题, 我们应该如何求解呢? 这一节我们将介绍几个基本的求解…...

电子应用设计方案66:智能打印机系统设计
智能打印机系统设计 一、引言 随着科技的不断发展,打印机也在向智能化方向演进。智能打印机不仅能够提供高质量的打印服务,还具备便捷的操作、智能的管理和连接功能。 二、系统概述 1. 系统目标 - 实现高效、高质量的打印输出。 - 支持多种连接方式&am…...
iClient3D for Cesium 实现限高分析
作者:gaogy 1、背景 随着地理信息技术的发展,三维地球技术逐渐成为了许多领域中的核心工具,尤其是在城市规划、环境监测、航空航天以及军事领域。三维地图和场景的应用正在帮助人们更加直观地理解空间数据,提供更高效的决策支持。…...

Spark 之 入门讲解详细版(1)
1、简介 1.1 Spark简介 Spark是加州大学伯克利分校AMP实验室(Algorithms, Machines, and People Lab)开发通用内存并行计算框架。Spark在2013年6月进入Apache成为孵化项目,8个月后成为Apache顶级项目,速度之快足见过人之处&…...

《Qt C++ 与 OpenCV:解锁视频播放程序设计的奥秘》
引言:探索视频播放程序设计之旅 在当今数字化时代,多媒体应用已渗透到我们生活的方方面面,从日常的视频娱乐到专业的视频监控、视频会议系统,视频播放程序作为多媒体应用的核心组成部分,扮演着至关重要的角色。无论是在个人电脑、移动设备还是智能电视等平台上,用户都期望…...
从零实现富文本编辑器#5-编辑器选区模型的状态结构表达
先前我们总结了浏览器选区模型的交互策略,并且实现了基本的选区操作,还调研了自绘选区的实现。那么相对的,我们还需要设计编辑器的选区表达,也可以称为模型选区。编辑器中应用变更时的操作范围,就是以模型选区为基准来…...

理解 MCP 工作流:使用 Ollama 和 LangChain 构建本地 MCP 客户端
🌟 什么是 MCP? 模型控制协议 (MCP) 是一种创新的协议,旨在无缝连接 AI 模型与应用程序。 MCP 是一个开源协议,它标准化了我们的 LLM 应用程序连接所需工具和数据源并与之协作的方式。 可以把它想象成你的 AI 模型 和想要使用它…...
测试markdown--肇兴
day1: 1、去程:7:04 --11:32高铁 高铁右转上售票大厅2楼,穿过候车厅下一楼,上大巴车 ¥10/人 **2、到达:**12点多到达寨子,买门票,美团/抖音:¥78人 3、中饭&a…...

PL0语法,分析器实现!
简介 PL/0 是一种简单的编程语言,通常用于教学编译原理。它的语法结构清晰,功能包括常量定义、变量声明、过程(子程序)定义以及基本的控制结构(如条件语句和循环语句)。 PL/0 语法规范 PL/0 是一种教学用的小型编程语言,由 Niklaus Wirth 设计,用于展示编译原理的核…...
汇编常见指令
汇编常见指令 一、数据传送指令 指令功能示例说明MOV数据传送MOV EAX, 10将立即数 10 送入 EAXMOV [EBX], EAX将 EAX 值存入 EBX 指向的内存LEA加载有效地址LEA EAX, [EBX4]将 EBX4 的地址存入 EAX(不访问内存)XCHG交换数据XCHG EAX, EBX交换 EAX 和 EB…...

SiFli 52把Imagie图片,Font字体资源放在指定位置,编译成指定img.bin和font.bin的问题
分区配置 (ptab.json) img 属性介绍: img 属性指定分区存放的 image 名称,指定的 image 名称必须是当前工程生成的 binary 。 如果 binary 有多个文件,则以 proj_name:binary_name 格式指定文件名, proj_name 为工程 名&…...

解读《网络安全法》最新修订,把握网络安全新趋势
《网络安全法》自2017年施行以来,在维护网络空间安全方面发挥了重要作用。但随着网络环境的日益复杂,网络攻击、数据泄露等事件频发,现行法律已难以完全适应新的风险挑战。 2025年3月28日,国家网信办会同相关部门起草了《网络安全…...

ubuntu22.04有线网络无法连接,图标也没了
今天突然无法有线网络无法连接任何设备,并且图标都没了 错误案例 往上一顿搜索,试了很多博客都不行,比如 Ubuntu22.04右上角网络图标消失 最后解决的办法 下载网卡驱动,重新安装 操作步骤 查看自己网卡的型号 lspci | gre…...