机器学习准备工作
机器学习准备工作
- 机器学习
- 概述
- 常见算法
- 动手实践
- 深度学习
- 基础
- 框架
- 应用领域
- 数学基础
- 线性代数
- 概率论和统计学
- 微积分
- 编程基础
- Python基础
- 数据处理工具
- 项目实战
- 入门
- 1. Scikit-learn 示例项目
- 2. TensorFlow/Keras 入门项目
- 3. Kaggle 入门竞赛
- 进阶
- 1. PyTorch 官方教程
- 2. MMDetection(目标检测框架)
- 3. Hugging Face Transformers
- 综合应用
- 1. FastAI 课程项目
- 2. DeepLearning.AI 项目集
- 3. OpenAI Gym(强化学习)
机器学习
概述
- 三大类型(监督学习、无监督学习、强化学习)
- 数据集划分(训练集、验证集、测试集)
- 过拟合与欠拟合
- 推荐资源:
- 《机器学习》 by 周志华(俗称“西瓜书”)
- Andrew Ng 的 Coursera 机器学习课程
常见算法
- 监督学习
- 回归(线性回归与逻辑回归)
- 决策树与随机森林
- 支持向量机(SVM)
- K近邻算法(KNN)
- 无监督学习
- K均值聚类(K-Means)
- 主成分分析(PCA)
- 其他重要概念
- 模型评估(准确率、召回率、F1 分数等)
- 交叉验证
- 推荐资源:
- Scikit-learn 官方文档与教程
- 统计学习方法》 by 李航
动手实践
- 使用 Scikit-learn 实现上述算法
- 在 Kaggle 上完成简单的比赛(如 Titanic 生存预测)
深度学习
基础
- 神经网络的基本结构(输入层、隐藏层、输出层)
- 激活函数(ReLU、Sigmoid、Softmax 等)
- 反向传播与优化算法(SGD、Adam 等)
- 推荐资源:
- 《深度学习》 by Ian Goodfellow(俗称“花书”)
- DeepLearning.AI 的深度学习专项课程(Coursera)
框架
- TensorFlow 或 PyTorch 的基本使用
- 构建简单的神经网络模型
- 推荐资源:
- TensorFlow 官方教程
- PyTorch 官方教程
应用领域
- 计算机视觉(卷积神经网络 CNN)
- 自然语言处理(循环神经网络 RNN、Transformer)
- 强化学习基础
- 推荐资源:
- CS231n(斯坦福大学的计算机视觉课程)
- CS224n(斯坦福大学的自然语言处理课程)
数学基础
线性代数
- 向量&矩阵&矩阵乘法
- 特征值&特征向量
- 推荐资源:
- 《线性代数及其应用》 by Gilbert Strang
- MIT OpenCourseWare 的线性代数课程
概率论和统计学
- 概率分布(正态分布&二项分布&概率密度函数)
- 常见统计量(均值、方差、协方差等)
- 条件概率&贝叶斯定理
- 推荐资源:
-《概率论与数理统计》 by 茆诗松- Khan Academy 的概率与统计课程
微积分
- 导数&偏导数
- 梯度&梯度下降&梯度向量
- 积分(可选)
- 推荐资源:
-《微积分的本质》 by 3Blue1Brown(YouTube 视频)- Coursera 上的微积分课程
编程基础
Python基础
- 数据类型(列表、字典、元组等)
- 控制结构(if/else、for 循环等)
- 函数与模块
- 文件操作
- 推荐资源:
- 《Python编程:从入门到实践》 by Eric Matthes
- Codecademy 的 Python 课程
数据处理工具
- NumPy(数组操作)
- Pandas(数据清洗与分析)
- Matplotlib 和 Seaborn(数据可视化)
- 推荐资源:
- 官方文档与教程
- Kaggle 的 Python 数据科学教程
项目实战
入门
1. Scikit-learn 示例项目
- 简介 :Scikit-learn 官方提供的机器学习示例,涵盖分类、回归、聚类等基础任务。
- 学习内容 :数据预处理、模型训练、评估指标。
- 地址 :Scikit-learn Examples
- 推荐理由 :代码简洁,适合理解经典算法(如线性回归、SVM、K-Means)。
2. TensorFlow/Keras 入门项目
- 项目示例 :
- MNIST 手写数字识别 :使用简单的神经网络实现分类。
- CIFAR-10 图像分类 :卷积神经网络(CNN)入门。
- 地址 :TensorFlow Tutorials
- 推荐理由 :官方教程,适合深度学习初学者。
3. Kaggle 入门竞赛
- 推荐项目 :
- Titanic 生存预测 :经典的结构化数据分类任务。
- House Prices 预测 :回归问题,学习特征工程。
- 地址 :Kaggle Competitions
- 资源 :Kaggle 提供数据集、Notebook 和社区讨论。
进阶
1. PyTorch 官方教程
- 项目示例 :
- 图像分类(ResNet) :实现经典卷积网络。
- 文本分类(LSTM/Transformer) :自然语言处理入门。
- 地址 :PyTorch Tutorials
- 推荐理由 :动态计算图框架,适合深入理解深度学习。
2. MMDetection(目标检测框架)
- 简介 :基于 PyTorch 的目标检测开源库,支持 Faster R-CNN、YOLO 等算法。
- 学习内容 :计算机视觉、模型调优。
- 地址 :MMDetection GitHub
- 适合场景 :图像识别、目标检测实战。
3. Hugging Face Transformers
- 简介 :自然语言处理(NLP)领域的标杆项目,提供预训练模型(如 BERT、GPT)。
- 学习内容 :文本分类、命名实体识别、机器翻译。
- 地址 :Hugging Face GitHub
- 推荐理由 :快速上手 SOTA(State-of-the-Art)NLP 模型。
综合应用
1. FastAI 课程项目
- 简介 :Jeremy Howard 的实战课程配套代码,涵盖计算机视觉、NLP、推荐系统。
- 地址 :FastAI GitHub
- 推荐理由 :代码简洁高效,适合快速构建应用。
2. DeepLearning.AI 项目集
- 简介 :吴恩达深度学习课程配套的编程作业(Coursera)。
- 内容 :神经网络基础、优化算法、CNN、RNN。
- 地址 :DeepLearning.AI GitHub
- 适合人群 :系统化学习深度学习理论与实践。
3. OpenAI Gym(强化学习)
- 简介 :强化学习环境库,提供 CartPole、Atari 游戏等经典场景。
- 学习内容 :Q-Learning、DQN、PPO 等算法。
- 地址 :OpenAI Gym GitHub
- 推荐理由 :强化学习必学工具。
相关文章:
机器学习准备工作
机器学习准备工作 机器学习概述常见算法动手实践 深度学习基础框架应用领域 数学基础线性代数概率论和统计学微积分 编程基础Python基础数据处理工具 项目实战入门1. Scikit-learn 示例项目2. TensorFlow/Keras 入门项目3. Kaggle 入门竞赛 进阶1. PyTorch 官方教程2. MMDetect…...
汽车智能钥匙中PKE低频天线的作用
PKE(Passive Keyless Entry)即被动式无钥匙进入系统,汽车智能钥匙中PKE低频天线在现代汽车的智能功能和安全保障方面发挥着关键作用,以下是其具体作用: 信号交互与身份认证 低频信号接收:当车主靠近车辆时…...
Codepen和tailwindcss 进行UI布局展示
html <html lang"zh"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>设备管理仪表盘</title><script src"https://cdn.tailw…...
准备好了数据集之后,如何在ubuntu22.04上训练一个yolov8模型。
在Ubuntu 22.04上训练YOLOv8模型的步骤如下: 1. 安装依赖 首先,确保系统已安装Python和必要的库。 sudo apt update sudo apt install python3-pip python3-venv2. 创建虚拟环境 创建并激活虚拟环境: python3 -m venv yolov8_env source…...
集合框架、Collection、list、ArrayList、Set、HashSet和LinkedHashSet、判断两个对象是否相等
DAY7.1 Java核心基础 集合框架 Java 中很重要的一个知识点,实际开发中使用的频录较高,Java 程序中必备的模块 集合就是长度可以改变,可以保存任意数据类型的动态数组 最上层是一组接口,接下来是接口的实现类,第三层…...
宝塔 Linux 计划任务中添加运行项目网站PHP任务-定时任务
一、指定php版运行, cd /www/wwwroot/www.xxx.com/ && /www/server/php/56/bin/php think timedtasks start >> /tmp/timedtasks.log 2>&1 二、不指定php版 cd /www/wwwroot/www.xxx.com/ && php think timedtasks start >> …...
JDK ZOOKEEPER KAFKA安装
JDK17下载安装 mkdir -p /usr/local/develop cd /usr/local/develop 将下载的包上传服务器指定路径 解压文件 tar -zxvf jdk-17.0.14_linux-x64_bin.tar.gz -C /usr/local/develop/ 修改文件夹名 mv /usr/local/develop/jdk-17.0.14 /usr/local/develop/java17 配置环境变量…...
c++雅兰亭库 (yalantinglibs) 介绍及使用(序列化、json和结构体转换、协程
c雅兰亭库 (yalantinglibs) 介绍及使用(序列化、json和结构体转换、协程)-CSDN博客 雅兰亭库(yalantinglibs)介绍 雅兰亭库,名字很优雅,也很强大。它是阿里开源的一个现代C基础工具库的集合, 现在包括 struct_pack, struct_json, struct_xml, struct_yam…...
深度融合,智领未来丨zAIoT 全面集成 DeepSeek,助力企业迎接数据智能新时代
前言 Introduction 在数字化浪潮汹涌澎湃的当下,数据智能成为企业破局与创新的关键驱动力。zAIoT 作为云和恩墨面向 AIData 时代推出的数据智能平台软件,凭借其全面且强大的“采存算用”一体化功能体系,正在为航空航天、工业制造等领域和态势…...
类和对象—多态—案例2—制作饮品
案例描述: 制作饮品的大致流程为:煮水-冲泡-倒入杯中-加入辅料 利用多态技术实现本案例,提供抽象制作产品基类,提供子类制作咖啡和茶叶 思路解析: 1. 定义抽象基类 - 创建 AbstractDrinking 抽象类,该类…...
VSCode 配置优化指南:打造高效的 uni-app、Vue2/3、JS/TS 开发环境
VSCode 配置优化指南,适用于 uni-app、Vue2、Vue3、JavaScript、TypeScript 开发,包括插件推荐、设置优化、代码片段、调试配置等,确保你的开发体验更加流畅高效。 1. 安装 VSCode 如果你还未安装 VSCode,可前往 VSCode 官网 下载最新版并安装。 2. 安装推荐插件 (1) Vue…...
低代码平台的后端架构设计与核心技术解析
引言:低代码如何颠覆传统后端开发? 在传统开发模式下,一个简单用户管理系统的后端开发需要: 3天数据库设计5天REST API开发2天权限模块对接50个易出错的代码文件 而现代低代码平台通过可视化建模自动化生成,可将开发…...
Redis中多大的Key算热key,该如何解决
在 Redis 中,“热key” 是指频繁访问的 Redis 键。这些键通常会导致 Redis 服务器的性能下降,甚至可能导致 Redis 服务不可用。热key 的大小是相对的,通常来说,以下几个因素可能导致一个 Redis 键成为热key: 访问频率…...
机器学习数学基础:43.外生变量与内生变量
外生变量与内生变量:模型中的因果角色 在因果模型(像结构方程模型、回归分析这类)里,外生变量和内生变量是用来区分变量来源和相互关系的重要概念。下面从定义、实例、差异以及应用场景四个方面来详细介绍: 一、定义…...
单元测试与仿真程序之间的选择
为什么写这篇文章 现在的工作需求,让我有必要总结和整理一下。 凡事都有适用的场景。首先这里我需要提示一下,这里的信息,可能并不普适。 但是可以肯定一点的是,有些人,不论做事还是写书,上下文还没有交待…...
一周学会Flask3 Python Web开发-SQLAlchemy简介及安装
锋哥原创的Flask3 Python Web开发 Flask3视频教程: 2025版 Flask3 Python web开发 视频教程(无废话版) 玩命更新中~_哔哩哔哩_bilibili SQLAlchemy是Python编程语言下的一款开源软件。提供了SQL工具包及对象关系映射(ORM)工具,…...
【玩转正则表达式】正则表达式常用语法汇总
1. 基本字符 普通字符:匹配自身。例如,正则表达式hello匹配字符串中的“hello”。\d:匹配任何数字字符,相当于[0-9]。例如,\d\d\d匹配三个连续的数字。 示例:123、456 \w:匹配任何字母数字字符…...
django中序列化器serializer 的高级使用和需要注意的点
在 Django REST framework(DRF)中,序列化器(Serializer)是一个强大的工具,用于将复杂的数据类型(如 Django 模型实例)转换为 Python 原生数据类型,以便将其渲染为 JSON、XML 等格式,同时也能将接收到的外部数据反序列化为 Django 模型实例。以下将介绍序列化器的高级…...
如何下载安装 PyCharm?
李升伟 整理 一、下载 PyCharm 访问官网 打开 PyCharm 官网,点击 "Download" 按钮25。 版本选择: 社区版(Community):免费使用,适合个人学习和基础开发。 专业版(Professional&#…...
URL中的特殊字符与web安全
在现代Web应用中,URL作为客户端与服务器之间的通信桥梁,承载着大量的重要信息。URL中的特殊字符,看似只是一些常见的符号,但在Web安全领域,它们与其他安全知识密切相关,如在Base64编码、SQL注入,…...
Golang学习笔记_41——观察者模式
Golang学习笔记_38——享元模式 Golang学习笔记_39——策略模式 Golang学习笔记_40——模版方法模式 文章目录 一、核心概念1. 定义2. 解决的问题3. 核心角色4. 类图 二、特点分析三、适用场景1. 股票价格监控系统2. 物联网设备状态监控3. 电商订单状态通知 四、Go语言实现示例…...
中原银行:从“小机+传统数据库”升级为“OceanBase+通用服务器”,30 +系统成功上线|OceanBase DB大咖说(十五)
OceanBase《DB 大咖说》第 15 期,我们邀请到了中原银行金融科技部数据团队负责人,吕春雷。本文为本期大咖说的精选。 吕春雷是一位资历深厚的数据库专家,从传统制造企业、IT企业、甲骨文公司到中原银行,他在数据库技术与运维管理…...
slam学习笔记9---ubuntu2004部署interactive_slam踩坑记录
背景:interactive_slam是一款可用于离线优化点云地图算法。部署安装容易出问题,这里记录一下。 一、安装基本流程 绝大部分跟着readme走,g2o安装使用apt安装 interactive_slam depends on the following libraries:GL3W GLFW Dear ImGui p…...
MVC模式全解析
MVC 模式:概念与架构基石 在软件开发的广袤宇宙中,MVC 模式宛如一颗璀璨的恒星,照亮了无数开发者前行的道路。它是一种经典的软件架构模式,全称为 Model - View - Controller,即模型 - 视图 - 控制器 ,将应…...
游戏引擎学习第140天
回顾并为今天的内容做准备 目前代码的进展到了声音混音的部分。昨天我详细解释了声音的处理方式,声音在技术上是一个非常特别的存在,但在游戏中进行声音混音的需求其实相对简单明了,所以今天的任务应该不会太具挑战性。 今天我们会编写一个…...
LeetCode热题100JS(44/100)第八天|二叉树的直径|二叉树的层序遍历|将有序数组转换为二叉搜索树|验证二叉树搜索树|二叉搜索树中第K小的元素
543. 二叉树的直径 题目链接:543. 二叉树的直径 难度:简单 刷题状态:1刷 新知识: 解题过程 思考 示例 1: 输入:root [1,2,3,4,5] 输出:3 解释:3 ,取路径 [4,2,1,3] 或…...
【虚拟化】Hyper-V 与 WSL 2
关于 Hyper-V 与 WSL 2 的简介 Hyper-V 是微软出的 Type-I 型 Hypervisor,根据微软官方说 WSL 2 用了 Hyper-V 架构的子集,称为虚拟机平台(Virtual Machine Platform),是 Windows 中的一个可选组件,所以你…...
力扣刷题DAY6(滑动窗口/中等+栈/简单、中等)
一、滑动窗口 找到字符串中所有字母异位词 方法一:哈希表 class Solution { public:vector<int> findAnagrams(string s, string p) {vector<int> ans;unordered_map<char, int> target;for (int i 0; i < p.size(); i) {target[p[i]];}in…...
MySQL中的共享锁和排他锁
MySQL 中的锁可以从多个维度进行分类,其中从模式上可以分为共享锁(Shared Lock,S Lock)和 排他锁(Exclusive Lock,X Lock)。 共享锁(Shared Lock,S Lock) 共…...
HarmonyOS ArkTS声明式UI开发实战教程
引言:为何选择ArkTS? 在HarmonyOS生态快速发展的当下,ArkTS作为新一代声明式UI开发框架,正在引发移动应用开发范式的变革。笔者曾在多个跨平台框架开发中经历过"命令式编程之痛",直到接触ArkTS后才发现&…...
