机器学习扫盲系列(1) - 序
文章目录
- 序
- 为什么要写这一系列?
- AI 概念科普
- 原理性思维
- 转行
- 立flag
- 这一系列的计划
- 神经网络
- 训练框架
序
为什么要写这一系列?
AI 概念科普
在各种AI概念铺天盖地向我们袭来的今天,我们作为其他方向的工作者,如果想转行做深度学习/模型训练算法工程师的难度很大,基本是不太可能,但是能够理解AI中的一些基本概念,如正向传播、反向传播、卷积、Transformer、Attention等,对我们本身的工作和思维的锻炼也是很有帮助的,也能让我们顺着AI大潮一起前进,不至于完全脱节。
另一方面,笔者自己作为平台开发者,从一开始学习神经网络时也遇到入门较困难的问题,希望这一系列能从一名普通平台开发者的角度带大家了解AI相关的概念。
原理性思维
随着技术迭代越来越快,软件系统的复杂度越来越高,我们所面对的场景也越来越多,各种工具应用层出不穷,各种AI概念方法也是扑面而来,对开发者来说,学习的速度似乎永远跟不上知识爆炸的速度,那怎么办?
其实,如果能够意识到,原理性知识是可控的这一点,我们就不必慌张。也就是说,掌握知识背后的原理可以大幅度降低我们对于知识的记忆量,知识量是爆炸的,但是原理绝对是可控的!
对于AI概念也是一样,虽然现在各种神经网络结构和训练方法层出不穷,但绝对离不开很久之前一些原理性的工作,比如卷积神经网络其实本质也是从图像处理发展而来,如果你了解视频图像的压缩方法,其实也不难理解卷积。
转行
作为一个已经有过多年平台开发经验的开发者,现在转行去做模型训练算法工程师的难度很大,但是否有其他相关方向值得我们探索或者转行呢?笔者认为,跟我们工程开发最相关的AI 方向有两个,一个是模型训练与推理的优化,另一个是AI Agent的开发。这两者其实都依赖于本系列所要向大家展示的AI基础概念。
立flag
作为普通的平台开发者,可能会担心被汹涌的AI浪潮席卷,所以也希望通过这一系列大家一起交流想法,立个持续更新的flag,欢迎评论,请轻喷。
这一系列的计划
这一系列希望能从以下两方面带大家熟悉 AI 相关的概念。两者没有先后顺序,互为补充。
神经网络
- 基础知识入门,包括链式法则、反向传播等基础的神经网络概念
- 经典网络介绍,包括rnn、cnn等
- 大模型概念介绍,包括 Transformer、Attention机制等
训练框架
- pytorch的基本功能,用法,原理等, 可能穿插cuda算子开发的相关内容
- mmengine训练框架的基本功能,用法,原理等
相关文章:
机器学习扫盲系列(1) - 序
文章目录 序为什么要写这一系列?AI 概念科普原理性思维转行立flag 这一系列的计划神经网络训练框架 序 为什么要写这一系列? AI 概念科普 在各种AI概念铺天盖地向我们袭来的今天,我们作为其他方向的工作者,如果想转行做深度学习…...
英伟达“AI 超级碗”开幕
Nvidia的AI和机器人技术进展 2025年03月19日 | AI日报  欢迎各位人工智能爱好者。 Nvidia的CEO Jensen Huang刚刚拉开了他的“AI超级碗”,并发表了关于该公司最新芯片、…...
DeepSeek扫盲篇: V3 vs R1全面对比架构差异与蒸馏模型演进史
I. 引言:DeepSeek系列的技术革命 在全球大模型军备竞赛白热化的2023年,DeepSeek系列通过V3与R1两款里程碑产品,构建了中文大模型领域的"双塔奇观"。这两个看似矛盾的版本——前者以1280亿参数的MoE架构突破算力边界,后…...
UE5材质法线强度控制节点FlattenNormal
连法 FlattenNormal内部是这样的 FlattenNormal的作用是用来调整法线强度 连上FlattenNormal后 拉高数值...
【一起来学kubernetes】19、Pod使用详解
Kubernetes 中的 Pod 是最小的可调度和可管理单元,也是容器化应用的载体。Pod 封装了一个或多个紧密关联的容器,共享网络、存储和生命周期。 一、Pod 的核心概念 定义 Pod是Kubernetes中最小的部署单元,可以包含一个或多个容器。这些容器紧…...
第2章:容器核心原理:深入理解Namespace、Cgroup与联合文件系统
第2章:容器核心原理:深入理解Namespace、Cgroup与联合文件系统 作者:DogDog_Shuai 阅读时间:约20分钟 难度:中级 目录 1. 引言2. Linux容器核心技术3. Namespace详解4. Cgroup详解5. 联合文件系统6. 容器运行时原理...
计算机网络基础:认识网络硬件与传输介质
计算机网络基础:认识网络硬件与传输介质 一、前言二、网络硬件设备2.1 路由器2.1.1 路由器的基本概念与功能2.1.2 路由器的工作原理2.1.3 路由器的类型与应用场景 2.2 交换机2.2.1 交换机的基本概念与功能2.2.2 交换机的工作原理2.2.3 交换机的类型与应用场景 2.3 服…...
Android audio(8)-native音频服务的启动与协作(audiopolicyservice和audioflinger)
音频策略的构建 1、概述 2、AudiopolicyService 2.1 任务 2.2 启动流程 2.2.1 加载audio_policy.conf(xml)配置文件 2.2.2 初始化各种音频流对应的音量调节点 2.2.3 加载audio policy硬件抽象库 2.2.4设置输出设备 ps:audiopatch流程简介 2.2.5打开输出设…...
法兰克仿真软件FANUC CNC Guide v25.0 安装教程及中文设置
前言 下载地址在文末。 我们公司用新到一批FANUC 系统的设备,为方便使用就装了一个 FANUC 数控系统仿真软件FANUC CNC Guide v25.0 ,还是最新版不是市面上流传的老版本。模拟学习一下。 安装操作 安装环境:Windows 11 专业版 24H2 安装程…...
事务隔离级别是?
事务隔离级别是数据库管理系统用来控制多个事务并发执行时对数据的可见性和一致性的机制。MySQL支持四种标准的事务隔离级别,它们定义了事务如何与其他并发事务交互。 四种事务隔离级别: READ UNCOMMITTED(读未提交) READ COMMIT…...
[JavaScript]如何利用作用域块避免闭包内存泄漏?
出自《你不知道的JavaScript》上卷 以下是本书给出的反例: function process (data) {...} var bigdata{...} process(bigdata); var btn document.getElementById(x); btn.addEventListener(click, function click{...});click会被回调在其他位置, 在addEventListener函数内…...
基于Selenium Grid的分布式测试架构设计与深度实践
一、引言:分布式测试的必然性与挑战 在数字化转型浪潮中,软件交付速度已成为企业竞争力的核心指标。敏捷开发、DevOps和持续交付(CI/CD)的普及,使得传统测试方法面临前所未有的挑战。单机测试模式在应对以下场景时显得…...
JavaScript 金额运算精度丢失问题及解决方案
JavaScript 金额运算精度丢失问题及解决方案 1. 前言2. 为什么 JavaScript 计算金额会精度丢失?2.1 JavaScript 使用 IEEE 754 双精度浮点数2.2 浮点运算错误示例**错误示例 1:0.1 0.2 ≠ 0.3****错误示例 2:浮点乘法精度问题** 3. 解决方案…...
【Python】使用ImageEnhance提升图片画质
使用ImageEnhance提升图片画质 from PIL import Image, ImageEnhance import ioimage_path "PhoneImg_20250319_160023607949_01.png"def enhance_image_quality(image_path):"""使用双三次插值算法提升画质"""with Image.open(imag…...
vector容器以及deque
vector 一.vector容器简介二.vector的默认构造1. 语法和功能2.vector带参数的构造3.vector的赋值4.vector的大小5.vector数值操作 deque简介: 一.vector容器简介 • vector是将元素置于一个动态数组中加以管理的容器。 std::vector 是 C 标准模板库(STL…...
jmeter中,上传文件的MIME类型
text/plain:用于纯文本文件,如.txt文件。 text/html:用于HTML文档,即.html文件。 application/msword:Microsoft Word文档,即.doc和.docx文件。 image/jpeg:JPEG图像&#x…...
《心理学与生活》2025最新网课答案
《心理学与生活》2025最新网课答案 文章目录 《心理学与生活》2025最新网课答案发展与教育单元测试情绪与情感单元测验人格与动机单元测试感知与记忆单元测试文化与社会单元测试 发展与教育单元测试 题数 20 棉花糖实验中哪些小孩长大后的表现更好()。 …...
Java SE 面经
1、Java 语言有哪些特点 Java 语言的特点有: ①、面向对象。主要是:封装,继承,多态。 ②、平台无关性。一次编写,到处运行,因此采用 Java 语言编写的程序具有很好的可移植性。 ③、支持多线程。C 语言没…...
关于redis中的分布式锁
目录 分布式锁的基础实现 引入过期时间 引入校验id 引入lua脚本 引入看门狗 redlock算法 分布式锁的基础实现 多个线程并发执行的时候,执行的先后顺序是不确定的,需要保证程序在任意执行顺序下,执行逻辑都是ok的。 在分布式系统中&am…...
SQL Server数据库慢SQL调优
SQL Server中慢SQL会显著降低系统性能并引发级联效应。首先,用户直接体验响应时间延长,核心业务操作(如交易处理、报表生成)效率下降,导致客户满意度降低甚至业务中断。其次,资源利用率失衡,CPU…...
【css酷炫效果】实现鱼群游动动态效果
【css酷炫效果】实现小鱼游动动态效果 缘创作背景css代码创建div容器引入jquery引入鱼群js完整代码效果图成品资源下载链接:点击下载 缘 在开发系统功能的时候,无意间看到了小鱼游动特效,感觉很有意思,就在网上找了相关教程,分享给大家。 创作背景 刚看到csdn出活动了…...
kubectl describe pod 命令以及输出详情讲解
kubectl describe pod 命令格式 kubectl describe pod <pod-name> -n <namespace><pod-name>:Pod 的名称。 -n <namespace>:指定命名空间,默认是当前命名空间。 controlplane ~ ✖ kubectl describe pod newpods-d…...
Python实战(2)-数据库支持
使用简单的纯文本文件可实现的功能有限。诚然,使用它们可做很多事情,但有时可能还需要额外的功能。你可能希望能够自动完成序列化,此时可求助于shelve和pickle(类似于shelve)。不过你可能需要比这更强大的功能。例如…...
Java面试黄金宝典4
1. 什么是泛型 ?与 T 的区别 原理 泛型是 Java 编程语言中的一个强大特性,它提供了编译时类型安全检查机制,允许在定义类、接口和方法时使用类型参数。这些类型参数在使用时会被具体的类型所替代,从而实现代码的复用和类型安全。泛…...
从 Snowflake 到 Databend Cloud:全球游戏平台借助 Databend 实现实时数据处理
导读:某全球游戏平台为全球数百万玩家提供实时的技能型游戏体验与无缝的实时互动。对该游戏平台而言,保持数据的实时更新和实时分析,对提升玩家互动和留存率至关重要。他们在使用 Snowflake 进行实时数据摄取和分析时遇到了重大挑战ÿ…...
Docker搭建MySQL主从服务器
一、在主机上创建MySQL配置文件——my.cnf master服务器配置文件路径:/data/docker/containers/mysql-cluster-master/conf.d/my.cnf slave服务器配置文件路径: /data/docker/containers/mysql-cluster-master/conf.d/my.cnf master服务配置文件内容 …...
点击劫持详细透析
点击劫持(Clickjacking)是一种前端安全攻击手段,攻击者通过视觉欺骗诱导用户在不知情的情况下点击隐藏的页面元素,从而执行非预期的操作。以下是攻击过程的详细说明: 攻击过程步骤 攻击者构造恶意页面 创建一个恶意网页…...
C语言每日一练——day_12(最后一天)
引言 针对初学者,每日练习几个题,快速上手C语言。第十二天。(最后一天,完结散花啦) 采用在线OJ的形式 什么是在线OJ? 在线判题系统(英语:Online Judge,缩写OJ࿰…...
10、STL中的unordered_map使用方法
一、了解 1、unordered_map(哈希) unordered_map是借用哈希表实现的关联容器。 访问键值对O(1),最坏情况O(n),例如哈希冲突严重时。【n是一个哈希桶的元素数量】 unordered_map特性 键值对存储ÿ…...
本地部署deepseek-r1建立向量知识库和知识库检索实践【代码】
目录 一、本地部署DS 二、建立本地知识库 1.安装python和必要的库 2.设置主目录工作区 3.编写文档解析脚本 4.构建向量数据库 三、基于DS,使用本地知识库检索 本地部署DS,其实非常简单,我写了一篇操作记录,我终于本地部署了DeepSeek-R1(图文全过程)-CSDN博客 安装…...
