【AI】小白入门笔记
前言
2024年,愿新年胜旧年!作为AI世界的小白,今天先来从一些概念讲起,希望路过的朋友们多多指教!
正文
AI (人工智能)
提起AI, 大家可能会想起各种机器人,移动手机的“Siri”,"小爱同学", 是语音助手机器人,阿尔法围棋(AlphaGo)是 击败了围棋世界冠军的AI机器人,除此之外,自动驾驶,人脸识别,智能客服,智能家居,物流AGV小车,搜索引擎推送内容和广告,淘宝的以图搜图,美颜相机,ocr文本识别等都是AI的应用场景。
AI (Artificial Intelligence) , AI 即人工智能,让机器的行为看起来就像是人所表现出的智能行为一样,能听懂人类的语音,看懂人类的文字,知道人类的偏好,认识人类世界的生物(猫猫狗狗等),表现出学习、交流、感知、推理、使用工具等和人类一样的能力;再来看官网解释:机器人工智能是指使计算机系统或机器具备像人类一样的智能和能力,能够通过模拟和实现人类智能的各个方面,以改善生活、提高效率和解决复杂的问题。通常分为弱人工智能和强人工智能,弱人工智能专注于特定任务或领域,被用于执行特定的任务,如语音识别、图像分类、自然语言处理等;强人工智能就可以像人类一样具备自主学习、推理、解决问题和创造的能力。我们现在实现的人工智能技术主要是弱人工智能。
人工智能是计算机科学领域的一个分支,研究的领域包括机器学习、深度学习、自然语言处理、计算机视觉、推荐系统等,智能体现在机器可以从经验中学习,适应新的输入完成任务,人工智能的应用以我粗浅的认知认为是通过输入已有内容得到模型,这个模型就是超能力(类似外星人的大脑),可以去预测或判断未知的事情,我们的学习也是在总结规律,人工智能的这个找规律的过程和规律很高级!
机器学习(ML-Machine Learning)
机器学习是一种实现人工智能的方法,可以类比于人类学习知识的过程,我们人类想要获得知识,先对资料进行学习,对经验进行归纳总结得出规律,当出现未知问题时会用已知规律进行推测,机器学习的过程与人类学习的过程相似,也是预先对大量的学习资料进行学习来得到模型,这个根据数据得到模型的过程称作训练,当有了新的场景需要应用知识时,通过模型对新的场景进行判断,输出结果,从而实现对新场景进行预测的功能。
根据学习的方式可以把机器学习主要分为四类:有监督学习、无监督学习、半监督学习和强化学习。
有监督学习
机器会给出数据输入和答案,通过示例进行学习,会给出输入和输出数据对,输入为数据,输出被标记为正确答案,表现为通过带有标签的数据进行训练得到模型,输入一张猫的图片,我们人类知道图片 上是只猫,但是机器不知道,需要打标签告诉机器这是猫, 相当于给出机器预期的正确答案。
学习过程:输入一张橘猫的图片,打标签为猫,再输入一张布偶猫的图片,打标签为猫,再输入一张狸花猫的图片,打标签为猫,通过一些标签为猫的图片输入数据,机器可根据数据的相似性、差异点等特征进行学习(训练)得到一个模型,拥有了认识猫的能力,再输入一张野猫的图片,模型可以给出结论判断野猫图片是猫。
有监督学习主要用于处理回归和分类的任务。
分类:通过一组离散型数据,预测某一样本所属的类型,输出的值是定性的,比如判断性别、是否健康等,分类的结果只有正确或错误,使用正确率作为评价指标。
回归:通过一组连续型数据,预测某一样本可能的值,输出的值是定量的,比如通过过去一周的天气温度,预测明天的温度,是一个范围值,通过这个预测值和真实值之间的误差,进行回归性的分析,如果误差较小,认为是一个好的回归。
无监督学习
对比有监督学习,无监督学习只有输入的数据,没有答案(标签),让机器(算法)自己从数据中发现特征总结规律得到标签,用上面猫的一些图片作为输入,举例机器可能会总结到猫的特征:两只尖耳朵、四条腿、一条尾巴、有胡须、小鼻子等等,学习得到一个模型,再给这个模型输入一个野猫的图片,模型判断同样有两只尖耳朵、四条腿、一条尾巴、有胡须、小鼻子的特征,会给出一个结论,这张图片的内容和之前输入的图片相似度很高,可能属于一类。
无监督学习主要用于处理聚类的任务。
聚类:将一堆数据进行处理,根据数据之间的相似性进行分类。
半监督学习
通过少量的有标签数据和大量的无标签数据进行训练得到模型,减少数据人工标注标签的成本,同时利用无标签的数据尝试提高模型的性能和泛化能力(模型预测新样本值的能力)。
强化学习
为机器的学习过程建立一组奖惩机制,机器会在一些可能性行动下采取动作,每一个动作的执行会有相应的得分,机器通过反复实验得到不同的反馈,最终得到一个总得分,目标是获得最大化奖励。就比如做一件好事会加10分,做一件坏事会扣10分,在机器反复尝试中发现只有不断的做好事才能获得最高分,由此得出一个模型,这个模型的能力是会做好事。
机器学习的过程
准备数据
这时的数据也叫做数据集,可以是带标签的,也可以是不带标签的,用来给算法找特征作进一步判断的 ,数据集一般根据用途分为训练集、验证集和测试集。
训练模型
根据数据集做有限次的试错和优化来构建模型的过程,简单举例: 给定一个输入x和一个输出y, 目标是构建一种函数关系使y = f(x) 通过不断尝试调整x和y之间的参数,使数据集中的x们尽可能贴近输出的y们,模型训练的过程很复杂,训练的输出是模型,也就是x和y之间的映射关系。
验证模型
训练得到初始模型,验证模型使用验证数据集用来评价模型的性能,同时根据模型的性能进行反复模型参数调整和再次验证,直到模型在验证数据集上表现良好。
测试模型
使用测试数据集检测验证后的模型的表现
使用模型
使用训练好的模型在新数据上做预测 ,个人觉得这个过程叫做推理(inference)
调优模型
使用更多数据,不同的特征或调整过的参数来提升模型的性能表现
补充:模型评估:评价模型性能的方法,用于训练、验证、测试的阶段,评估指标有准确率,召回率,精确率等,通常是分类模型的评估指标。
深度学习(DL-Deep Learning)
深度学习是机器学习的一种方法, 目的建立、模拟人脑进行分析学习的神经网络,模仿人脑的机制来解释数据,属于无监督学习。深度学习是为了让机器自己获得学习能力,能够解决某些场景下复杂的难题。
自然语言处理(NLP-Natural Language Processing)
自然语言处理是人工智能的一个研究领域,是一种机器学习技术,使计算机能够解读、处理和理解人类语言。自然语言是指人类之间的交流语言,ChatGPT(Chat Generative Pre-trained Transformer) 就是NLP的一个应用,它是一个预先训练好的NLP模型,可以进行文本生成,比如回答问题,与人对话等。
人工智能、机器学习、深度学习、自然语言处理的关系
小结
小白同学持续学习中,如有表达不合适或有误的地方,还请路过的伙伴们及时指出~
相关文章:

【AI】小白入门笔记
前言 2024年,愿新年胜旧年!作为AI世界的小白,今天先来从一些概念讲起,希望路过的朋友们多多指教! 正文 AI (人工智能) 提起AI, 大家可能会想起各种机器人,移动手机的“Siri”,"小爱同学", 是语…...

GPT应用开发:编写插件获取实时天气信息
欢迎阅读本系列文章!我将带你一起探索如何利用OpenAI API开发GPT应用。无论你是编程新手还是资深开发者,都能在这里获得灵感和收获。 本文,我们将继续展示聊天API中插件的使用方法,让你能够轻松驾驭这个强大的工具。 插件运行效…...

揭开Spring MVC的真面目
官方对于Spring MVC的描述为: Spring Web MVC是基于Servlet API框架构建的原始Web框架,从一开始就包含在Spring框架中。它的正式名称“Spring Web MVC”来自其源模块的名称(Spring-webmvc),但它通常被称为“Spring-MVC…...

AI大模型开发架构设计(3)——如何打造自己的大模型
文章目录 如何打造自己的大模型1 新时代职场人应用AIGC的5重境界2 人人需要掌握的大模型原理职场人都能听懂的大语音模型的训练过程职场人都能听得懂的大语言模型的Transformer推理过程 3 如何构建自己的大模型需要具备三个方面的能力LangChain是什么?LangChain主要…...
Linux C语言开发(三)运算符和表达式
目录 一.什么是运算符 二.什么是表达式 一.什么是运算符 在C语言中,运算符是用于执行特定操作的符号。这些操作可以涉及一个或多个值(称为操作数),并产生一个新的值或效果。C语言提供了多种类型的运算符,用于执行算术、比较、逻辑和其他类型的操作。 以下是C语言中常见的…...

Spring-AOP入门案例
文章目录 Spring-AOP入门案例概念:通知(Advice)切入点(Pointcut )切面(Aspect) 目标对象(target)代理对象(Proxy)顾问(Advisor)连接点(JoinPoint) 简单需求:在接口执行前输出当前系统时间Demo原始未添加aop前1 项目包结构2 创建相…...

中仕教育:国考调剂和补录的区别是什么?
国考笔试成绩和进面名单公布之后,考生们就需要关注调剂和补录了,针对二者之间的区别很多考生不太了解,本文为大家解答一下关于国考调剂和补录的区别。 1.补录 补录是在公式环节之后进行的,主要原因是经过面试、体检和考察&#…...

ESP32-TCP服务端(Arduino)
将ESP32设置为TCP服务器 介绍 TCP(Transmission Control Protocol)传输控制协议,是一种面向连接的(一个客户端对应一个服务端)、可靠的传输层协议。在TCP的工作原理中,它会将消息或文件分解为更小的片段&a…...

HCIA-HarmonyOS设备开发认证-序
序 最近涉及到HarmonyOS鸿蒙系统设备开发,在网络上已经有很多相关资料,视频教程,我也移植了公司的一个stm32G474板卡,运行LiteOS-m L0系统。 一面看资料一面移植,遇到不少坑,当看到运行的LOGO时࿰…...

Med-YOLO:3D + 医学影像 + 检测框架
Med-YOLO:3D 医学影像 检测框架 提出背景设计思路网络设计训练设计讨论分析 魔改代码:加强小目标检测总结 提出背景 论文链接:https://arxiv.org/abs/2312.07729 代码链接:https://github.com/JDSobek/MedYOLO 提出背景&…...
Docker部署Golang服务
不管是开发还是生产环境,通过 docker 方式部署服务都是一种不错的选择,能够解决不同开发环境一致性的问题。 本文以项目:https://github.com/johncxf/go-api 为例。 Dockerfile 构建 Go 运用环境 在项目根目录下添加 Dockerfile 文件&…...

C#,字符串匹配(模式搜索)Sunday算法的源代码
Sunday算法是Daniel M.Sunday于1990年提出的一种字符串模式匹配算法。 核心思想:在匹配过程中,模式串并不被要求一定要按从左向右进行比较还是从右向左进行比较,它在发现不匹配时,算法能跳过尽可能多的字符以进行下一步的匹配&…...

makefile 编译动态链接库使用(.so库文件)
makefile 编译动态链接库使用(.so库文件) 动态链接库:不会把代码编译到二进制文件中,而是在运行时才去加载, 好处是程序可以和库文件分离,可以分别发版,然后库文件可以被多处共享 动态链接库 动态&#…...
Hive 数仓及数仓设计方案
数仓(Data Warehouse) 数据仓库存在的意义在于对企业的所有数据进行汇总,为企业各个部门提供一个统一、规范的出口。做数仓就是做方案,是用数据治理企业的方案。 数据仓库的特点 面向主题集成 公司中不同的部门都会去数据仓库中拿数据,把独…...

Ubuntu使用docker-compose安装redis
ubuntu环境搭建专栏🔗点击跳转 Ubuntu系统环境搭建(十三)——使用docker-compose安装redis 文章目录 Ubuntu系统环境搭建(十三)——使用docker-compose安装redis1.搭建文件夹2.docker-compose.yaml配置文件3.redis.co…...

大数据安全 | 期末复习(上)| 补档
文章目录 📚概述⭐️🐇大数据的定义、来源、特点🐇大数据安全的含义🐇大数据安全威胁🐇保障大数据安全🐇采集、存储、挖掘环节的安全技术🐇大数据用于安全🐇隐私的定义、属性、分类、…...

Kylin 安装novnc 远程访问
noVNC可以使用浏览器直接访问服务器,而不需要使用VNC客户端。 1.初始环境 关闭防火墙或允许IP访问本机 2.安装依赖 dnf install -y tigervnc-server git 3.git下载novnc git clone https://github.com/novnc/noVNC.git git clone https://gitee.com/yangyizhao…...

神经网络算法与逻辑回归:优势与差异
神经网络算法和逻辑回归都是预测模型中的重要工具,但它们在处理复杂和非线性问题时表现出不同的性能。本文将深入探讨神经网络算法相对于逻辑回归的优势,以及它们在不同场景下的适用性。 一、引言 神经网络算法和逻辑回归都是预测模型中的重要工具&…...

【蓝桥杯冲冲冲】动态规划初步[USACO2006 OPEN] 县集市
蓝桥杯备赛 | 洛谷做题打卡day13 文章目录 蓝桥杯备赛 | 洛谷做题打卡day13题目描述输入格式输出格式样例 #1样例输入 #1样例输出 #1 提示样例说明数据规模与约定 思路:方程: 题解代码我的一些话 [USACO2006 OPEN] 县集市 The County Fair 题目描述 每年…...

C#,入门教程(30)——扎好程序的笼子,错误处理 try catch
上一篇: C#,入门教程(29)——修饰词静态(static)的用法详解https://blog.csdn.net/beijinghorn/article/details/124683349 程序员语录:凡程序必有错,凡有错未必改! 程序出错的原因千千万&…...

《Qt C++ 与 OpenCV:解锁视频播放程序设计的奥秘》
引言:探索视频播放程序设计之旅 在当今数字化时代,多媒体应用已渗透到我们生活的方方面面,从日常的视频娱乐到专业的视频监控、视频会议系统,视频播放程序作为多媒体应用的核心组成部分,扮演着至关重要的角色。无论是在个人电脑、移动设备还是智能电视等平台上,用户都期望…...
uni-app学习笔记二十二---使用vite.config.js全局导入常用依赖
在前面的练习中,每个页面需要使用ref,onShow等生命周期钩子函数时都需要像下面这样导入 import {onMounted, ref} from "vue" 如果不想每个页面都导入,需要使用node.js命令npm安装unplugin-auto-import npm install unplugin-au…...

什么是Ansible Jinja2
理解 Ansible Jinja2 模板 Ansible 是一款功能强大的开源自动化工具,可让您无缝地管理和配置系统。Ansible 的一大亮点是它使用 Jinja2 模板,允许您根据变量数据动态生成文件、配置设置和脚本。本文将向您介绍 Ansible 中的 Jinja2 模板,并通…...

零基础在实践中学习网络安全-皮卡丘靶场(第九期-Unsafe Fileupload模块)(yakit方式)
本期内容并不是很难,相信大家会学的很愉快,当然对于有后端基础的朋友来说,本期内容更加容易了解,当然没有基础的也别担心,本期内容会详细解释有关内容 本期用到的软件:yakit(因为经过之前好多期…...

浪潮交换机配置track检测实现高速公路收费网络主备切换NQA
浪潮交换机track配置 项目背景高速网络拓扑网络情况分析通信线路收费网络路由 收费汇聚交换机相应配置收费汇聚track配置 项目背景 在实施省内一条高速公路时遇到的需求,本次涉及的主要是收费汇聚交换机的配置,浪潮网络设备在高速项目很少,通…...

解读《网络安全法》最新修订,把握网络安全新趋势
《网络安全法》自2017年施行以来,在维护网络空间安全方面发挥了重要作用。但随着网络环境的日益复杂,网络攻击、数据泄露等事件频发,现行法律已难以完全适应新的风险挑战。 2025年3月28日,国家网信办会同相关部门起草了《网络安全…...

【深度学习新浪潮】什么是credit assignment problem?
Credit Assignment Problem(信用分配问题) 是机器学习,尤其是强化学习(RL)中的核心挑战之一,指的是如何将最终的奖励或惩罚准确地分配给导致该结果的各个中间动作或决策。在序列决策任务中,智能体执行一系列动作后获得一个最终奖励,但每个动作对最终结果的贡献程度往往…...
Linux安全加固:从攻防视角构建系统免疫
Linux安全加固:从攻防视角构建系统免疫 构建坚不可摧的数字堡垒 引言:攻防对抗的新纪元 在日益复杂的网络威胁环境中,Linux系统安全已从被动防御转向主动免疫。2023年全球网络安全报告显示,高级持续性威胁(APT)攻击同比增长65%,平均入侵停留时间缩短至48小时。本章将从…...

UE5 音效系统
一.音效管理 音乐一般都是WAV,创建一个背景音乐类SoudClass,一个音效类SoundClass。所有的音乐都分为这两个类。再创建一个总音乐类,将上述两个作为它的子类。 接着我们创建一个音乐混合类SoundMix,将上述三个类翻入其中,通过它管理每个音乐…...
【深尚想】TPS54618CQRTERQ1汽车级同步降压转换器电源芯片全面解析
1. 元器件定义与技术特点 TPS54618CQRTERQ1 是德州仪器(TI)推出的一款 汽车级同步降压转换器(DC-DC开关稳压器),属于高性能电源管理芯片。核心特性包括: 输入电压范围:2.95V–6V,输…...