当前位置: 首页 > news >正文

【AI】小白入门笔记

前言

    2024年,愿新年胜旧年!作为AI世界的小白,今天先来从一些概念讲起,希望路过的朋友们多多指教!

正文

AI (人工智能)

    提起AI, 大家可能会想起各种机器人,移动手机的“Siri”,"小爱同学", 是语音助手机器人,阿尔法围棋(AlphaGo)是 击败了围棋世界冠军的AI机器人,除此之外,自动驾驶,人脸识别,智能客服,智能家居,物流AGV小车,搜索引擎推送内容和广告,淘宝的以图搜图,美颜相机,ocr文本识别等都是AI的应用场景。

    AI (Artificial Intelligence) , AI 即人工智能,让机器的行为看起来就像是人所表现出的智能行为一样,能听懂人类的语音,看懂人类的文字,知道人类的偏好,认识人类世界的生物(猫猫狗狗等),表现出学习、交流、感知、推理、使用工具等和人类一样的能力;再来看官网解释:机器人工智能是指使计算机系统或机器具备像人类一样的智能和能力,能够通过模拟和实现人类智能的各个方面,以改善生活、提高效率和解决复杂的问题。通常分为弱人工智能和强人工智能,弱人工智能专注于特定任务或领域,被用于执行特定的任务,如语音识别、图像分类、自然语言处理等;强人工智能就可以像人类一样具备自主学习、推理、解决问题和创造的能力。我们现在实现的人工智能技术主要是弱人工智能。

    人工智能是计算机科学领域的一个分支,研究的领域包括机器学习、深度学习、自然语言处理、计算机视觉、推荐系统等,智能体现在机器可以从经验中学习,适应新的输入完成任务,人工智能的应用以我粗浅的认知认为是通过输入已有内容得到模型,这个模型就是超能力(类似外星人的大脑),可以去预测或判断未知的事情,我们的学习也是在总结规律,人工智能的这个找规律的过程和规律很高级!

机器学习(ML-Machine Learning)

    机器学习是一种实现人工智能的方法,可以类比于人类学习知识的过程,我们人类想要获得知识,先对资料进行学习,对经验进行归纳总结得出规律,当出现未知问题时会用已知规律进行推测,机器学习的过程与人类学习的过程相似,也是预先对大量的学习资料进行学习来得到模型,这个根据数据得到模型的过程称作训练,当有了新的场景需要应用知识时,通过模型对新的场景进行判断,输出结果,从而实现对新场景进行预测的功能。

    根据学习的方式可以把机器学习主要分为四类:有监督学习、无监督学习、半监督学习和强化学习。

有监督学习

    机器会给出数据输入和答案,通过示例进行学习,会给出输入和输出数据对,输入为数据,输出被标记为正确答案,表现为通过带有标签的数据进行训练得到模型,输入一张猫的图片,我们人类知道图片 上是只猫,但是机器不知道,需要打标签告诉机器这是猫, 相当于给出机器预期的正确答案。

    学习过程:输入一张橘猫的图片,打标签为猫,再输入一张布偶猫的图片,打标签为猫,再输入一张狸花猫的图片,打标签为猫,通过一些标签为猫的图片输入数据,机器可根据数据的相似性、差异点等特征进行学习(训练)得到一个模型,拥有了认识猫的能力,再输入一张野猫的图片,模型可以给出结论判断野猫图片是猫。

    有监督学习主要用于处理回归和分类的任务。

分类:通过一组离散型数据,预测某一样本所属的类型,输出的值是定性的,比如判断性别、是否健康等,分类的结果只有正确或错误,使用正确率作为评价指标。

回归:通过一组连续型数据,预测某一样本可能的值,输出的值是定量的,比如通过过去一周的天气温度,预测明天的温度,是一个范围值,通过这个预测值和真实值之间的误差,进行回归性的分析,如果误差较小,认为是一个好的回归。

无监督学习

    对比有监督学习,无监督学习只有输入的数据,没有答案(标签),让机器(算法)自己从数据中发现特征总结规律得到标签,用上面猫的一些图片作为输入,举例机器可能会总结到猫的特征:两只尖耳朵、四条腿、一条尾巴、有胡须、小鼻子等等,学习得到一个模型,再给这个模型输入一个野猫的图片,模型判断同样有两只尖耳朵、四条腿、一条尾巴、有胡须、小鼻子的特征,会给出一个结论,这张图片的内容和之前输入的图片相似度很高,可能属于一类。

    无监督学习主要用于处理聚类的任务。

聚类:将一堆数据进行处理,根据数据之间的相似性进行分类。

半监督学习

    通过少量的有标签数据和大量的无标签数据进行训练得到模型,减少数据人工标注标签的成本,同时利用无标签的数据尝试提高模型的性能和泛化能力(模型预测新样本值的能力)。

强化学习

    为机器的学习过程建立一组奖惩机制,机器会在一些可能性行动下采取动作,每一个动作的执行会有相应的得分,机器通过反复实验得到不同的反馈,最终得到一个总得分,目标是获得最大化奖励。就比如做一件好事会加10分,做一件坏事会扣10分,在机器反复尝试中发现只有不断的做好事才能获得最高分,由此得出一个模型,这个模型的能力是会做好事。

机器学习的过程

准备数据

     这时的数据也叫做数据集,可以是带标签的,也可以是不带标签的,用来给算法找特征作进一步判断的 ,数据集一般根据用途分为训练集、验证集和测试集。

训练模型

      根据数据集做有限次的试错和优化来构建模型的过程,简单举例: 给定一个输入x和一个输出y, 目标是构建一种函数关系使y = f(x) 通过不断尝试调整x和y之间的参数,使数据集中的x们尽可能贴近输出的y们,模型训练的过程很复杂,训练的输出是模型,也就是x和y之间的映射关系。

验证模型

     训练得到初始模型,验证模型使用验证数据集用来评价模型的性能,同时根据模型的性能进行反复模型参数调整和再次验证,直到模型在验证数据集上表现良好。

测试模型

     使用测试数据集检测验证后的模型的表现

使用模型

    使用训练好的模型在新数据上做预测 ,个人觉得这个过程叫做推理(inference)    

调优模型

      使用更多数据,不同的特征或调整过的参数来提升模型的性能表现

补充:模型评估:评价模型性能的方法,用于训练、验证、测试的阶段,评估指标有准确率,召回率,精确率等,通常是分类模型的评估指标。

深度学习(DL-Deep Learning)

    深度学习是机器学习的一种方法, 目的建立、模拟人脑进行分析学习的神经网络,模仿人脑的机制来解释数据,属于无监督学习。深度学习是为了让机器自己获得学习能力,能够解决某些场景下复杂的难题。

自然语言处理(NLP-Natural Language Processing)

    自然语言处理是人工智能的一个研究领域,是一种机器学习技术,使计算机能够解读、处理和理解人类语言。自然语言是指人类之间的交流语言,ChatGPT(Chat Generative Pre-trained Transformer) 就是NLP的一个应用,它是一个预先训练好的NLP模型,可以进行文本生成,比如回答问题,与人对话等。

人工智能、机器学习、深度学习、自然语言处理的关系

小结 

  小白同学持续学习中,如有表达不合适或有误的地方,还请路过的伙伴们及时指出~

相关文章:

【AI】小白入门笔记

前言 2024年,愿新年胜旧年!作为AI世界的小白,今天先来从一些概念讲起,希望路过的朋友们多多指教! 正文 AI (人工智能) 提起AI, 大家可能会想起各种机器人,移动手机的“Siri”,"小爱同学", 是语…...

GPT应用开发:编写插件获取实时天气信息

欢迎阅读本系列文章!我将带你一起探索如何利用OpenAI API开发GPT应用。无论你是编程新手还是资深开发者,都能在这里获得灵感和收获。 本文,我们将继续展示聊天API中插件的使用方法,让你能够轻松驾驭这个强大的工具。 插件运行效…...

揭开Spring MVC的真面目

官方对于Spring MVC的描述为: Spring Web MVC是基于Servlet API框架构建的原始Web框架,从一开始就包含在Spring框架中。它的正式名称“Spring Web MVC”来自其源模块的名称(Spring-webmvc),但它通常被称为“Spring-MVC…...

AI大模型开发架构设计(3)——如何打造自己的大模型

文章目录 如何打造自己的大模型1 新时代职场人应用AIGC的5重境界2 人人需要掌握的大模型原理职场人都能听懂的大语音模型的训练过程职场人都能听得懂的大语言模型的Transformer推理过程 3 如何构建自己的大模型需要具备三个方面的能力LangChain是什么?LangChain主要…...

Linux C语言开发(三)运算符和表达式

目录 一.什么是运算符 二.什么是表达式 一.什么是运算符 在C语言中,运算符是用于执行特定操作的符号。这些操作可以涉及一个或多个值(称为操作数),并产生一个新的值或效果。C语言提供了多种类型的运算符,用于执行算术、比较、逻辑和其他类型的操作。 以下是C语言中常见的…...

Spring-AOP入门案例

文章目录 Spring-AOP入门案例概念:通知(Advice)切入点(Pointcut )切面(Aspect) 目标对象(target)代理对象(Proxy)顾问(Advisor)连接点(JoinPoint) 简单需求:在接口执行前输出当前系统时间Demo原始未添加aop前1 项目包结构2 创建相…...

中仕教育:国考调剂和补录的区别是什么?

国考笔试成绩和进面名单公布之后,考生们就需要关注调剂和补录了,针对二者之间的区别很多考生不太了解,本文为大家解答一下关于国考调剂和补录的区别。 1.补录 补录是在公式环节之后进行的,主要原因是经过面试、体检和考察&#…...

ESP32-TCP服务端(Arduino)

将ESP32设置为TCP服务器 介绍 TCP(Transmission Control Protocol)传输控制协议,是一种面向连接的(一个客户端对应一个服务端)、可靠的传输层协议。在TCP的工作原理中,它会将消息或文件分解为更小的片段&a…...

HCIA-HarmonyOS设备开发认证-序

序 最近涉及到HarmonyOS鸿蒙系统设备开发,在网络上已经有很多相关资料,视频教程,我也移植了公司的一个stm32G474板卡,运行LiteOS-m L0系统。 一面看资料一面移植,遇到不少坑,当看到运行的LOGO时&#xff0…...

Med-YOLO:3D + 医学影像 + 检测框架

Med-YOLO:3D 医学影像 检测框架 提出背景设计思路网络设计训练设计讨论分析 魔改代码:加强小目标检测总结 提出背景 论文链接:https://arxiv.org/abs/2312.07729 代码链接:https://github.com/JDSobek/MedYOLO 提出背景&…...

Docker部署Golang服务

不管是开发还是生产环境,通过 docker 方式部署服务都是一种不错的选择,能够解决不同开发环境一致性的问题。 本文以项目:https://github.com/johncxf/go-api 为例。 Dockerfile 构建 Go 运用环境 在项目根目录下添加 Dockerfile 文件&…...

C#,字符串匹配(模式搜索)Sunday算法的源代码

Sunday算法是Daniel M.Sunday于1990年提出的一种字符串模式匹配算法。 核心思想:在匹配过程中,模式串并不被要求一定要按从左向右进行比较还是从右向左进行比较,它在发现不匹配时,算法能跳过尽可能多的字符以进行下一步的匹配&…...

makefile 编译动态链接库使用(.so库文件)

makefile 编译动态链接库使用(.so库文件) 动态链接库:不会把代码编译到二进制文件中,而是在运行时才去加载, 好处是程序可以和库文件分离,可以分别发版,然后库文件可以被多处共享 动态链接库 动态&#…...

Hive 数仓及数仓设计方案

数仓(Data Warehouse) 数据仓库存在的意义在于对企业的所有数据进行汇总,为企业各个部门提供一个统一、规范的出口。做数仓就是做方案,是用数据治理企业的方案。 数据仓库的特点 面向主题集成 公司中不同的部门都会去数据仓库中拿数据,把独…...

Ubuntu使用docker-compose安装redis

ubuntu环境搭建专栏🔗点击跳转 Ubuntu系统环境搭建(十三)——使用docker-compose安装redis 文章目录 Ubuntu系统环境搭建(十三)——使用docker-compose安装redis1.搭建文件夹2.docker-compose.yaml配置文件3.redis.co…...

大数据安全 | 期末复习(上)| 补档

文章目录 📚概述⭐️🐇大数据的定义、来源、特点🐇大数据安全的含义🐇大数据安全威胁🐇保障大数据安全🐇采集、存储、挖掘环节的安全技术🐇大数据用于安全🐇隐私的定义、属性、分类、…...

Kylin 安装novnc 远程访问

noVNC可以使用浏览器直接访问服务器,而不需要使用VNC客户端。 1.初始环境 关闭防火墙或允许IP访问本机 2.安装依赖 dnf install -y tigervnc-server git 3.git下载novnc git clone https://github.com/novnc/noVNC.git git clone https://gitee.com/yangyizhao…...

神经网络算法与逻辑回归:优势与差异

神经网络算法和逻辑回归都是预测模型中的重要工具,但它们在处理复杂和非线性问题时表现出不同的性能。本文将深入探讨神经网络算法相对于逻辑回归的优势,以及它们在不同场景下的适用性。 一、引言 神经网络算法和逻辑回归都是预测模型中的重要工具&…...

【蓝桥杯冲冲冲】动态规划初步[USACO2006 OPEN] 县集市

蓝桥杯备赛 | 洛谷做题打卡day13 文章目录 蓝桥杯备赛 | 洛谷做题打卡day13题目描述输入格式输出格式样例 #1样例输入 #1样例输出 #1 提示样例说明数据规模与约定 思路:方程: 题解代码我的一些话 [USACO2006 OPEN] 县集市 The County Fair 题目描述 每年…...

C#,入门教程(30)——扎好程序的笼子,错误处理 try catch

上一篇: C#,入门教程(29)——修饰词静态(static)的用法详解https://blog.csdn.net/beijinghorn/article/details/124683349 程序员语录:凡程序必有错,凡有错未必改! 程序出错的原因千千万&…...

操作教程|JumpServer堡垒机结合Ansible进行批量系统初始化

运维人员常常需要对资产进行系统初始化的操作,而初始化服务器又是一项繁琐的工作,需要花费运维人员大量的时间和精力。为了提高效率,许多组织会使用自动化工具和脚本来简化这些任务。自动化工具的运用可以大幅降低运维人员的工作量&#xff0…...

序列化VS反序列化

序列化、反序列化定义 如果我们需要持久化 Java 对象比如将 Java 对象保存在文件中,或者在网络传输 Java 对象,这些场景都需要用到序列化。 序列化(Serialization)是指将对象转换为字节序列的过程,也可以称之为对象的持…...

新数智空间:阿里云边缘云持续保持中国公有云市场第一

全球领先的 IT 市场研究和咨询公司 IDC 发布 《中国边缘云市场解读(2023H1)》报告 中国边缘公有云服务市场 阿里云持续第一 稳居市场第一,“边缘”逆势生长 近日,全球领先的 IT 市场研究和咨询公司 IDC 最新发布《中国边缘云市…...

【开源】基于JAVA语言的陕西非物质文化遗产网站

目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 设计目标2.2 研究内容2.3 研究方法与过程2.3.1 系统设计2.3.2 查阅文献2.3.3 网站分析2.3.4 网站设计2.3.5 网站实现2.3.6 系统测试与效果分析 三、系统展示四、核心代码4.1 查询民间文学4.2 查询传统音乐4.3 增改传统舞…...

C++(Qt)软件调试---静态分析工具clang-tidy(18)

C(Qt)软件调试—静态分析工具clang-tidy(18) 文章目录 C(Qt)软件调试---静态分析工具clang-tidy(18)1、概述2、clang-tidy基本用法3、目前已有检查项4、Qt Creator中安装clang-tidy5、Qt Creator中使用clang-tidy6、Clang-Tidy配置…...

2401llvm,clang的重构引擎

Clang的重构引擎 展示如何使用重构API中的各种原语来实现不同的重构. LibTooling库提供了几个在开发重构操作时,使用的其他API. 可用重构引擎来实现,用编辑器或IDE中的选择启动的本地重构.可结合AST匹配器和重构引擎,以实现不适合源选择和/或必须查询某些指定节点的AST的重构…...

【C语言深度剖析——第四节(关键字4)】《C语言深度解剖》+蛋哥分析+个人理解

追求本质,不断进步 本文由睡觉待开机原创,转载请注明出处。 本内容在csdn网站首发 欢迎各位点赞—评论—收藏 如果存在不足之处请评论留言,共同进步! 这里写目录标题 一、空间的申请1.变量定义1.1变量定义的概念:1.2变…...

鸿蒙开发系列教程(五)--ArkTS语言:组件开发

1、基础组件 组件API文档:https://developer.huawei.com/consumer/cn/doc/harmonyos-references-V2/84_u58f0_u660e_u5f0f_u5f00_u53d1_u8303_u5f0f_uff09-0000001427744776-V2 查看组件API 外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传 容…...

Java:正则表达式讲解加举例,简洁易懂

正则表达式定义: 由一些特定的字符组成,代表的是一个规则。 作用:1.校验数据是否合法。2.可以在一段文本中查找满足要求的内容。 先自己写一个方法去校验qq号,比较与正则表达式的区别: 正则表达式的代码暂时可以不…...

2.机器学习-K最近邻(k-Nearest Neighbor,KNN)分类算法原理讲解

2️⃣机器学习-K最近邻(k-Nearest Neighbor,KNN)分类算法原理讲解 个人简介一算法概述二算法思想2.1 KNN的优缺点 三实例演示3.1电影分类3.2使用KNN算法预测 鸢(yuan)尾花 的种类3.3 预测年收入是否大于50K美元 个人简介 🏘️&…...