当前位置: 首页 > news >正文

【AI】小白入门笔记

前言

    2024年,愿新年胜旧年!作为AI世界的小白,今天先来从一些概念讲起,希望路过的朋友们多多指教!

正文

AI (人工智能)

    提起AI, 大家可能会想起各种机器人,移动手机的“Siri”,"小爱同学", 是语音助手机器人,阿尔法围棋(AlphaGo)是 击败了围棋世界冠军的AI机器人,除此之外,自动驾驶,人脸识别,智能客服,智能家居,物流AGV小车,搜索引擎推送内容和广告,淘宝的以图搜图,美颜相机,ocr文本识别等都是AI的应用场景。

    AI (Artificial Intelligence) , AI 即人工智能,让机器的行为看起来就像是人所表现出的智能行为一样,能听懂人类的语音,看懂人类的文字,知道人类的偏好,认识人类世界的生物(猫猫狗狗等),表现出学习、交流、感知、推理、使用工具等和人类一样的能力;再来看官网解释:机器人工智能是指使计算机系统或机器具备像人类一样的智能和能力,能够通过模拟和实现人类智能的各个方面,以改善生活、提高效率和解决复杂的问题。通常分为弱人工智能和强人工智能,弱人工智能专注于特定任务或领域,被用于执行特定的任务,如语音识别、图像分类、自然语言处理等;强人工智能就可以像人类一样具备自主学习、推理、解决问题和创造的能力。我们现在实现的人工智能技术主要是弱人工智能。

    人工智能是计算机科学领域的一个分支,研究的领域包括机器学习、深度学习、自然语言处理、计算机视觉、推荐系统等,智能体现在机器可以从经验中学习,适应新的输入完成任务,人工智能的应用以我粗浅的认知认为是通过输入已有内容得到模型,这个模型就是超能力(类似外星人的大脑),可以去预测或判断未知的事情,我们的学习也是在总结规律,人工智能的这个找规律的过程和规律很高级!

机器学习(ML-Machine Learning)

    机器学习是一种实现人工智能的方法,可以类比于人类学习知识的过程,我们人类想要获得知识,先对资料进行学习,对经验进行归纳总结得出规律,当出现未知问题时会用已知规律进行推测,机器学习的过程与人类学习的过程相似,也是预先对大量的学习资料进行学习来得到模型,这个根据数据得到模型的过程称作训练,当有了新的场景需要应用知识时,通过模型对新的场景进行判断,输出结果,从而实现对新场景进行预测的功能。

    根据学习的方式可以把机器学习主要分为四类:有监督学习、无监督学习、半监督学习和强化学习。

有监督学习

    机器会给出数据输入和答案,通过示例进行学习,会给出输入和输出数据对,输入为数据,输出被标记为正确答案,表现为通过带有标签的数据进行训练得到模型,输入一张猫的图片,我们人类知道图片 上是只猫,但是机器不知道,需要打标签告诉机器这是猫, 相当于给出机器预期的正确答案。

    学习过程:输入一张橘猫的图片,打标签为猫,再输入一张布偶猫的图片,打标签为猫,再输入一张狸花猫的图片,打标签为猫,通过一些标签为猫的图片输入数据,机器可根据数据的相似性、差异点等特征进行学习(训练)得到一个模型,拥有了认识猫的能力,再输入一张野猫的图片,模型可以给出结论判断野猫图片是猫。

    有监督学习主要用于处理回归和分类的任务。

分类:通过一组离散型数据,预测某一样本所属的类型,输出的值是定性的,比如判断性别、是否健康等,分类的结果只有正确或错误,使用正确率作为评价指标。

回归:通过一组连续型数据,预测某一样本可能的值,输出的值是定量的,比如通过过去一周的天气温度,预测明天的温度,是一个范围值,通过这个预测值和真实值之间的误差,进行回归性的分析,如果误差较小,认为是一个好的回归。

无监督学习

    对比有监督学习,无监督学习只有输入的数据,没有答案(标签),让机器(算法)自己从数据中发现特征总结规律得到标签,用上面猫的一些图片作为输入,举例机器可能会总结到猫的特征:两只尖耳朵、四条腿、一条尾巴、有胡须、小鼻子等等,学习得到一个模型,再给这个模型输入一个野猫的图片,模型判断同样有两只尖耳朵、四条腿、一条尾巴、有胡须、小鼻子的特征,会给出一个结论,这张图片的内容和之前输入的图片相似度很高,可能属于一类。

    无监督学习主要用于处理聚类的任务。

聚类:将一堆数据进行处理,根据数据之间的相似性进行分类。

半监督学习

    通过少量的有标签数据和大量的无标签数据进行训练得到模型,减少数据人工标注标签的成本,同时利用无标签的数据尝试提高模型的性能和泛化能力(模型预测新样本值的能力)。

强化学习

    为机器的学习过程建立一组奖惩机制,机器会在一些可能性行动下采取动作,每一个动作的执行会有相应的得分,机器通过反复实验得到不同的反馈,最终得到一个总得分,目标是获得最大化奖励。就比如做一件好事会加10分,做一件坏事会扣10分,在机器反复尝试中发现只有不断的做好事才能获得最高分,由此得出一个模型,这个模型的能力是会做好事。

机器学习的过程

准备数据

     这时的数据也叫做数据集,可以是带标签的,也可以是不带标签的,用来给算法找特征作进一步判断的 ,数据集一般根据用途分为训练集、验证集和测试集。

训练模型

      根据数据集做有限次的试错和优化来构建模型的过程,简单举例: 给定一个输入x和一个输出y, 目标是构建一种函数关系使y = f(x) 通过不断尝试调整x和y之间的参数,使数据集中的x们尽可能贴近输出的y们,模型训练的过程很复杂,训练的输出是模型,也就是x和y之间的映射关系。

验证模型

     训练得到初始模型,验证模型使用验证数据集用来评价模型的性能,同时根据模型的性能进行反复模型参数调整和再次验证,直到模型在验证数据集上表现良好。

测试模型

     使用测试数据集检测验证后的模型的表现

使用模型

    使用训练好的模型在新数据上做预测 ,个人觉得这个过程叫做推理(inference)    

调优模型

      使用更多数据,不同的特征或调整过的参数来提升模型的性能表现

补充:模型评估:评价模型性能的方法,用于训练、验证、测试的阶段,评估指标有准确率,召回率,精确率等,通常是分类模型的评估指标。

深度学习(DL-Deep Learning)

    深度学习是机器学习的一种方法, 目的建立、模拟人脑进行分析学习的神经网络,模仿人脑的机制来解释数据,属于无监督学习。深度学习是为了让机器自己获得学习能力,能够解决某些场景下复杂的难题。

自然语言处理(NLP-Natural Language Processing)

    自然语言处理是人工智能的一个研究领域,是一种机器学习技术,使计算机能够解读、处理和理解人类语言。自然语言是指人类之间的交流语言,ChatGPT(Chat Generative Pre-trained Transformer) 就是NLP的一个应用,它是一个预先训练好的NLP模型,可以进行文本生成,比如回答问题,与人对话等。

人工智能、机器学习、深度学习、自然语言处理的关系

小结 

  小白同学持续学习中,如有表达不合适或有误的地方,还请路过的伙伴们及时指出~

相关文章:

【AI】小白入门笔记

前言 2024年,愿新年胜旧年!作为AI世界的小白,今天先来从一些概念讲起,希望路过的朋友们多多指教! 正文 AI (人工智能) 提起AI, 大家可能会想起各种机器人,移动手机的“Siri”,"小爱同学", 是语…...

GPT应用开发:编写插件获取实时天气信息

欢迎阅读本系列文章!我将带你一起探索如何利用OpenAI API开发GPT应用。无论你是编程新手还是资深开发者,都能在这里获得灵感和收获。 本文,我们将继续展示聊天API中插件的使用方法,让你能够轻松驾驭这个强大的工具。 插件运行效…...

揭开Spring MVC的真面目

官方对于Spring MVC的描述为: Spring Web MVC是基于Servlet API框架构建的原始Web框架,从一开始就包含在Spring框架中。它的正式名称“Spring Web MVC”来自其源模块的名称(Spring-webmvc),但它通常被称为“Spring-MVC…...

AI大模型开发架构设计(3)——如何打造自己的大模型

文章目录 如何打造自己的大模型1 新时代职场人应用AIGC的5重境界2 人人需要掌握的大模型原理职场人都能听懂的大语音模型的训练过程职场人都能听得懂的大语言模型的Transformer推理过程 3 如何构建自己的大模型需要具备三个方面的能力LangChain是什么?LangChain主要…...

Linux C语言开发(三)运算符和表达式

目录 一.什么是运算符 二.什么是表达式 一.什么是运算符 在C语言中,运算符是用于执行特定操作的符号。这些操作可以涉及一个或多个值(称为操作数),并产生一个新的值或效果。C语言提供了多种类型的运算符,用于执行算术、比较、逻辑和其他类型的操作。 以下是C语言中常见的…...

Spring-AOP入门案例

文章目录 Spring-AOP入门案例概念:通知(Advice)切入点(Pointcut )切面(Aspect) 目标对象(target)代理对象(Proxy)顾问(Advisor)连接点(JoinPoint) 简单需求:在接口执行前输出当前系统时间Demo原始未添加aop前1 项目包结构2 创建相…...

中仕教育:国考调剂和补录的区别是什么?

国考笔试成绩和进面名单公布之后,考生们就需要关注调剂和补录了,针对二者之间的区别很多考生不太了解,本文为大家解答一下关于国考调剂和补录的区别。 1.补录 补录是在公式环节之后进行的,主要原因是经过面试、体检和考察&#…...

ESP32-TCP服务端(Arduino)

将ESP32设置为TCP服务器 介绍 TCP(Transmission Control Protocol)传输控制协议,是一种面向连接的(一个客户端对应一个服务端)、可靠的传输层协议。在TCP的工作原理中,它会将消息或文件分解为更小的片段&a…...

HCIA-HarmonyOS设备开发认证-序

序 最近涉及到HarmonyOS鸿蒙系统设备开发,在网络上已经有很多相关资料,视频教程,我也移植了公司的一个stm32G474板卡,运行LiteOS-m L0系统。 一面看资料一面移植,遇到不少坑,当看到运行的LOGO时&#xff0…...

Med-YOLO:3D + 医学影像 + 检测框架

Med-YOLO:3D 医学影像 检测框架 提出背景设计思路网络设计训练设计讨论分析 魔改代码:加强小目标检测总结 提出背景 论文链接:https://arxiv.org/abs/2312.07729 代码链接:https://github.com/JDSobek/MedYOLO 提出背景&…...

Docker部署Golang服务

不管是开发还是生产环境,通过 docker 方式部署服务都是一种不错的选择,能够解决不同开发环境一致性的问题。 本文以项目:https://github.com/johncxf/go-api 为例。 Dockerfile 构建 Go 运用环境 在项目根目录下添加 Dockerfile 文件&…...

C#,字符串匹配(模式搜索)Sunday算法的源代码

Sunday算法是Daniel M.Sunday于1990年提出的一种字符串模式匹配算法。 核心思想:在匹配过程中,模式串并不被要求一定要按从左向右进行比较还是从右向左进行比较,它在发现不匹配时,算法能跳过尽可能多的字符以进行下一步的匹配&…...

makefile 编译动态链接库使用(.so库文件)

makefile 编译动态链接库使用(.so库文件) 动态链接库:不会把代码编译到二进制文件中,而是在运行时才去加载, 好处是程序可以和库文件分离,可以分别发版,然后库文件可以被多处共享 动态链接库 动态&#…...

Hive 数仓及数仓设计方案

数仓(Data Warehouse) 数据仓库存在的意义在于对企业的所有数据进行汇总,为企业各个部门提供一个统一、规范的出口。做数仓就是做方案,是用数据治理企业的方案。 数据仓库的特点 面向主题集成 公司中不同的部门都会去数据仓库中拿数据,把独…...

Ubuntu使用docker-compose安装redis

ubuntu环境搭建专栏🔗点击跳转 Ubuntu系统环境搭建(十三)——使用docker-compose安装redis 文章目录 Ubuntu系统环境搭建(十三)——使用docker-compose安装redis1.搭建文件夹2.docker-compose.yaml配置文件3.redis.co…...

大数据安全 | 期末复习(上)| 补档

文章目录 📚概述⭐️🐇大数据的定义、来源、特点🐇大数据安全的含义🐇大数据安全威胁🐇保障大数据安全🐇采集、存储、挖掘环节的安全技术🐇大数据用于安全🐇隐私的定义、属性、分类、…...

Kylin 安装novnc 远程访问

noVNC可以使用浏览器直接访问服务器,而不需要使用VNC客户端。 1.初始环境 关闭防火墙或允许IP访问本机 2.安装依赖 dnf install -y tigervnc-server git 3.git下载novnc git clone https://github.com/novnc/noVNC.git git clone https://gitee.com/yangyizhao…...

神经网络算法与逻辑回归:优势与差异

神经网络算法和逻辑回归都是预测模型中的重要工具,但它们在处理复杂和非线性问题时表现出不同的性能。本文将深入探讨神经网络算法相对于逻辑回归的优势,以及它们在不同场景下的适用性。 一、引言 神经网络算法和逻辑回归都是预测模型中的重要工具&…...

【蓝桥杯冲冲冲】动态规划初步[USACO2006 OPEN] 县集市

蓝桥杯备赛 | 洛谷做题打卡day13 文章目录 蓝桥杯备赛 | 洛谷做题打卡day13题目描述输入格式输出格式样例 #1样例输入 #1样例输出 #1 提示样例说明数据规模与约定 思路:方程: 题解代码我的一些话 [USACO2006 OPEN] 县集市 The County Fair 题目描述 每年…...

C#,入门教程(30)——扎好程序的笼子,错误处理 try catch

上一篇: C#,入门教程(29)——修饰词静态(static)的用法详解https://blog.csdn.net/beijinghorn/article/details/124683349 程序员语录:凡程序必有错,凡有错未必改! 程序出错的原因千千万&…...

HYCONTROL MICROFLEX-DB超声波液位计实操详解(参数+工况+故障排查)

在工业液位测量中,腐蚀性介质、罐内干扰、泡沫水汽、后期维护量大一直是现场普遍痛点,很多中小型储罐、水池、反应罐都会纠结性价比高、调试简单、稳定性强的超声波液位计。今天给大家详细拆解一款进口紧凑型液位变送器:英国HYCONTROL海康MIC…...

别只盯着密码爆破:身份认证漏洞的3个“非主流”攻击面与防御思考

身份认证安全的隐秘战场:超越密码爆破的三大高阶攻防实践 在网络安全领域,身份认证机制如同数字世界的门锁系统。当大多数安全从业者将注意力集中在传统的密码爆破防御时,攻击者早已将目光转向那些被忽视的认证薄弱环节。本文将深入剖析三个常…...

GitLab SSH Key配置全流程复盘:从生成、复制到验证,一个命令解决‘Permission denied’

GitLab SSH Key配置全流程:从零开始到高效验证的完整指南 当你第一次在终端看到Permission denied (publickey)这个刺眼的红色错误时,那种挫败感我太熟悉了。三年前我刚接触GitLab时,花了整整一个下午才搞明白SSH Key配置的完整逻辑。本文将带…...

告别‘悲’:当AssetStudio遇到加密的AssetBundle,试试这几款替代工具(附实战对比)

突破加密壁垒:Unity资源逆向工程全工具链实战指南 当AssetStudio面对加密的AssetBundle时,开发者常陷入困境。本文将系统梳理Unity资源逆向工程的完整解决方案,从基础提取到高级解密技术,提供一套可落地的工具链选择策略。 1. 加密…...

发动机悬架系统场景下的多目标优化算法与最优控制算法【附程序】

✨ 长期致力于深度神经网络、深度学习、多目标优化算法、最优控制、主动悬置系统研究工作,擅长数据搜集与处理、建模仿真、程序编写、仿真设计。 ✅ 专业定制毕设、代码 ✅ 如需沟通交流,点击《获取方式》 (1)基于深度神经网络与N…...

什么是“中国词元”?——解析中国AI自主生态的核心公式与关键平台

在当前的AI发展阶段,构建自主可控的产业生态已成为关键议题。本文将解析“中国词元”(Chinese Tokens)这一核心概念,并介绍其关键支撑平台——模力方舟Moark。文章面向AI开发者、企业技术决策者及生态关注者,旨在阐明如…...

【风光场景生成】基于改进ISODATA的负荷曲线聚类算法附Matlab代码

✅作者简介:热爱科研的Matlab仿真开发者,擅长毕业设计辅导、数学建模、数据处理、程序设计科研仿真。 🍎完整代码获取 定制创新 论文复现点击:Matlab科研工作室 👇 关注我领取海量matlab电子书和数学建模资料 &…...

如何用VR-Reversal将3D VR视频高效转换为普通2D格式:完整实用指南

如何用VR-Reversal将3D VR视频高效转换为普通2D格式:完整实用指南 【免费下载链接】VR-reversal VR-Reversal - Player for conversion of 3D video to 2D with optional saving of head tracking data and rendering out of 2D copies. 项目地址: https://gitcod…...

STL编程中EN/ENO机制详解:从原理到仿真实践

1. 项目概述:理解STL中的EN/ENO机制在工业自动化编程领域,尤其是可编程逻辑控制器(PLC)的编程中,结构化文本(STL)是一种高级的、类似于Pascal或C的文本化编程语言。对于从梯形图(LAD…...

基于MCP协议构建安全AI支付工具:从原理到实践

1. 项目概述与核心价值最近在折腾AI智能体开发,特别是想给Claude Desktop这类工具增加点“超能力”,比如让它能直接帮我处理支付、查询订单状态,甚至自动对账。这想法听起来挺酷,但真动手去实现,发现最大的拦路虎不是写…...