AI大模型:大数据+大算力+强算法
前言:好久不见,甚是想念,我是辣条,我又回来啦,兄弟们,一别两年,还有多少老哥们在呢?
目录
一年半没更文我干啥去了?
AI大模型火了
人工智能
大模型的理解
为什么学习大模型
大模型Function Calling功能增强
大模型接入公司的数据:embeddings&RAG
国产大模型
大模型学习路线
阶段一:AI大模型时代的华丽登场
阶段二:AI大模型API应用开发工程
阶段三:大模型应用架构进阶实践
阶段四:大模型微调与私有化部署
总结:我眼中的IT行业现状与未来趋势
一年半没更文我干啥去了?
不仅我没更文,好像跟我同一批的很多博主都没有更文了,有点怀念那个时候大家一起从0粉开始输出,大家相互卷,卷内容,卷文字,从普通的几百字文章到几千字的文章,最后动不动就万字长文,甚至恐怖到十万字长文,当时官方也吐槽:我们这些博主怎么动不动搞这种大长文?当时大家的卷还不是为了那份流量,从开始的博文记录自己的技术学习到后面为了用户而出输出,那段时间很快乐,很充实,很安逸。
有人说经常怀念过去的人是现在过的不好,好像说对了,好像有不对,你觉得呢?这一年半我自己也经历了不好,因为图文创作本身是没啥收益的,当时后面去试了短视频创作这块,我们一批很多博主后面都尝试了,最后破圈成功的只有英雄老哥【ID:英雄哪里出来】,他现在某站和某音粉丝量惊人,甚至是我们这个赛道里的头部博主了,以前搞博客赛道的时候就是CSDN的头部,现在也是短视频程序员里的头部,所以成功的人好像做啥都能成功,就像雷军雷总一样,当初写代码那么优秀,后面把小米手机做的这么优秀,现在小米汽车同样做的这么优秀。任何人之间的差距,有外在的更有内在的,人往往被外在迷惑而忽视了内自。
我也经历许多挫折,能怎么办呢,拍拍身上的灰尘,继续向前进,与各位互勉。
AI大模型火了
好像火了,年年都在炒,年年炒的东西都不一样,我不想聊纯技术的东西(其实我不太擅长技术0.0),我就蹭蹭这个热度(我不是纯蹭啊,蹭热度的同时跟大家聊明白)
人工智能
传统AI
传统AI技术在工业控制、智能家居、无人驾驶、自动回复等领域也取得了较好的应用效果,在智能家居领域,传统AI技术能够实现对家居设备的智能控制,提高居住舒适度。比如家里的小度小度,智能语音机顶盒,智能控制的电器,就是最多的应用场景。但是它一般比较难有上下文的语言关联能力,也就是说,它不能够结合之前人类跟它的沟通来回答人类的问题。典型的代表就是智能客服,智能客服经常进入死循环,这就是因为没有结合上下文能力的原因。传统AI技术主要基于规则和知识库进行问题求解。
大模型
大模型在自然语言处理、计算机视觉、语音识别等领域取得了显著的成果。大模型还在金融、医疗、教育等领域取得了较好的应用效果。他最大的特点是,大模型给人的感觉是他能够像人一样“思考”,能够结合上下文的内容进行像人一样的回答,似乎它有记忆力一样。
大模型通常采用深度学习技术,通过大规模 数据集 训练出深度神经网络,从而实现对复杂问题的高效解决。大模型具有较好的泛化能力,能够在大量数据集上获得较好的性能。此外,大模型还具有较好的可扩展性,能够通过增加网络深度和网络宽度来提高性能。在人工智能(AI)领域,语言模型是一种可以预测文本序列的概率的统计模型。
大模型的理解
为什么学习大模型
通俗的理解:大模型是一个训练好的智能集体,它不具备联网的能力,它更像是一个人,但是这个人没有手机和电脑可以联网,因此你对它提问,它都会基于自己的知识理解给你答案,这个答案不一定是正确的。因此,大模型的数据知识库知识库是截至到2021年9月份的,这也就意味着在这个日期之后的知识它是一无所知的,尽管可以通过激发它的涌现能力让它具备一定的推理能力。
需要学习的人群:AI使用者:使用别人开发的AI工具,每个人都是这个角色。AI产品设计者:设计给他人使用的AI工具。AI产品开发者: 编程实现AI工具。AI产品的设计和开发者,是一般人在AI中具有最大的机会的人。
大模型Function Calling功能增强
当大模型不懂某些技能,怎么办?比如,我问:请问明天我需要打伞吗?,这个问题大模型是解决不了的,因为大模型是没有联网的。
大模型会需要查询我所在地址的天气情况,然后基于天气情况才能告诉我我是否需要打伞
于是大模型就会去查询天气,然后综合天气给的结果给我们一个答案
模型的结构
-
应用如下所示
Function Calling
- 在上图中②所做的事就是,大模型发现自己要回答问题需要知道天气情况才能给出答案,因此,大模型就会去去调用天气的接口函数,查询天气,这个过程就是Function calling
-
Agent
大模型能够充分发挥自身的语义理解能力,解析用户的输入,然后在函数库中自动挑选出最合适函数进行运行,并给出问题的答案,整个过程不需要人工手动干预。这整个过程,好像不需要人处理,大模型自己就像人一样在做整个流程,这个流程的组合体就是一个智能的人一样,称为Agent,智能体。 -
APIs
我们给大模型提供的接口肯定就不止是一个,可能是很多个,一系列的,那么这一系列的接口,我们称为APIs,函数库
大模型接入公司的数据:embeddings&RAG
-
当一个公司有一系列的书本资料的时候,遇到了问题需要人去查书,然后再总结,这个过程很慢,那么可以把这个整理为一个向量库的标准数据,然后当用户向大模型提出问题的时候,大模型就会去这个数据库中查找数据,并反馈给用户结果
-
embeddings
-
由于大语言模型信息的滞后性以及不包含业务知识的特点,我们经常需要外挂知识库来协助大模型解决一些问题
-
为了让外挂的知识库更好的被访问,于是需要对数据进行标准的格式输出,我们称之为向量化》embeddings
-
-
RAG
-
相比于仅依赖大型语言模型的生成,RAG技术可以从外部知识库中检索信息,避免了模型的幻觉问题,并提升了对实时性要求较高问题的处理能力。与传统的知识库问答系统相比,RAG技术更加灵活,可以处理非结构化的自然语言文本。
-
RAG并非旨在取代已有的知识库问答系统,而是作为一种补充,强调实时性和准确性,并且通过结合生成和检索机制来提升自然语言处理任务的效果。
-
-
RAG优势
-
-
国产大模型
-
文心一言
-
智谱清言
-
星火大模型
-
通义千问
-
MOSS
-
盘古大模型
-
云雀
-
混元
-
商汤 - 商量SenseChat
-
中科院自动化所 - 紫东太初大模型
-
上海人工智能实验室 - 书生通用大模型
-
百川智能 - 百川大模型
-
清华大学 - ChatGLM-6B
大模型学习路线
阶段一:AI大模型时代的华丽登场
-
学习目标:所有行业的人都需要真正的了解的大模型,它不是ChatGPT的使用培训,而是更高级别的全面了解各种大模型,并能够更好的使用这些大模型
-
内容
-
第一阶段. 理解大模型
-
初识大模型
-
人工智能演进与大模型兴起:从AI1.0到AI2.0的变迁
-
大模型与通用人工智能
-
GPT模型的发展历程:GPT-1到GPT-4
-
.最新发展:GPT4-Turbo和GPTs
-
未来展望:大模型的趋势与挑战
-
-
国产大模型介绍
-
1.文心一言
-
2.星火大模型
-
3.智谱清言大模型
-
4.盘古大模型
-
-
大模型核心原理
-
1. 理解大模型成功的背后
-
2. 理解生成式模型与语言模型
-
3. Transformer架构深度解析
-
4. 关键技术解析:预训练、SFT、RLHF
-
5. GPT4应用实例与Prompt使用技巧
-
6. 交互式讨论:当前大模型应用场景
-
-
实践中的大模型
-
1. GPT模型实际应用与成本分析
-
2. OpenAI基础API实操
-
3. OpenAI Playground与参数调整
-
-
-
第二阶段. 大模型提示工程
-
AI开发环境
-
Python快速入门
-
pip工具快速掌握
-
IDE搭建与使用
-
-
提示工程基础
-
什么是提示工程
-
Prompt的构成与调优
-
基于OpenAI的Prompt案例
-
-
提示工程进阶
-
思维链Chain-of-thought
-
思维树Tree-of-thought
-
Prompt攻击与防范
-
敏感信息及账号密码方面的安全
-
-
实战项目一:基于提示工程的代码生成
-
-
阶段二:AI大模型API应用开发工程
-
学习目标:理解大模型并且能够进行基于大模型的应用开发
-
内容
-
理解Function Calling
-
OpenAI tools参数与function
-
调研本地Function Calling
-
远程Function Calling调用
-
Function Calling数据库查询
-
支持Function Calling的国产模型
-
-
RAG与Embedding
-
检索增强模型RAG
-
RAG系统基本搭建
-
什么是Embedding
-
Embedding在LLM中的应用
-
向量相似度欧式距离与余弦距离
-
OpenAI Embedding
-
-
向量数据库
-
向量数据库运用
-
向量数据库服务
-
主流向量数据库
-
Embedding与向量数据库结合
-
精简讲概念
-
-
OpenAI GPTs与Assistant API
-
GPTs的使用与限制
-
Assistants API 应用场景
-
Assistants thread与messages
-
基于Assistans做一个自己的GPT
-
GPT-4应用
-
-
实战项目二:基于大模型的文档智能助手
-
实战项目三:基于大模型的医学命名实体识别系统
-
阶段三:大模型应用架构进阶实践
-
学习目标:对大模型进行初步精调,让大模型在某一个领域的任务表现可以商业
-
内容
-
LangChain开发实践
-
LangChain VS Semantic Kernel
-
LangChain的核心组件
-
模型I/O封装
-
Prompt模版封装
-
数据库连接封装
-
Memory记忆封装
-
Chat models与LLMs
-
LangChain中RAG的实现
-
实战项目四:智能论文审稿机器人
-
-
Agents智能体架构
-
Agents概述与应用场景
-
LangChain Agents的设计理念与原理
-
Agents关键技术分析
-
ReAct Framework
-
Agents的未来潜力
-
AutoGPT快速打造智能体
-
MetaGPT
-
MetaGPT项目定位与解决的问题
-
MetaGPT的技术方案分析
-
MetaGPT的各模块代码解读
-
-
实战六:多智能体协同代码生成应用
-
-
实战项目七:基于图片的智能信息检索问答
-
实战项目八:无人数字人直播机器人客服
-
实战项目九:基于Agents打造AI模拟面试机器人
-
阶段四:大模型微调与私有化部署
-
学习目标:让大模型根据我们自己的专业/行业的私有知识库,经过微调可以回答有质量的专业问题
-
内容
-
开源模型与私有化模型
-
私有化部署的必要性
-
HuggingFace开源社区的使用
-
ChatGLM,Baichuan, LLaMA介绍
-
私有化部署模型实战
-
-
模型微调Fine-Tuning
-
模型微调的意义
-
大模型的训练阶段介绍
-
Pre-train: 基座的训练
-
SFT: 模型的调整
-
对于GPT模型的微调
-
LoRA介绍
-
-
实战:医疗领域智能医生私有模型
-
开源大模型微调
-
ChatGLM3-6B模型介绍
-
ChatGLM3-6B模型微调
-
LLaMA-7B模型介绍
-
LLaMA-7B模型微调
-
Baichuan-7B模型介绍
-
Baichuan-7B模型微调
-
-
多模态
-
什么是多模态模型
-
多模态的应用场景
-
图像生成技术概述
-
DALLE-3与Midjourney
-
Stable Diffusion与ControlNet
-
语音生成技术概述
-
主流TTS技术剖析
-
案例:MiniGPT-4与多模态问答
-
案例:BLIP与文本描述生成
-
案例:Video-LLaVA与多模态图像视频识别
-
-
实战
-
代码生成实战
-
-
总结:我眼中的IT行业现状与未来趋势
当前,IT行业在全球范围内都是一个快速发展的领域,它对经济发展、社会进步和人们生活方式的改变起着至关重要的作用。
现状方面,中国IT行业呈现出以下几个特点:
-
数字化转型加速:随着云计算、大数据、人工智能等技术的成熟和应用,中国各行业都在加速数字化转型,IT行业在提供技术支持和服务方面发挥着核心作用。
-
新技术不断创新:中国在5G、人工智能、区块链等新兴技术领域持续投入研发,力图在这些领域取得领先地位。
-
政策支持力度大:中国政府出台了一系列政策支持IT行业发展,如“互联网+”、“智能+”等行动计划,以及为科技创新企业提供税收优惠、资金支持等措施。
-
国际合作与竞争加剧:在全球产业链中,中国IT行业与国际先进水平的差距正在缩小,同时,国际竞争和合作也在不断加深。
未来趋势方面,可以预见:
-
技术创新驱动:未来IT行业将继续以技术创新为核心驱动力,特别是在人工智能、大数据、云计算、物联网等领域。
-
行业应用深化:IT技术将在智能制造、智慧城市、远程医疗、在线教育等行业应用中得到更深入的整合和应用。
-
信息安全重要性提升:随着数字化的深入,信息安全将成为越来越重要的议题,对加密技术、隐私保护、网络安全等方面的投入将持续增加。
-
可持续发展:随着全球气候变化和资源约束的挑战,IT行业将更加注重绿色发展,推动能源效率的提高和电子废弃物的减量化。
做好当下事,不念过往,不惧将来。
相关文章:

AI大模型:大数据+大算力+强算法
前言:好久不见,甚是想念,我是辣条,我又回来啦,兄弟们,一别两年,还有多少老哥们在呢? 目录 一年半没更文我干啥去了? AI大模型火了 人工智能 大模型的理解 为什么学习…...

同名在线查询系统微信小程序源码下载支持多种流量主,附带系统教程
同名在线查询系统微信小程序源码下载支持多种流量主这是一款支持查询同名的一款微信小程序 该款小程序支持多种查询模式 重名查询,热度查询,概率香查询 源码免费下载地址抄笔记(chaobiji.cn)...

2024年5月26日 十二生肖 今日运势
小运播报:2024年5月26日,星期日,农历四月十九 (甲辰年己巳月庚寅日),法定节假日。 红榜生肖:马、猪、狗 需要注意:牛、蛇、猴 喜神方位:西北方 财神方位:…...

Vue 3 组件基础与模板语法详解
title: Vue 3 组件基础与模板语法详解 date: 2024/5/24 16:31:13 updated: 2024/5/24 16:31:13 categories: 前端开发 tags: Vue3特性CompositionAPITeleportSuspenseVue3安装组件基础模板语法 Vue 3 简介 1. Vue 3 的新特性 Vue 3引入了许多新的特性,以提高框…...

ACM实训冲刺第十八天
统计元音 代码 需要注意的是getchar()和gets(s) #include<stdio.h> #include<string.h> int main(){//测试实例个数int n;scanf("%d",&n) ;char s[100];getchar();while(n--){gets(s);int cnta0,cnte0,cnti0,cnto0,cntu0;for(int j0;j<strlen(…...

22AP70/SS927
Hi3519AV200又叫SS927V100和SD3402V100,或者叫22AP70,是一颗面向市场推出的专业超高清智能网络录像机SoC,专门用来替换之前的Hi3519AV100,2023年推出的业界AI-ISP超高性价比芯片!该芯片最高支持四路sensor输入…...

C++实现的代码行数统计器
代码在GitHubMaolinYe/CodeCounter: C20实现的代码统计器,代码量小于100行,可以统计目录下所有代码文件的行数 (github.com) 前段时间到处面试找实习,有技术负责人的负责人问我C写过多少行,5万还是10万,用来评估熟练度…...

C# 结合 JS 暴改腾讯 IM SDK Demo
目录 关于腾讯 IM SDK Demo 范例运行环境 设计思路 服务端生成地址 IM 服务端接收 IM 客户端程序 小结 关于腾讯 IM SDK Demo 腾讯云即时通信 IM SDK 提供了单聊、群聊、关系链、消息漫游、群组管理、资料管理、直播弹幕等功能,并提供完备的 App 接入及管…...

【Web】CISCN 2024初赛 题解(全)
目录 Simple_php easycms easycms_revenge ezjava mossfern sanic Simple_php 用php -r进行php代码执行 因为ban了引号,考虑hex2bin,将数字转为字符串 php -r eval(hex2bin(16进制)); 注意下面这段报错,因为加不了引号,开…...

【C++进阶】AVL树
0.前言 前面我们已经学习过二叉搜索树了,但如果我们是用二叉搜索树来封装map和set等关联式容器是有缺陷的,很可能会退化为单分支的情况,那样效率就极低了,那么有没有方法来弥补二叉搜索树的缺陷呢? 那么AVL树就出现了&…...

云部署最简单python web
最近在玩云主机,考虑将简单的web应用装上去,通过广域网访问一下,代码很简单,所以新手几乎不会碰到什么问题。 from flask import Flaskapp Flask(__name__)app.route(/) def hello_world():return Hello, World!app.route(/gree…...

【Pytorch】【MacOS】14.m1芯片使用mps进行深度模型训练
读者要先自行安装python以及anaconda,并且配置pytorch环境 第一步 测试环境 import torch # 判断macOS的版本是否支持 print(torch.backends.mps.is_available()) # 判断mps是否可用 print(torch.backends.mps.is_built())如果第一个语句为False,说明当前…...

go学习笔记-从圣经中抄录的接口值的思考
接口值 接口值,由两个部分组成,一个具体的类型和那个类型的值 下面4个语句中,变量w得到了3个不同的值。( 开始和最后的值是相同的) var w io.Writer w os.Stdout w new(bytes.Buffer) w nil var w io.Writer var…...

ICML 2024 时空数据(Spatial-Temporal)论文总结
2024ICML(International Conference on Machine Learning,国际机器学习会议)在2024年7月21日-27日在奥地利维也纳举行 (好像ICLR24现在正在维也纳开)。 本文总结了ICML 24有关时空数据(Spatial-temporal) 的相关论文…...

多线程(C++11)
多线程(C) 文章目录 多线程(C)前言一、std::thread类1.线程的创建1.1构造函数1.2代码演示 2.公共成员函数2.1 get_id()2.2 join()2.3 detach()2.4 joinable()2.5 operator 3.静态函数4.类的成员函数作为子线程的任务函数 二、call…...

HLS入门
目录 一、 内容介绍二、 理解HLS2.1 HLS是什么?与VHDL/Verilog编程技术有什么关系?2.2 HLS有哪些关键技术问题?目前存在什么技术局限性? 三、 HLS在Quartus上的实现3.1 配置环境3.2 测试 四、 参考链接 一、 内容介绍 理解HLSHLS在Quartus上…...

电信光猫的USB存储对外网开放访问
前提条件当然是要有公网IP地址了,没有的话去找电信索要,然后可以使用动态域名正常访问。 我的电信光猫发现共享访问速度还可以,会有31M/s左右的写入速度 但是有一个不方便的是,无法从外网提供访问,SMB协议所用的445端…...

世界上首位AI程序员诞生,AI将成为人类的对手吗?
3月13日,世界上第一位AI程序员Devin诞生,不仅能自主学习新技术,自己改Bug,甚至还能训练和微调自己的AI模型,表现已然远超GPT-4等“顶流选手”。 AI的学习速度如此之快,人类的教育能否跟上“机器学习”的速…...

什么是创造力?如何判断自己的创造力?
创造力,主要表现为创新思想、发现和创造新事物的能力,是知识,智力和能力的综合能力,尤其是在职业发展方面,创造力具有重要的意义,企业的核心竞争力就来源于创造力,这就需要具有创造力的员工来推…...

Elasticsearch集群搭建学习
Elasticsearch集群聚合、集群搭建 RestClient查询所有高亮算分控制 数据聚合DSL实现Bucket聚合DSL实现Metrics聚合RestAPI实现聚合 拼音分词器如何使用拼音分词器?如何自定义分词器?拼音分词器注意事项? 自动补全数据同步集群搭建ES集群结构创…...

数据库(vb.net+OleDB+Access)简易学生信息管理系统
在我们日常生活当中,数据库一词往往离不开我们的编程界,在学校、仓库等方面起着存储数据及数据关系作用的文件。相较于Excel,Access可以存储无限多的记录,内容也十分丰富,例如文本、数字、日期、T&F等。而且不需要…...

Android 自定义图片进度条
用系统的Progressbar,设置图片drawable作为进度条会出现图片长度不好控制,容易被截断,或者变形的问题。而我有个需求,使用图片背景,和图片进度,而且在进度条头部有个闪光点效果。 如下图: 找了…...

对话:用言语构建深刻的思想碰撞
对话:用言语构建深刻的思想碰撞 在写书中,对话是一种有力的工具,能与读者进行有效的沟通和交流,引发深思和反思。它不仅是信息传递的方式,更是加深情感、探讨主题和吸引读者参与的桥梁。你应从读者的角度思考…...

Linux完整版命令大全(九)
4. linux压缩备份命令 ar 功能说明:建立或修改备存文件,或是从备存文件中抽取文件。语 法:ar[-dmpqrtx][cfosSuvV][a<成员文件>][b<成员文件>][i<成员文件>][备存文件][成员文件]补充说明:ar可让您集合许多…...

solidworks画螺栓学习笔记
螺栓 单位mm 六边形 直径16mm 水平约束 拉伸 选择厚度6mm 拉伸切除 画相切圆 切除厚度6mm,反向切除 ,拔模角度45 螺栓 直径9mm,长度30mm 倒角 直径1mm,角度45 异形孔向导 螺纹线 偏移打勾,距离为2mm&#…...

【Spark】加大hive表在HDFS存的每个文件的大小
配置参数: spark.hadoop.hive.exec.orc.default.stripe.size78643200 spark.hadoop.orc.stripe.size78643200 spark.hadoopRDD.targetBytesInPartition78643200 spark.hadoop.hive.exec.dynamic.partition.modenonstrict spark.sql.sources.partitionOverwriteMode…...

2024 年 5 个 GO REST API 框架
什么是API? API是一个软件解决方案,作为中介,使两个应用程序能够相互交互。以下一些特征让API变得更加有用和有价值: 遵守REST和HTTP等易于访问、广泛理解和开发人员友好的标准。API不仅仅是几行代码;这些是为移动开…...

socket地址理解
socket介绍 套接字的基本概念 1. 套接字的定义: 套接字(socket)是计算机网络中用于通信的端点,它抽象了不同主机上应用进程之间双向通信的机制。 2. 套接字的作用: 套接字连接应用进程与网络协议栈,使…...

Gopeed的高级用法
Gopeed是一个开源全平台下载器,具体简介请参考: “狗屁下载器”?Gopeed - 开源全平台下载器 (免费轻量 / 比 Aria2 好用 / 远程下载) - 异次元软件世界 (iplaysoft.com) 这里主要介绍下自己摸索出来的 Gopeed 的高级做法。 有的网站添加的…...

OpenHarmony系统使用gdb调试init
前言 OpenAtom OpenHarmony(简称“OpenHarmony”)适配新的开发板时,启动流程init大概率会出现问题,其为内核直接拉起的第一个用户态进程,问题定位手段只能依赖代码走读和增加调试打印,初始化过程中系统崩溃…...