AI大模型:大数据+大算力+强算法
前言:好久不见,甚是想念,我是辣条,我又回来啦,兄弟们,一别两年,还有多少老哥们在呢?

目录
一年半没更文我干啥去了?
AI大模型火了
人工智能
大模型的理解
为什么学习大模型
大模型Function Calling功能增强
大模型接入公司的数据:embeddings&RAG
国产大模型
大模型学习路线
阶段一:AI大模型时代的华丽登场
阶段二:AI大模型API应用开发工程
阶段三:大模型应用架构进阶实践
阶段四:大模型微调与私有化部署
总结:我眼中的IT行业现状与未来趋势
一年半没更文我干啥去了?
不仅我没更文,好像跟我同一批的很多博主都没有更文了,有点怀念那个时候大家一起从0粉开始输出,大家相互卷,卷内容,卷文字,从普通的几百字文章到几千字的文章,最后动不动就万字长文,甚至恐怖到十万字长文,当时官方也吐槽:我们这些博主怎么动不动搞这种大长文?当时大家的卷还不是为了那份流量,从开始的博文记录自己的技术学习到后面为了用户而出输出,那段时间很快乐,很充实,很安逸。
有人说经常怀念过去的人是现在过的不好,好像说对了,好像有不对,你觉得呢?这一年半我自己也经历了不好,因为图文创作本身是没啥收益的,当时后面去试了短视频创作这块,我们一批很多博主后面都尝试了,最后破圈成功的只有英雄老哥【ID:英雄哪里出来】,他现在某站和某音粉丝量惊人,甚至是我们这个赛道里的头部博主了,以前搞博客赛道的时候就是CSDN的头部,现在也是短视频程序员里的头部,所以成功的人好像做啥都能成功,就像雷军雷总一样,当初写代码那么优秀,后面把小米手机做的这么优秀,现在小米汽车同样做的这么优秀。任何人之间的差距,有外在的更有内在的,人往往被外在迷惑而忽视了内自。
我也经历许多挫折,能怎么办呢,拍拍身上的灰尘,继续向前进,与各位互勉。

AI大模型火了
好像火了,年年都在炒,年年炒的东西都不一样,我不想聊纯技术的东西(其实我不太擅长技术0.0),我就蹭蹭这个热度(我不是纯蹭啊,蹭热度的同时跟大家聊明白)
人工智能
传统AI
传统AI技术在工业控制、智能家居、无人驾驶、自动回复等领域也取得了较好的应用效果,在智能家居领域,传统AI技术能够实现对家居设备的智能控制,提高居住舒适度。比如家里的小度小度,智能语音机顶盒,智能控制的电器,就是最多的应用场景。但是它一般比较难有上下文的语言关联能力,也就是说,它不能够结合之前人类跟它的沟通来回答人类的问题。典型的代表就是智能客服,智能客服经常进入死循环,这就是因为没有结合上下文能力的原因。传统AI技术主要基于规则和知识库进行问题求解。
大模型
大模型在自然语言处理、计算机视觉、语音识别等领域取得了显著的成果。大模型还在金融、医疗、教育等领域取得了较好的应用效果。他最大的特点是,大模型给人的感觉是他能够像人一样“思考”,能够结合上下文的内容进行像人一样的回答,似乎它有记忆力一样。
大模型通常采用深度学习技术,通过大规模 数据集 训练出深度神经网络,从而实现对复杂问题的高效解决。大模型具有较好的泛化能力,能够在大量数据集上获得较好的性能。此外,大模型还具有较好的可扩展性,能够通过增加网络深度和网络宽度来提高性能。在人工智能(AI)领域,语言模型是一种可以预测文本序列的概率的统计模型。
大模型的理解
为什么学习大模型
通俗的理解:大模型是一个训练好的智能集体,它不具备联网的能力,它更像是一个人,但是这个人没有手机和电脑可以联网,因此你对它提问,它都会基于自己的知识理解给你答案,这个答案不一定是正确的。因此,大模型的数据知识库知识库是截至到2021年9月份的,这也就意味着在这个日期之后的知识它是一无所知的,尽管可以通过激发它的涌现能力让它具备一定的推理能力。
需要学习的人群:AI使用者:使用别人开发的AI工具,每个人都是这个角色。AI产品设计者:设计给他人使用的AI工具。AI产品开发者: 编程实现AI工具。AI产品的设计和开发者,是一般人在AI中具有最大的机会的人。
大模型Function Calling功能增强
当大模型不懂某些技能,怎么办?比如,我问:请问明天我需要打伞吗?,这个问题大模型是解决不了的,因为大模型是没有联网的。
大模型会需要查询我所在地址的天气情况,然后基于天气情况才能告诉我我是否需要打伞
于是大模型就会去查询天气,然后综合天气给的结果给我们一个答案
模型的结构

-
应用如下所示
Function Calling - 在上图中②所做的事就是,大模型发现自己要回答问题需要知道天气情况才能给出答案,因此,大模型就会去去调用天气的接口函数,查询天气,这个过程就是Function calling
-
Agent
大模型能够充分发挥自身的语义理解能力,解析用户的输入,然后在函数库中自动挑选出最合适函数进行运行,并给出问题的答案,整个过程不需要人工手动干预。这整个过程,好像不需要人处理,大模型自己就像人一样在做整个流程,这个流程的组合体就是一个智能的人一样,称为Agent,智能体。 -
APIs
我们给大模型提供的接口肯定就不止是一个,可能是很多个,一系列的,那么这一系列的接口,我们称为APIs,函数库
大模型接入公司的数据:embeddings&RAG
-
当一个公司有一系列的书本资料的时候,遇到了问题需要人去查书,然后再总结,这个过程很慢,那么可以把这个整理为一个向量库的标准数据,然后当用户向大模型提出问题的时候,大模型就会去这个数据库中查找数据,并反馈给用户结果

-
embeddings
-
由于大语言模型信息的滞后性以及不包含业务知识的特点,我们经常需要外挂知识库来协助大模型解决一些问题
-
为了让外挂的知识库更好的被访问,于是需要对数据进行标准的格式输出,我们称之为向量化》embeddings
-
-
RAG
-
相比于仅依赖大型语言模型的生成,RAG技术可以从外部知识库中检索信息,避免了模型的幻觉问题,并提升了对实时性要求较高问题的处理能力。与传统的知识库问答系统相比,RAG技术更加灵活,可以处理非结构化的自然语言文本。
-
RAG并非旨在取代已有的知识库问答系统,而是作为一种补充,强调实时性和准确性,并且通过结合生成和检索机制来提升自然语言处理任务的效果。
-

-
RAG优势
-

-
国产大模型
-
文心一言
-
智谱清言
-
星火大模型
-
通义千问
-
MOSS
-
盘古大模型
-
云雀
-
混元
-
商汤 - 商量SenseChat
-
中科院自动化所 - 紫东太初大模型
-
上海人工智能实验室 - 书生通用大模型
-
百川智能 - 百川大模型
-
清华大学 - ChatGLM-6B
大模型学习路线
阶段一:AI大模型时代的华丽登场
-
学习目标:所有行业的人都需要真正的了解的大模型,它不是ChatGPT的使用培训,而是更高级别的全面了解各种大模型,并能够更好的使用这些大模型
-
内容
-
第一阶段. 理解大模型
-
初识大模型
-
人工智能演进与大模型兴起:从AI1.0到AI2.0的变迁
-
大模型与通用人工智能
-
GPT模型的发展历程:GPT-1到GPT-4
-
.最新发展:GPT4-Turbo和GPTs
-
未来展望:大模型的趋势与挑战
-
-
国产大模型介绍
-
1.文心一言
-
2.星火大模型
-
3.智谱清言大模型
-
4.盘古大模型
-
-
大模型核心原理
-
1. 理解大模型成功的背后
-
2. 理解生成式模型与语言模型
-
3. Transformer架构深度解析
-
4. 关键技术解析:预训练、SFT、RLHF
-
5. GPT4应用实例与Prompt使用技巧
-
6. 交互式讨论:当前大模型应用场景
-
-
实践中的大模型
-
1. GPT模型实际应用与成本分析
-
2. OpenAI基础API实操
-
3. OpenAI Playground与参数调整
-
-
-
第二阶段. 大模型提示工程
-
AI开发环境
-
Python快速入门
-
pip工具快速掌握
-
IDE搭建与使用
-
-
提示工程基础
-
什么是提示工程
-
Prompt的构成与调优
-
基于OpenAI的Prompt案例
-
-
提示工程进阶
-
思维链Chain-of-thought
-
思维树Tree-of-thought
-
Prompt攻击与防范
-
敏感信息及账号密码方面的安全
-
-
实战项目一:基于提示工程的代码生成
-
-
阶段二:AI大模型API应用开发工程
-
学习目标:理解大模型并且能够进行基于大模型的应用开发
-
内容
-
理解Function Calling
-
OpenAI tools参数与function
-
调研本地Function Calling
-
远程Function Calling调用
-
Function Calling数据库查询
-
支持Function Calling的国产模型
-
-
RAG与Embedding
-
检索增强模型RAG
-
RAG系统基本搭建
-
什么是Embedding
-
Embedding在LLM中的应用
-
向量相似度欧式距离与余弦距离
-
OpenAI Embedding
-
-
向量数据库
-
向量数据库运用
-
向量数据库服务
-
主流向量数据库
-
Embedding与向量数据库结合
-
精简讲概念
-
-
OpenAI GPTs与Assistant API
-
GPTs的使用与限制
-
Assistants API 应用场景
-
Assistants thread与messages
-
基于Assistans做一个自己的GPT
-
GPT-4应用
-
-
实战项目二:基于大模型的文档智能助手
-
实战项目三:基于大模型的医学命名实体识别系统
-
阶段三:大模型应用架构进阶实践
-
学习目标:对大模型进行初步精调,让大模型在某一个领域的任务表现可以商业
-
内容
-
LangChain开发实践
-
LangChain VS Semantic Kernel
-
LangChain的核心组件
-
模型I/O封装
-
Prompt模版封装
-
数据库连接封装
-
Memory记忆封装
-
Chat models与LLMs
-
LangChain中RAG的实现
-
实战项目四:智能论文审稿机器人
-
-
Agents智能体架构
-
Agents概述与应用场景
-
LangChain Agents的设计理念与原理
-
Agents关键技术分析
-
ReAct Framework
-
Agents的未来潜力
-
AutoGPT快速打造智能体
-
MetaGPT
-
MetaGPT项目定位与解决的问题
-
MetaGPT的技术方案分析
-
MetaGPT的各模块代码解读
-
-
实战六:多智能体协同代码生成应用
-
-
实战项目七:基于图片的智能信息检索问答
-
实战项目八:无人数字人直播机器人客服
-
实战项目九:基于Agents打造AI模拟面试机器人
-
阶段四:大模型微调与私有化部署
-
学习目标:让大模型根据我们自己的专业/行业的私有知识库,经过微调可以回答有质量的专业问题
-
内容
-
开源模型与私有化模型
-
私有化部署的必要性
-
HuggingFace开源社区的使用
-
ChatGLM,Baichuan, LLaMA介绍
-
私有化部署模型实战
-
-
模型微调Fine-Tuning
-
模型微调的意义
-
大模型的训练阶段介绍
-
Pre-train: 基座的训练
-
SFT: 模型的调整
-
对于GPT模型的微调
-
LoRA介绍
-
-
实战:医疗领域智能医生私有模型
-
开源大模型微调
-
ChatGLM3-6B模型介绍
-
ChatGLM3-6B模型微调
-
LLaMA-7B模型介绍
-
LLaMA-7B模型微调
-
Baichuan-7B模型介绍
-
Baichuan-7B模型微调
-
-
多模态
-
什么是多模态模型
-
多模态的应用场景
-
图像生成技术概述
-
DALLE-3与Midjourney
-
Stable Diffusion与ControlNet
-
语音生成技术概述
-
主流TTS技术剖析
-
案例:MiniGPT-4与多模态问答
-
案例:BLIP与文本描述生成
-
案例:Video-LLaVA与多模态图像视频识别
-
-
实战
-
代码生成实战
-
-
总结:我眼中的IT行业现状与未来趋势
当前,IT行业在全球范围内都是一个快速发展的领域,它对经济发展、社会进步和人们生活方式的改变起着至关重要的作用。
现状方面,中国IT行业呈现出以下几个特点:
-
数字化转型加速:随着云计算、大数据、人工智能等技术的成熟和应用,中国各行业都在加速数字化转型,IT行业在提供技术支持和服务方面发挥着核心作用。
-
新技术不断创新:中国在5G、人工智能、区块链等新兴技术领域持续投入研发,力图在这些领域取得领先地位。
-
政策支持力度大:中国政府出台了一系列政策支持IT行业发展,如“互联网+”、“智能+”等行动计划,以及为科技创新企业提供税收优惠、资金支持等措施。
-
国际合作与竞争加剧:在全球产业链中,中国IT行业与国际先进水平的差距正在缩小,同时,国际竞争和合作也在不断加深。
未来趋势方面,可以预见:
-
技术创新驱动:未来IT行业将继续以技术创新为核心驱动力,特别是在人工智能、大数据、云计算、物联网等领域。
-
行业应用深化:IT技术将在智能制造、智慧城市、远程医疗、在线教育等行业应用中得到更深入的整合和应用。
-
信息安全重要性提升:随着数字化的深入,信息安全将成为越来越重要的议题,对加密技术、隐私保护、网络安全等方面的投入将持续增加。
-
可持续发展:随着全球气候变化和资源约束的挑战,IT行业将更加注重绿色发展,推动能源效率的提高和电子废弃物的减量化。
做好当下事,不念过往,不惧将来。
相关文章:
AI大模型:大数据+大算力+强算法
前言:好久不见,甚是想念,我是辣条,我又回来啦,兄弟们,一别两年,还有多少老哥们在呢? 目录 一年半没更文我干啥去了? AI大模型火了 人工智能 大模型的理解 为什么学习…...
同名在线查询系统微信小程序源码下载支持多种流量主,附带系统教程
同名在线查询系统微信小程序源码下载支持多种流量主这是一款支持查询同名的一款微信小程序 该款小程序支持多种查询模式 重名查询,热度查询,概率香查询 源码免费下载地址抄笔记(chaobiji.cn)...
2024年5月26日 十二生肖 今日运势
小运播报:2024年5月26日,星期日,农历四月十九 (甲辰年己巳月庚寅日),法定节假日。 红榜生肖:马、猪、狗 需要注意:牛、蛇、猴 喜神方位:西北方 财神方位:…...
Vue 3 组件基础与模板语法详解
title: Vue 3 组件基础与模板语法详解 date: 2024/5/24 16:31:13 updated: 2024/5/24 16:31:13 categories: 前端开发 tags: Vue3特性CompositionAPITeleportSuspenseVue3安装组件基础模板语法 Vue 3 简介 1. Vue 3 的新特性 Vue 3引入了许多新的特性,以提高框…...
ACM实训冲刺第十八天
统计元音 代码 需要注意的是getchar()和gets(s) #include<stdio.h> #include<string.h> int main(){//测试实例个数int n;scanf("%d",&n) ;char s[100];getchar();while(n--){gets(s);int cnta0,cnte0,cnti0,cnto0,cntu0;for(int j0;j<strlen(…...
22AP70/SS927
Hi3519AV200又叫SS927V100和SD3402V100,或者叫22AP70,是一颗面向市场推出的专业超高清智能网络录像机SoC,专门用来替换之前的Hi3519AV100,2023年推出的业界AI-ISP超高性价比芯片!该芯片最高支持四路sensor输入…...
C++实现的代码行数统计器
代码在GitHubMaolinYe/CodeCounter: C20实现的代码统计器,代码量小于100行,可以统计目录下所有代码文件的行数 (github.com) 前段时间到处面试找实习,有技术负责人的负责人问我C写过多少行,5万还是10万,用来评估熟练度…...
C# 结合 JS 暴改腾讯 IM SDK Demo
目录 关于腾讯 IM SDK Demo 范例运行环境 设计思路 服务端生成地址 IM 服务端接收 IM 客户端程序 小结 关于腾讯 IM SDK Demo 腾讯云即时通信 IM SDK 提供了单聊、群聊、关系链、消息漫游、群组管理、资料管理、直播弹幕等功能,并提供完备的 App 接入及管…...
【Web】CISCN 2024初赛 题解(全)
目录 Simple_php easycms easycms_revenge ezjava mossfern sanic Simple_php 用php -r进行php代码执行 因为ban了引号,考虑hex2bin,将数字转为字符串 php -r eval(hex2bin(16进制)); 注意下面这段报错,因为加不了引号,开…...
【C++进阶】AVL树
0.前言 前面我们已经学习过二叉搜索树了,但如果我们是用二叉搜索树来封装map和set等关联式容器是有缺陷的,很可能会退化为单分支的情况,那样效率就极低了,那么有没有方法来弥补二叉搜索树的缺陷呢? 那么AVL树就出现了&…...
云部署最简单python web
最近在玩云主机,考虑将简单的web应用装上去,通过广域网访问一下,代码很简单,所以新手几乎不会碰到什么问题。 from flask import Flaskapp Flask(__name__)app.route(/) def hello_world():return Hello, World!app.route(/gree…...
【Pytorch】【MacOS】14.m1芯片使用mps进行深度模型训练
读者要先自行安装python以及anaconda,并且配置pytorch环境 第一步 测试环境 import torch # 判断macOS的版本是否支持 print(torch.backends.mps.is_available()) # 判断mps是否可用 print(torch.backends.mps.is_built())如果第一个语句为False,说明当前…...
go学习笔记-从圣经中抄录的接口值的思考
接口值 接口值,由两个部分组成,一个具体的类型和那个类型的值 下面4个语句中,变量w得到了3个不同的值。( 开始和最后的值是相同的) var w io.Writer w os.Stdout w new(bytes.Buffer) w nil var w io.Writer var…...
ICML 2024 时空数据(Spatial-Temporal)论文总结
2024ICML(International Conference on Machine Learning,国际机器学习会议)在2024年7月21日-27日在奥地利维也纳举行 (好像ICLR24现在正在维也纳开)。 本文总结了ICML 24有关时空数据(Spatial-temporal) 的相关论文…...
多线程(C++11)
多线程(C) 文章目录 多线程(C)前言一、std::thread类1.线程的创建1.1构造函数1.2代码演示 2.公共成员函数2.1 get_id()2.2 join()2.3 detach()2.4 joinable()2.5 operator 3.静态函数4.类的成员函数作为子线程的任务函数 二、call…...
HLS入门
目录 一、 内容介绍二、 理解HLS2.1 HLS是什么?与VHDL/Verilog编程技术有什么关系?2.2 HLS有哪些关键技术问题?目前存在什么技术局限性? 三、 HLS在Quartus上的实现3.1 配置环境3.2 测试 四、 参考链接 一、 内容介绍 理解HLSHLS在Quartus上…...
电信光猫的USB存储对外网开放访问
前提条件当然是要有公网IP地址了,没有的话去找电信索要,然后可以使用动态域名正常访问。 我的电信光猫发现共享访问速度还可以,会有31M/s左右的写入速度 但是有一个不方便的是,无法从外网提供访问,SMB协议所用的445端…...
世界上首位AI程序员诞生,AI将成为人类的对手吗?
3月13日,世界上第一位AI程序员Devin诞生,不仅能自主学习新技术,自己改Bug,甚至还能训练和微调自己的AI模型,表现已然远超GPT-4等“顶流选手”。 AI的学习速度如此之快,人类的教育能否跟上“机器学习”的速…...
什么是创造力?如何判断自己的创造力?
创造力,主要表现为创新思想、发现和创造新事物的能力,是知识,智力和能力的综合能力,尤其是在职业发展方面,创造力具有重要的意义,企业的核心竞争力就来源于创造力,这就需要具有创造力的员工来推…...
Elasticsearch集群搭建学习
Elasticsearch集群聚合、集群搭建 RestClient查询所有高亮算分控制 数据聚合DSL实现Bucket聚合DSL实现Metrics聚合RestAPI实现聚合 拼音分词器如何使用拼音分词器?如何自定义分词器?拼音分词器注意事项? 自动补全数据同步集群搭建ES集群结构创…...
IDEA运行Tomcat出现乱码问题解决汇总
最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…...
Python|GIF 解析与构建(5):手搓截屏和帧率控制
目录 Python|GIF 解析与构建(5):手搓截屏和帧率控制 一、引言 二、技术实现:手搓截屏模块 2.1 核心原理 2.2 代码解析:ScreenshotData类 2.2.1 截图函数:capture_screen 三、技术实现&…...
条件运算符
C中的三目运算符(也称条件运算符,英文:ternary operator)是一种简洁的条件选择语句,语法如下: 条件表达式 ? 表达式1 : 表达式2• 如果“条件表达式”为true,则整个表达式的结果为“表达式1”…...
Python实现prophet 理论及参数优化
文章目录 Prophet理论及模型参数介绍Python代码完整实现prophet 添加外部数据进行模型优化 之前初步学习prophet的时候,写过一篇简单实现,后期随着对该模型的深入研究,本次记录涉及到prophet 的公式以及参数调优,从公式可以更直观…...
12.找到字符串中所有字母异位词
🧠 题目解析 题目描述: 给定两个字符串 s 和 p,找出 s 中所有 p 的字母异位词的起始索引。 返回的答案以数组形式表示。 字母异位词定义: 若两个字符串包含的字符种类和出现次数完全相同,顺序无所谓,则互为…...
智能AI电话机器人系统的识别能力现状与发展水平
一、引言 随着人工智能技术的飞速发展,AI电话机器人系统已经从简单的自动应答工具演变为具备复杂交互能力的智能助手。这类系统结合了语音识别、自然语言处理、情感计算和机器学习等多项前沿技术,在客户服务、营销推广、信息查询等领域发挥着越来越重要…...
Mysql8 忘记密码重置,以及问题解决
1.使用免密登录 找到配置MySQL文件,我的文件路径是/etc/mysql/my.cnf,有的人的是/etc/mysql/mysql.cnf 在里最后加入 skip-grant-tables重启MySQL服务 service mysql restartShutting down MySQL… SUCCESS! Starting MySQL… SUCCESS! 重启成功 2.登…...
Vite中定义@软链接
在webpack中可以直接通过符号表示src路径,但是vite中默认不可以。 如何实现: vite中提供了resolve.alias:通过别名在指向一个具体的路径 在vite.config.js中 import { join } from pathexport default defineConfig({plugins: [vue()],//…...
【p2p、分布式,区块链笔记 MESH】Bluetooth蓝牙通信 BLE Mesh协议的拓扑结构 定向转发机制
目录 节点的功能承载层(GATT/Adv)局限性: 拓扑关系定向转发机制定向转发意义 CG 节点的功能 节点的功能由节点支持的特性和功能决定。所有节点都能够发送和接收网格消息。节点还可以选择支持一个或多个附加功能,如 Configuration …...
Kafka主题运维全指南:从基础配置到故障处理
#作者:张桐瑞 文章目录 主题日常管理1. 修改主题分区。2. 修改主题级别参数。3. 变更副本数。4. 修改主题限速。5.主题分区迁移。6. 常见主题错误处理常见错误1:主题删除失败。常见错误2:__consumer_offsets占用太多的磁盘。 主题日常管理 …...
