用AI的视角看世界
前言
2024年将是Ai人工智能在各个行业垂直领域发展的元年。
随着2022年11月openai 的大语言模型chatgpt3.5的诞生,已经预示着互联网时代,移动互联网时代即将迎来新的变革,也预示着web3.0和元宇宙更近了一步。
回顾历史,互联网的兴起、电商的兴起、短视频的兴起,每次时代的变革都将带来很多巨大的机会和红利。
2023年到现在几乎所有大型的互联网公司都在all in人工智能,不仅互联网公司,很多行业里的大型企业也开始布局。
随着去年2023年到现在一年的发展,这个领域更新迭代的速度非常之快,在自然语言处理、图像生成、图像识别、视频生成、文生图、文转3D、特征提取、文子转语音、等等等方面都成长出很多大模型。
一年的时间已经形成了像github这样的,在人工智能领域的开源社区huggingface,在全球开发者和互联网公司的助力下,它发展非常之快,huggingface目前的模型数量已经达到了快60万。
这个领域是充满无限可能和魅力的,虽然很多技术目前还处于成长阶段。
接下来谈一下我对这个领域目前的一个认知和未来发展的一个分析,包括对目前很多的中小型创业公司在经历这次变革有可能存在哪些机会。
在切入正题前先需要对大语言模型(LLM)基础与发展有一个基础的认知。
LLM自然语言模型
LLM(Large Language Model)大语言模型是人工智能领域中一种强大的自然语言处理模型,其发展历史可以追溯到词向量、词嵌入技术的出现,逐步演进到对句子和文本的理解,最终实现了对复杂语境的全面理解和生成。
国内外主要LLM发布时间及特点介绍

通过上图可以发现国内的大模型全部都是在2023年爆发,国外最早的也是2019年发布。
这些庞大的大语言模型基座只有大公司才有实力进行研发训练,原因是训练成本非常大,还需要有机器学习、深度学习方面技能人才储备。
公开数据GPT-3.5的成本(481万美元)。
所以企业或者其他公司如果想拥有这样的大模型或者接入这个功能就存在很多限制:
1自己搞一个成本是非常巨大的。
2调用这些巨头科技公司的api接口,是按token收费的,一个字等于2个token。
3还有就是企业数据安全问题,尤其是国企政务方面,很多数据都是私有化,不可能放到公网上面。
到这儿会发现这个语言大模型只是有一定的智能对话能力,只是比搜索引擎能够更快的得答案,用久了还会发现它还存在一些弊端,例如不具备记忆能力,和它沟通它只能记得当前的上下文内容,还有实时信息更新慢,新旧知识难以区分,无法灵活操控外部系统,无法为领域问题提供专业靠谱的答案。
还是没办法像移动互联网时代,像手机和app那样被广泛的应用开。
但是随着2023年5-6月份LLaMA语言模型7B、13B、30B、33B、65B的开源(而且允许商用)。使用这个领域发生了变化,因为它的开源使得大模型的算法壁垒快速消失,而且在极短的时间里经过很多实践和验证,百亿参数(1B=10亿参数)是可以像那些千亿参数的基座大模型一样涌现智能,并且在小模型在经过微调后在某些领域甚至超过那些千亿参数的大模型。
至此,整个AI开源社区开始百花齐放,小参数模型的性能快速崛起,随后一些大的公司也发布并开源了自己百亿参数的模型,想快速建立属于自己的AI模型生态圈。
这就意味着应用开发者和中小型科技公司可以用很小成本去测试、部署、打磨一个私有化的大模型,通过微调+rag它的知识库,变成自己的智能问答助手。
目前已经有很多公司在做产模一体化的应用推进和落地了,只是信息差和市场目前还没有全面打开。这只是快速落地开始,也是大爆发时代来临的前夜,我相信随着ai模型的不断普及和技术的突破,ai模型以后部署的成本会越来越低运用技巧也会越来越成熟。
如果国内可以解决算力(也就是GPU)卡脖子这个问题,将来使用国产的显卡进行训练和推理,成本会更低。这个目前国内已经有了成熟的案例,例如清华和质谱AI退出的chatglm3语言模型就可以使用国产华为昇腾910计算芯片进行推理和训练。
多智能体协同Agent
再聊一下关于模型、业务应用、数据调用、工具之间的一个沟通问题,也就是AI+行业的产品这条路该怎么走,这个目前还处于一个混沌和快速崛起的时候。
因为单自然语言模型是不具备反思、运用工具、规划、多智能体协同(也就是多模型协同)能力,它只能输出它现有知识库的内容,虽然现在通过向量数据库可以很快的更新模型的知识体系,但它也只能应用在智能客服、智能问答库对话形式的这些领域。
怎么可以让智能体像人一样遇到问题遇到失败去反思,通过反思可以去协同其它智能体或者工具或者外部的数据去再次规划然后决策做出行动,最后输出结果或者执行。
其实目前已经有解决这个问题的方向,就是Agent,翻译过来就是代理,首先Agent不是一个技术,它是一个概念。
最近特别火的Devin(AI实现自动写代码)就是Agent的落地产品,要实现类似Devin这样的智能体,就得至少实现大脑、角色定义、工具的使用、标准化流程四项能力。
想象一下现实中如果一个产品应用落地需要什么,老板提出需求、产品经理分析需求指定方案、前端ui设计、最后给到程序员落地为产品,最后进入测试阶段。而且在程序开发过程中还会遇到问题,会给产品经理进行反馈,这就意味着Devin光角色就得定制最少3个(程序员、产品经理、测试),模型还得具有相互反馈修正的功能,可以想象一下里面的逻辑还是有技术壁垒的。所以从技术上讲目前对于大多数科技公司实现这四件事还是有很大难度。这个技术目前是最前沿的,而且还处于时间成长阶段,能够掌握和精通的是极少数一部分人。
技术方面让模型和应用结合的框架目前优选就是AutoGpt、Metagpt、LangChain,由于其架构设计较为先进且具有高度模块化的特点,对于初次接触该框架的开发者来说,理解和掌握如何配置、串联各个组件以达到预期效果可能需要一定的时间投入和学习成本。而且它们目前的文档还不是很完善,没有中文文档,能力有限的开发人员遇到问题缺乏解决渠道,还有就是它们缺乏大型的工业化应用实践,没有经历充分的检验。
但是我相信,Agent也会和2022年11月发布的chatGPT一样,一年的时间里快速崛起,因为这个领域技术的发展太快了,几个月就会冒出一个新东西,拭目以待,以后各个领域的企业和公司,包扩政务以及传统行业都会诞生非常优秀的产模一体化的产品应用,非常有可能就在未来的三年。
变革的机会
产模一体化的关键还是承上启下,上是目前百花齐放的各种语言模型、图像识别、文生图、文生视频等,去做这些东西需要有一定的技术积累和大量研发成本,难度很大,往下就是app+api千行百业学会使用AI怎么运用AI,达到降本增效,这里面呢难度低,机会大,也是大多数科技公司、应用开发、创业公司的突破口。
那么作为企业和创业公司或者个人面对这样的变革应该怎么做呢?
1) 关注人工智能领域最新研究成果、技术动态以及市场报告,深入理解AI技术的发展趋势及其在各行业的应用案例,通过案例分析获取思路,这也是一种快速的学习法,获取目标、拆解、分析、输出、总结。
2) 具备垂直领域百亿参数模型的独立部署和微调能力,最好对模型的深层次有一个基础的了解,涉及数学概率论、统计方法、机器学习、科学计算、神经网络、Transformer模型、训练与优化等等。
3) 用AI的视角看世界,也是这篇文章的核心主题。
我觉着最先受益的应该是那些拥有庞大企业数据以及具备标准化流程的企业,因为它们深耕垂直行业,具备先天优势,除了同行是不具备竞争对手的,而且大多数企业不具备自己的AI技术团队。想象一下,如果可以通过人工智能降低企业的人工成本、流程成本、生产成本,谁落后谁就会渐渐退出舞台。
还有就是在某专业领域具备核心竞争知识库的公司和个人,完全可以打造一个属于他个人的私有化辅助教,解放自己,让智能助手去帮住需要帮助的人。说到这儿可以想象一下,有可能这么多年的教育模式都会发生改变,很多公司很多企业客服这个部门可能只有几个员工甚至没有员工。
转载请注明出处。。。
相关文章:
用AI的视角看世界
前言 2024年将是Ai人工智能在各个行业垂直领域发展的元年。 随着2022年11月openai 的大语言模型chatgpt3.5的诞生,已经预示着互联网时代,移动互联网时代即将迎来新的变革,也预示着web3.0和元宇宙更近了一步。 回顾历史,互联网的…...
MATLAB 自定义实现点云法向量和曲率计算(详细解读)(64)
MATLAB 自定义实现点云法向量和曲率计算(详细解读)(64) 一、算法介绍二、算法步骤三、算法实现1.代码 (完整,注释清晰,可直接用)2.结果一、算法介绍 首先说明: ------这里代码手动实现,不调用matlab提供的法向量计算接口,更有助于大家了解法向量和曲率的计算方法,…...
拯救鲨鱼!Helping wireshark!wireshark未响应解决方法
前言 做题的的时候 在用wireshark解密tls秘钥的时候 我的小鲨鱼突然未响应了 然后我多次尝试无果 并且殃及池鱼 我电脑上所有的流量包都打不开了?!!! 于是乎 尝试删了重下 还是未响应 开始怀疑电脑 重启电脑两次 还是打…...
设计模式之责任链讲解
责任链模式适用于需要将请求和处理解耦的场景,同时又需要动态地组织处理逻辑的场景。 通过使用责任链模式,可以实现请求的动态处理、灵活的扩展和简化的代码编写,提高系统的可维护性和可扩展性。 一、责任链入门 以下这是GPT生成的责任链代…...
K8s: 将一个节点移出集群和相关注意事项
前置步骤 在Kubernetes集群中,要移出一个节点,你需要执行以下步骤: 1 )将节点标记为不可调度 首先,你需要将目标节点标记为不可调度,以确保Kubernetes不会在该节点上调度新的Pod这可以通过执行以下命令实…...
Python学习笔记24 - 学生信息管理系统
1. 需求分析 2. 系统设计 3. 系统开发必备 4. 主函数设计 5. 学生信息维护模块设计 a. 录入学生信息 b. 删除学生信息 c. 修改学生信息 d. 查询学生信息 e. 统计学生总人数 f. 显示所有学生信息 g. 排序模块设计 6. 项目打包...
【物联网应用案例】某制造企业电锅炉检测项目
供暖行业在我国的经济发展中占据着重要的地位,然而,长期以来,该行业存在着自动化水平低、管理效率不高等问题,制约了其持续发展。为了解决这些问题,吉林某电锅炉生产厂家进行了一项创新性的尝试。 该厂家通过集成物联…...
设计模式实践
结合设计模式概念和在java/spring/spring boot中的实战,说明下列设计模式。 一、工厂模式 这里只讲简单工厂模式,详细的可以参考Java工厂模式(随笔)-CSDN博客。工厂类会根据不同的参数或条件来决定创建哪种对象,这样…...
嵌入式学习52-ARM1
知识零散: 1.flash: nor flash 可被寻地址 …...
Java(MySQL基础)
数据库相关概念 MySOL数据库 关系型数据库(RDBMS) 概念: 建立在关系模型基础上,由多张相互连接的二维表组成的数据库。特点: 使用表存储数据,格式统一,便于维护使用SQL语言操作,标准统一,使用方便 SQL SOL通用语法…...
预约系统的使用
预约系统的使用 目录概述需求: 设计思路实现思路分析1.用户年规则 在 预约系统中的使用流程 参考资料和推荐阅读 Survive by day and develop by night. talk for import biz , show your perfect code,full busy,skip hardness,make a better result,wa…...
酷开科技OTT大屏营销:开启新时代的营销革命
随着互联网技术的不断发展和普及,大屏已经成为越来越多家庭选择的娱乐方式。在这个背景下,酷开科技凭借其强大的技术实力和敏锐的市场洞察力,成功地将大屏转化为一种新的营销渠道,为品牌和企业带来了前所未有的商业机会。 酷开科技…...
网络安全(防火墙,IDS,IPS概述)
问题一:什么是防火墙,IDS,IPS? 防火墙是对IP:port的访问进行限制,对访问端口进行制定的策略去允许开放的访问,将不放开的端口进行拒绝访问,从而达到充当防DDOS的设备。主要是拒绝网络流量,阻断所有不希望出现的流程,禁止数据流量流通,达到安全防护的作用。如将一些恶…...
安装IntelliJ IDEA插件教程
安装IntelliJ IDEA插件:一份详细指南 在提升IntelliJ IDEA开发效率的过程中,插件扮演着不可或缺的角色。它们为IDE提供了额外的功能和工具,以满足开发者在特定编程语言、框架、测试、版本控制等方面的个性化需求。本文将为您详细阐述如何在I…...
大厂基础面试题(之四)
Q1:请先进行自我介绍 Q2:说下你学习前端的详细过程 Q3:一个页面从url输入到显示页面的整个过程 1.URL解析 2.DNS解析 3.建立TCP连接 4.发起HTTP请求 5.服务器处理请求 6.返回HTTP响应 7.下载页面资源 8.解析和渲染页面 9.JavaScript执行 10…...
为什么我们应该切换到Rust
What is RUST? 什么是Rust? Rust is a programming language focused on safety, particularly safe concurrency, supporting functional and imperative-procedural paradigms. Rust is syntactically similar to C, but it provides memory safety without usi…...
基于Linux定时任务实现的MySQL周期性备份
1、创建备份目录 sudo mkdir -p /var/backups/mysql/database_name2、创建备份脚本 sudo touch /var/backups/mysql/mysqldump.sh# 用VIM编辑脚本文件,写入备份命令 sudo vim /var/backups/mysql/mysqldump.sh# 内如如下 #!/bin/bash mysqldump -uroot --single-…...
【Altium Designer 20 笔记】隐藏PCB上的信号线(连接线)
使用网络类隐藏特定类型的信号线 如果你想要隐藏特定类型的信号线(例如电源类),你可以首先创建一个网络类。使用快捷键DC调出对象类浏览器,在Net Classes中右击添加类,并重命名(例如为“Power”࿰…...
【Git教程】(九)版本标签 —— 创建、查看标签,标签的散列值,将标签添加到日志输出中,判断标签是否包含特定的提交 ~
Git教程 版本标签(tag) 1️⃣ 创建标签2️⃣ 查看存在的标签3️⃣ 标签的散列值4️⃣ 将标签添加到日志输出中5️⃣ 判断tag是否包含特定的提交🌾 总结 大多数项目都是用 1.7.3.2和 “ gingerbread” 这样的数字或名称来标识软件版本的。在 …...
MemberPress配置和使用会员登录页面
目录 隐藏 创建会员登录页面 编辑登录页面 设计您的登录页面 链接到您的登录页面 创建会员登录页面 要创建MemberPress会员登录页面,您需要做的就是导航到 MemberPress > 设置 > 页面选项卡,然后在页面顶部附近的“MemberPress 登录页面”…...
UE5 学习系列(二)用户操作界面及介绍
这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…...
基于距离变化能量开销动态调整的WSN低功耗拓扑控制开销算法matlab仿真
目录 1.程序功能描述 2.测试软件版本以及运行结果展示 3.核心程序 4.算法仿真参数 5.算法理论概述 6.参考文献 7.完整程序 1.程序功能描述 通过动态调整节点通信的能量开销,平衡网络负载,延长WSN生命周期。具体通过建立基于距离的能量消耗模型&am…...
Vue3 + Element Plus + TypeScript中el-transfer穿梭框组件使用详解及示例
使用详解 Element Plus 的 el-transfer 组件是一个强大的穿梭框组件,常用于在两个集合之间进行数据转移,如权限分配、数据选择等场景。下面我将详细介绍其用法并提供一个完整示例。 核心特性与用法 基本属性 v-model:绑定右侧列表的值&…...
java调用dll出现unsatisfiedLinkError以及JNA和JNI的区别
UnsatisfiedLinkError 在对接硬件设备中,我们会遇到使用 java 调用 dll文件 的情况,此时大概率出现UnsatisfiedLinkError链接错误,原因可能有如下几种 类名错误包名错误方法名参数错误使用 JNI 协议调用,结果 dll 未实现 JNI 协…...
在四层代理中还原真实客户端ngx_stream_realip_module
一、模块原理与价值 PROXY Protocol 回溯 第三方负载均衡(如 HAProxy、AWS NLB、阿里 SLB)发起上游连接时,将真实客户端 IP/Port 写入 PROXY Protocol v1/v2 头。Stream 层接收到头部后,ngx_stream_realip_module 从中提取原始信息…...
【论文笔记】若干矿井粉尘检测算法概述
总的来说,传统机器学习、传统机器学习与深度学习的结合、LSTM等算法所需要的数据集来源于矿井传感器测量的粉尘浓度,通过建立回归模型来预测未来矿井的粉尘浓度。传统机器学习算法性能易受数据中极端值的影响。YOLO等计算机视觉算法所需要的数据集来源于…...
使用 SymPy 进行向量和矩阵的高级操作
在科学计算和工程领域,向量和矩阵操作是解决问题的核心技能之一。Python 的 SymPy 库提供了强大的符号计算功能,能够高效地处理向量和矩阵的各种操作。本文将深入探讨如何使用 SymPy 进行向量和矩阵的创建、合并以及维度拓展等操作,并通过具体…...
嵌入式学习笔记DAY33(网络编程——TCP)
一、网络架构 C/S (client/server 客户端/服务器):由客户端和服务器端两个部分组成。客户端通常是用户使用的应用程序,负责提供用户界面和交互逻辑 ,接收用户输入,向服务器发送请求,并展示服务…...
AGain DB和倍数增益的关系
我在设置一款索尼CMOS芯片时,Again增益0db变化为6DB,画面的变化只有2倍DN的增益,比如10变为20。 这与dB和线性增益的关系以及传感器处理流程有关。以下是具体原因分析: 1. dB与线性增益的换算关系 6dB对应的理论线性增益应为&…...
Java求职者面试指南:计算机基础与源码原理深度解析
Java求职者面试指南:计算机基础与源码原理深度解析 第一轮提问:基础概念问题 1. 请解释什么是进程和线程的区别? 面试官:进程是程序的一次执行过程,是系统进行资源分配和调度的基本单位;而线程是进程中的…...
