当前位置: 首页 > news >正文

用AI的视角看世界

前言

2024年将是Ai人工智能在各个行业垂直领域发展的元年。

随着2022年11月openai 的大语言模型chatgpt3.5的诞生,已经预示着互联网时代,移动互联网时代即将迎来新的变革,也预示着web3.0和元宇宙更近了一步。

回顾历史,互联网的兴起、电商的兴起、短视频的兴起,每次时代的变革都将带来很多巨大的机会和红利。

2023年到现在几乎所有大型的互联网公司都在all in人工智能,不仅互联网公司,很多行业里的大型企业也开始布局。

随着去年2023年到现在一年的发展,这个领域更新迭代的速度非常之快,在自然语言处理、图像生成、图像识别、视频生成、文生图、文转3D、特征提取、文子转语音、等等等方面都成长出很多大模型。

一年的时间已经形成了像github这样的,在人工智能领域的开源社区huggingface,在全球开发者和互联网公司的助力下,它发展非常之快,huggingface目前的模型数量已经达到了快60万。

这个领域是充满无限可能和魅力的,虽然很多技术目前还处于成长阶段。

接下来谈一下我对这个领域目前的一个认知和未来发展的一个分析,包括对目前很多的中小型创业公司在经历这次变革有可能存在哪些机会。

在切入正题前先需要对大语言模型(LLM)基础与发展有一个基础的认知。

LLM自然语言模型

LLM(Large Language Model)大语言模型是人工智能领域中一种强大的自然语言处理模型,其发展历史可以追溯到词向量、词嵌入技术的出现,逐步演进到对句子和文本的理解,最终实现了对复杂语境的全面理解和生成。

国内外主要LLM发布时间及特点介绍


​ ​
通过上图可以发现国内的大模型全部都是在2023年爆发,国外最早的也是2019年发布。

这些庞大的大语言模型基座只有大公司才有实力进行研发训练,原因是训练成本非常大,还需要有机器学习、深度学习方面技能人才储备。

公开数据GPT-3.5的成本(481万美元)。

所以企业或者其他公司如果想拥有这样的大模型或者接入这个功能就存在很多限制:

1自己搞一个成本是非常巨大的。
2调用这些巨头科技公司的api接口,是按token收费的,一个字等于2个token。
3还有就是企业数据安全问题,尤其是国企政务方面,很多数据都是私有化,不可能放到公网上面。

到这儿会发现这个语言大模型只是有一定的智能对话能力,只是比搜索引擎能够更快的得答案,用久了还会发现它还存在一些弊端,例如不具备记忆能力,和它沟通它只能记得当前的上下文内容,还有实时信息更新慢,新旧知识难以区分,无法灵活操控外部系统,无法为领域问题提供专业靠谱的答案。

还是没办法像移动互联网时代,像手机和app那样被广泛的应用开。

但是随着2023年5-6月份LLaMA语言模型7B、13B、30B、33B、65B的开源(而且允许商用)。使用这个领域发生了变化,因为它的开源使得大模型的算法壁垒快速消失,而且在极短的时间里经过很多实践和验证,百亿参数(1B=10亿参数)是可以像那些千亿参数的基座大模型一样涌现智能,并且在小模型在经过微调后在某些领域甚至超过那些千亿参数的大模型。

至此,整个AI开源社区开始百花齐放,小参数模型的性能快速崛起,随后一些大的公司也发布并开源了自己百亿参数的模型,想快速建立属于自己的AI模型生态圈。

这就意味着应用开发者和中小型科技公司可以用很小成本去测试、部署、打磨一个私有化的大模型,通过微调+rag它的知识库,变成自己的智能问答助手。

目前已经有很多公司在做产模一体化的应用推进和落地了,只是信息差和市场目前还没有全面打开。这只是快速落地开始,也是大爆发时代来临的前夜,我相信随着ai模型的不断普及和技术的突破,ai模型以后部署的成本会越来越低运用技巧也会越来越成熟。

如果国内可以解决算力(也就是GPU)卡脖子这个问题,将来使用国产的显卡进行训练和推理,成本会更低。这个目前国内已经有了成熟的案例,例如清华和质谱AI退出的chatglm3语言模型就可以使用国产华为昇腾910计算芯片进行推理和训练。

多智能体协同Agent

再聊一下关于模型、业务应用、数据调用、工具之间的一个沟通问题,也就是AI+行业的产品这条路该怎么走,这个目前还处于一个混沌和快速崛起的时候。

因为单自然语言模型是不具备反思、运用工具、规划、多智能体协同(也就是多模型协同)能力,它只能输出它现有知识库的内容,虽然现在通过向量数据库可以很快的更新模型的知识体系,但它也只能应用在智能客服、智能问答库对话形式的这些领域。

怎么可以让智能体像人一样遇到问题遇到失败去反思,通过反思可以去协同其它智能体或者工具或者外部的数据去再次规划然后决策做出行动,最后输出结果或者执行。

其实目前已经有解决这个问题的方向,就是Agent,翻译过来就是代理,首先Agent不是一个技术,它是一个概念。

最近特别火的Devin(AI实现自动写代码)就是Agent的落地产品,要实现类似Devin这样的智能体,就得至少实现大脑、角色定义、工具的使用、标准化流程四项能力。

想象一下现实中如果一个产品应用落地需要什么,老板提出需求、产品经理分析需求指定方案、前端ui设计、最后给到程序员落地为产品,最后进入测试阶段。而且在程序开发过程中还会遇到问题,会给产品经理进行反馈,这就意味着Devin光角色就得定制最少3个(程序员、产品经理、测试),模型还得具有相互反馈修正的功能,可以想象一下里面的逻辑还是有技术壁垒的。所以从技术上讲目前对于大多数科技公司实现这四件事还是有很大难度。这个技术目前是最前沿的,而且还处于时间成长阶段,能够掌握和精通的是极少数一部分人。

技术方面让模型和应用结合的框架目前优选就是AutoGpt、Metagpt、LangChain,由于其架构设计较为先进且具有高度模块化的特点,对于初次接触该框架的开发者来说,理解和掌握如何配置、串联各个组件以达到预期效果可能需要一定的时间投入和学习成本。而且它们目前的文档还不是很完善,没有中文文档,能力有限的开发人员遇到问题缺乏解决渠道,还有就是它们缺乏大型的工业化应用实践,没有经历充分的检验。

但是我相信,Agent也会和2022年11月发布的chatGPT一样,一年的时间里快速崛起,因为这个领域技术的发展太快了,几个月就会冒出一个新东西,拭目以待,以后各个领域的企业和公司,包扩政务以及传统行业都会诞生非常优秀的产模一体化的产品应用,非常有可能就在未来的三年。

变革的机会

产模一体化的关键还是承上启下,上是目前百花齐放的各种语言模型、图像识别、文生图、文生视频等,去做这些东西需要有一定的技术积累和大量研发成本,难度很大,往下就是app+api千行百业学会使用AI怎么运用AI,达到降本增效,这里面呢难度低,机会大,也是大多数科技公司、应用开发、创业公司的突破口。

那么作为企业和创业公司或者个人面对这样的变革应该怎么做呢?

1)    关注人工智能领域最新研究成果、技术动态以及市场报告,深入理解AI技术的发展趋势及其在各行业的应用案例,通过案例分析获取思路,这也是一种快速的学习法,获取目标、拆解、分析、输出、总结。
2)    具备垂直领域百亿参数模型的独立部署和微调能力,最好对模型的深层次有一个基础的了解,涉及数学概率论、统计方法、机器学习、科学计算、神经网络、Transformer模型、训练与优化等等。
3)    用AI的视角看世界,也是这篇文章的核心主题。

我觉着最先受益的应该是那些拥有庞大企业数据以及具备标准化流程的企业,因为它们深耕垂直行业,具备先天优势,除了同行是不具备竞争对手的,而且大多数企业不具备自己的AI技术团队。想象一下,如果可以通过人工智能降低企业的人工成本、流程成本、生产成本,谁落后谁就会渐渐退出舞台。

还有就是在某专业领域具备核心竞争知识库的公司和个人,完全可以打造一个属于他个人的私有化辅助教,解放自己,让智能助手去帮住需要帮助的人。说到这儿可以想象一下,有可能这么多年的教育模式都会发生改变,很多公司很多企业客服这个部门可能只有几个员工甚至没有员工。

转载请注明出处。。。
 

相关文章:

用AI的视角看世界

前言 2024年将是Ai人工智能在各个行业垂直领域发展的元年。 随着2022年11月openai 的大语言模型chatgpt3.5的诞生,已经预示着互联网时代,移动互联网时代即将迎来新的变革,也预示着web3.0和元宇宙更近了一步。 回顾历史,互联网的…...

MATLAB 自定义实现点云法向量和曲率计算(详细解读)(64)

MATLAB 自定义实现点云法向量和曲率计算(详细解读)(64) 一、算法介绍二、算法步骤三、算法实现1.代码 (完整,注释清晰,可直接用)2.结果一、算法介绍 首先说明: ------这里代码手动实现,不调用matlab提供的法向量计算接口,更有助于大家了解法向量和曲率的计算方法,…...

拯救鲨鱼!Helping wireshark!wireshark未响应解决方法

前言 做题的的时候 在用wireshark解密tls秘钥的时候 我的小鲨鱼突然未响应了 然后我多次尝试无果 并且殃及池鱼 我电脑上所有的流量包都打不开了?!!! 于是乎 尝试删了重下 还是未响应 开始怀疑电脑 重启电脑两次 还是打…...

设计模式之责任链讲解

责任链模式适用于需要将请求和处理解耦的场景,同时又需要动态地组织处理逻辑的场景。 通过使用责任链模式,可以实现请求的动态处理、灵活的扩展和简化的代码编写,提高系统的可维护性和可扩展性。 一、责任链入门 以下这是GPT生成的责任链代…...

K8s: 将一个节点移出集群和相关注意事项

前置步骤 在Kubernetes集群中,要移出一个节点,你需要执行以下步骤: 1 )将节点标记为不可调度 首先,你需要将目标节点标记为不可调度,以确保Kubernetes不会在该节点上调度新的Pod这可以通过执行以下命令实…...

Python学习笔记24 - 学生信息管理系统

1. 需求分析 2. 系统设计 3. 系统开发必备 4. 主函数设计 5. 学生信息维护模块设计 a. 录入学生信息 b. 删除学生信息 c. 修改学生信息 d. 查询学生信息 e. 统计学生总人数 f. 显示所有学生信息 g. 排序模块设计 6. 项目打包...

【物联网应用案例】某制造企业电锅炉检测项目

供暖行业在我国的经济发展中占据着重要的地位,然而,长期以来,该行业存在着自动化水平低、管理效率不高等问题,制约了其持续发展。为了解决这些问题,吉林某电锅炉生产厂家进行了一项创新性的尝试。 该厂家通过集成物联…...

设计模式实践

结合设计模式概念和在java/spring/spring boot中的实战,说明下列设计模式。 一、工厂模式 这里只讲简单工厂模式,详细的可以参考Java工厂模式(随笔)-CSDN博客。工厂类会根据不同的参数或条件来决定创建哪种对象,这样…...

嵌入式学习52-ARM1

知识零散: 1.flash: nor flash 可被寻地址 …...

Java(MySQL基础)

数据库相关概念 MySOL数据库 关系型数据库(RDBMS) 概念: 建立在关系模型基础上,由多张相互连接的二维表组成的数据库。特点: 使用表存储数据,格式统一,便于维护使用SQL语言操作,标准统一,使用方便 SQL SOL通用语法…...

预约系统的使用

预约系统的使用 目录概述需求: 设计思路实现思路分析1.用户年规则 在 预约系统中的使用流程 参考资料和推荐阅读 Survive by day and develop by night. talk for import biz , show your perfect code,full busy,skip hardness,make a better result,wa…...

酷开科技OTT大屏营销:开启新时代的营销革命

随着互联网技术的不断发展和普及,大屏已经成为越来越多家庭选择的娱乐方式。在这个背景下,酷开科技凭借其强大的技术实力和敏锐的市场洞察力,成功地将大屏转化为一种新的营销渠道,为品牌和企业带来了前所未有的商业机会。 酷开科技…...

网络安全(防火墙,IDS,IPS概述)

问题一:什么是防火墙,IDS,IPS? 防火墙是对IP:port的访问进行限制,对访问端口进行制定的策略去允许开放的访问,将不放开的端口进行拒绝访问,从而达到充当防DDOS的设备。主要是拒绝网络流量,阻断所有不希望出现的流程,禁止数据流量流通,达到安全防护的作用。如将一些恶…...

安装IntelliJ IDEA插件教程

安装IntelliJ IDEA插件:一份详细指南 在提升IntelliJ IDEA开发效率的过程中,插件扮演着不可或缺的角色。它们为IDE提供了额外的功能和工具,以满足开发者在特定编程语言、框架、测试、版本控制等方面的个性化需求。本文将为您详细阐述如何在I…...

大厂基础面试题(之四)

Q1:请先进行自我介绍 Q2:说下你学习前端的详细过程 Q3:一个页面从url输入到显示页面的整个过程 1.URL解析 2.DNS解析 3.建立TCP连接 4.发起HTTP请求 5.服务器处理请求 6.返回HTTP响应 7.下载页面资源 8.解析和渲染页面 9.JavaScript执行 10…...

为什么我们应该切换到Rust

What is RUST? 什么是Rust? Rust is a programming language focused on safety, particularly safe concurrency, supporting functional and imperative-procedural paradigms. Rust is syntactically similar to C, but it provides memory safety without usi…...

基于Linux定时任务实现的MySQL周期性备份

1、创建备份目录 sudo mkdir -p /var/backups/mysql/database_name2、创建备份脚本 sudo touch /var/backups/mysql/mysqldump.sh# 用VIM编辑脚本文件,写入备份命令 sudo vim /var/backups/mysql/mysqldump.sh# 内如如下 #!/bin/bash mysqldump -uroot --single-…...

【Altium Designer 20 笔记】隐藏PCB上的信号线(连接线)

使用网络类隐藏特定类型的信号线 如果你想要隐藏特定类型的信号线(例如电源类),你可以首先创建一个网络类。使用快捷键DC调出对象类浏览器,在Net Classes中右击添加类,并重命名(例如为“Power”&#xff0…...

【Git教程】(九)版本标签 —— 创建、查看标签,标签的散列值,将标签添加到日志输出中,判断标签是否包含特定的提交 ~

Git教程 版本标签(tag) 1️⃣ 创建标签2️⃣ 查看存在的标签3️⃣ 标签的散列值4️⃣ 将标签添加到日志输出中5️⃣ 判断tag是否包含特定的提交🌾 总结 大多数项目都是用 1.7.3.2和 “ gingerbread” 这样的数字或名称来标识软件版本的。在 …...

MemberPress配置和使用会员登录页面

目录 隐藏 创建会员登录页面 编辑登录页面 设计您的登录页面 链接到您的登录页面 创建会员登录页面 要创建MemberPress会员登录页面,您需要做的就是导航到 MemberPress > 设置 > 页面选项卡,然后在页面顶部附近的“MemberPress 登录页面”…...

第25节 Node.js 断言测试

Node.js的assert模块主要用于编写程序的单元测试时使用,通过断言可以提早发现和排查出错误。 稳定性: 5 - 锁定 这个模块可用于应用的单元测试,通过 require(assert) 可以使用这个模块。 assert.fail(actual, expected, message, operator) 使用参数…...

高效线程安全的单例模式:Python 中的懒加载与自定义初始化参数

高效线程安全的单例模式:Python 中的懒加载与自定义初始化参数 在软件开发中,单例模式(Singleton Pattern)是一种常见的设计模式,确保一个类仅有一个实例,并提供一个全局访问点。在多线程环境下,实现单例模式时需要注意线程安全问题,以防止多个线程同时创建实例,导致…...

【MATLAB代码】基于最大相关熵准则(MCC)的三维鲁棒卡尔曼滤波算法(MCC-KF),附源代码|订阅专栏后可直接查看

文章所述的代码实现了基于最大相关熵准则(MCC)的三维鲁棒卡尔曼滤波算法(MCC-KF),针对传感器观测数据中存在的脉冲型异常噪声问题,通过非线性加权机制提升滤波器的抗干扰能力。代码通过对比传统KF与MCC-KF在含异常值场景下的表现,验证了后者在状态估计鲁棒性方面的显著优…...

【Android】Android 开发 ADB 常用指令

查看当前连接的设备 adb devices 连接设备 adb connect 设备IP 断开已连接的设备 adb disconnect 设备IP 安装应用 adb install 安装包的路径 卸载应用 adb uninstall 应用包名 查看已安装的应用包名 adb shell pm list packages 查看已安装的第三方应用包名 adb shell pm list…...

Caliper 负载(Workload)详细解析

Caliper 负载(Workload)详细解析 负载(Workload)是 Caliper 性能测试的核心部分,它定义了测试期间要执行的具体合约调用行为和交易模式。下面我将全面深入地讲解负载的各个方面。 一、负载模块基本结构 一个典型的负载模块(如 workload.js)包含以下基本结构: use strict;/…...

【 java 虚拟机知识 第一篇 】

目录 1.内存模型 1.1.JVM内存模型的介绍 1.2.堆和栈的区别 1.3.栈的存储细节 1.4.堆的部分 1.5.程序计数器的作用 1.6.方法区的内容 1.7.字符串池 1.8.引用类型 1.9.内存泄漏与内存溢出 1.10.会出现内存溢出的结构 1.内存模型 1.1.JVM内存模型的介绍 内存模型主要分…...

基于PHP的连锁酒店管理系统

有需要请加文章底部Q哦 可远程调试 基于PHP的连锁酒店管理系统 一 介绍 连锁酒店管理系统基于原生PHP开发,数据库mysql,前端bootstrap。系统角色分为用户和管理员。 技术栈 phpmysqlbootstrapphpstudyvscode 二 功能 用户 1 注册/登录/注销 2 个人中…...

elementUI点击浏览table所选行数据查看文档

项目场景&#xff1a; table按照要求特定的数据变成按钮可以点击 解决方案&#xff1a; <el-table-columnprop"mlname"label"名称"align"center"width"180"><template slot-scope"scope"><el-buttonv-if&qu…...

恶补电源:1.电桥

一、元器件的选择 搜索并选择电桥&#xff0c;再multisim中选择FWB&#xff0c;就有各种型号的电桥: 电桥是用来干嘛的呢&#xff1f; 它是一个由四个二极管搭成的“桥梁”形状的电路&#xff0c;用来把交流电&#xff08;AC&#xff09;变成直流电&#xff08;DC&#xff09;。…...

Java后端检查空条件查询

通过抛出运行异常&#xff1a;throw new RuntimeException("请输入查询条件&#xff01;");BranchWarehouseServiceImpl.java // 查询试剂交易&#xff08;入库/出库&#xff09;记录Overridepublic List<BranchWarehouseTransactions> queryForReagent(Branch…...