当前位置: 首页 > news >正文

AIGC百模大战

AIGC Artificial Intelligence Generated Content, 或者Generative Artificial Intelligence,它能够生成新的数据、图像、语音、视频、音乐等内容,从而扩展人工智能系统的应用范围。

生成式人工智能有可能给全球经济带来彻底的变化。根据高盛(Goldman Sachs)的数据,未来10年,生成式人工智能可以推动全球GDP增长7%(或近7万亿美元),并在10年内将生产率增长1.5个百分点。

这场AIGC的火热,最早是由ChatGPT带来的,相信很多朋友已经尝试过,目前GPT4已经开放使用,相比3.5又有了长足的进步,国内互联网公司也都在竞相快速跟进,百度最早发布了文心一言,华为云最近也发布了盘古大模型3.0,阿里云推出了通义千问和通义万相,前者针对问答场景,后者面向的是绘画创作,也就是文生图场景。腾讯云推出了VectorDB ,向量数据库,作为知识库构建问答场景的一个工具。我有一个朋友,也算是资深的业内专家,他评价国内厂商在LLM大语言模型方面的水平,大概到年底能接近或追到GPT3.0的水平,那时候估计GPT5.0已经发布了,所以大致可以认为国内的大语言模型和OpenAI有两代的差距,还需要继续努力。由于中美之间大家都明白的关系,OpenAI不给国内商用,虽然有一些套壳的平台,但大规模2B的应用很难落地,从这个角度,实际给了国内厂商一个机会,谁能把基础做扎实,真正达到降本增效,提升生产力,国内的庞大市场,诸多行业及客户,还是有很大想象空间的。正因如此,国内厂商都不愿意错过,无论是对于股市、估值、融资,还是对于存量业务下滑的恐惧,GenAI都是不得不押的赛道。如今的「百模大战」让人想到了百团大战,共享单车大战,谁能笑到最后远未可知。

图片

说到AIGC,大模型,不得不提的还有底层算力,非常烧钱,为了训练GPT-3.5模型, OpenAI使用了大约10,000个英伟达的 GPU,它被认为是用于大型模型训练的门票,GPT-3训练一次的成本约为140万美元,GPT3.5 共有1750亿参数量,训练一次成本1200万美金。10亿美元的硬件开销,对于许多厂商来说,都是一道难以逾越的鸿沟。

目前,英伟达的GPU,A100,H100,一卡难求,限制了对中国的出口,最近又有消息传出,美国政府不排除对中国公司使用云上的GPU做出限制,这就很令人难受了,目前不少国内公司是使用美国三大云厂商来训练和部署自己的AIGC模型的,一旦做出这种限制,估计很多公司需要在海外注册公司来绕开限制,继续使用GPU机型,对国内的人才储备、创新环境又是一个打击。

生成式AI虽然如火如荼,但还在发展的很早期阶段,真正在2B领域落地的案例很少,或者说都还在早期摸索和尝试中。我们总结AIGC主要的创造商业价值的方向有以下四个方向,一个是新体验,在客户和员工互动方面,比如客服、问答系统,能够用AIGC打造更吸引人的创新方式,第二是效率工具,比如生成文章、总结段落大意,生成代码,微软有copilot,亚马逊发布了codewhisperer,这些可以使一些文案创意工作者,软件工程师的生产效率提高,给企业带来价值;第三,见解、洞察, 从海量企业信息中,提取见解和洞察,作为决策支持的工具,基于互联网海量信息的大模型,结合行业知识库,企业知识库,相信能在很多问题的回答中,给出有别于员工、管理层认知的一些深层次洞察,这些内容不乏能够帮助企业做决策的信息;第四,创造力工具,包括生成故事、图像、视频、音乐,AI能够在围棋方面战胜人类,说明机器在围棋可能性方面的计算能力已经超越人类,换句话说就是机器比人毕其一生看到的棋局可能性已经多了很多个数量级,那么在GC方面,也可以认为机器可以比人类有更多的创新空间,不排除可以创造出我们没有见过的,甚至没有想过的音乐,图像,视频,这些都将大大拓展人类的思维空间。

目前已经小规模应用的领域,比如广告、媒体行业,图片、视频的生成,影视作品配乐,游戏社交电商行业, 营销文案,配图生成,logo图标生成,头像生成等等。主要使用开源的模型做个性化构建,应用最广泛的就是Stable Diffusion,Stable Diffusion 2.0 训练花费 200,000 A100 小时,成本不菲,所以目前有人说,大模型的PK实际目前格局已定,只有一些一线大厂可以玩的起,和当年的云计算类似,如今剩下来的也就是几个巨头,连美团、360这样的公司,最后都放弃了云计算方向,相信现在下场玩大模型的厂商,也会逐渐收敛到头部,大模型也有赢者通吃效应,做的越好,投入越大,生态越完备,行业、企业应用越多,推动厂商更多的投入,最终形成一个闭环的增长飞轮,迫使一些排名靠后的厂商放弃开发和维护,最终一定是这个结果。目前除了Top3的巨头公司,其他公司更应该聚焦行业和企业,看看如何将AIGC和行业企业做更好的结合,把大模型到最终2B用户的最后一公里做好,这方面应该能养活很多公司,就如同做SAP/Oracle咨询和实施,做AWS/Azure解决方案的无数生态合作伙伴一样。

对于希望在AIGC方向有所发力的IT公司,除了开源解决方案的搭建和调优,也不妨去看看各大云厂商的相关服务,比如微软Azure的openAI service,copilot, amazon推出的bedrock,语言大模型titan,当然,也需要关注头部GenAI厂商的开源模型,如meta开源的LLama2,Anthropic的Claude,Stable AI的Stable diffusion,这些模型区别于chatGPT的中心化模式,更接近企业的私有化部署和数据隐私需要,百度阿里华为发布的产品也值得关注,不管是从中美目前大家都心知肚明的科技现状考虑,还是从国内数据隐私、自主可控角度考虑,国内厂商的大模型,大概率是国内企业应用落地的不二选择,研究研究如何集成到现有产品里,或者如何包装成产品给最终用户带来价值,在这个角度来看,大模型更像是一个基础设施功能,当年利用手机的定位功能,可以开发出打车、外卖、导航等一系列应用,颠覆了用户交互方式,大模型也一定不会仅仅是用户问答这一个缺乏想象力的场景,如何在其之上,结合用户场景去改进交互方式,开发出具体应用,未来将是关键点。

对于企业界,管理层也应该高度关注,一边学习和跟进AIGC的技术发展,一边和头部厂商保持沟通,还要一边留意竞争对手的尝试和动作,对于上规模的企业来说,提升哪怕1%的效率也都是不少的钱,关键是生产机制如果变了,极有可能甩掉竞争对手几条街,大概相当于机枪对手枪的关系,在任何有可能被AIGC改造的场景上,都应该保持关注和警惕。

对于工程师来说,保持学习,能把这些工具用起来,对自身也是生产率提高,增强了竞争优势,这些工具就像游戏里的装备一样,装备越好,战斗力越强。

据说已经有prompt engineer,提示词专家,能够月入十万了,各种先入坑的大佬也拉了很多社群,做了各种培训,赚得盆满钵满,各种历史的风口无不是如此,金矿边上卖铲子,沙漠里卖水,都是一本万利的生意,虚拟币挖矿时期的矿机,如今的英伟达,都是类似。

总体来看,AIGC比这些年局部大热的AR/VR,区块链,虚拟币看起来更有普遍价值,潜在的对2C,2B的渗透率都要高不少,基于AIGC的想象空间更大,技术的早期发展到成熟,一般会经历大火爬高和随之而来的低谷,最终进入成熟阶段,被业界广泛采纳,AIGC大概率也是这个曲线。至于现在到底是爬高冲顶还是已经回落正在进入低谷的冷静期,并无公论,需要更长时间的观察。

相关文章:

AIGC百模大战

AIGC Artificial Intelligence Generated Content, 或者Generative Artificial Intelligence,它能够生成新的数据、图像、语音、视频、音乐等内容,从而扩展人工智能系统的应用范围。 生成式人工智能有可能给全球经济带来彻底的变化。根据高盛…...

docker jira 一键安装含PJ(docker 一键安装jira)

docker jira 一键安装含PJ(docker 一键安装jira) 本文仅供参考学习,请勿用于商业用途本文用于Jira在Docker的安装,仅用于记录安装方式转载请注明来源Linux安装可参考链接Windows安装可查考链接Docker一键安装Confluence PJ条件允…...

认识一下Git

目录 Git Git下载 Git安装 Git初始化 Git操作 Git、GitLab、和Eclipse是公司中软件开发常用的组合: 1. Git:Git是一种分布式版本控制系统,用于跟踪文件和代码的变化。它提供了管理代码仓库的功能,可以记录每次提交的修改&am…...

只需4步使用Redis缓存优化Node.js应用

介绍 通过API获取数据时,会向服务器发出网络请求,收到响应数据。但是,此过程可能非常耗时,并且可能会导致程序响应时间变慢。 我们使用缓存来解决这个问题,客户端程序首先向API发送请求,将返回的数据存储…...

【react基础01】项目文件结构描述

react 项目文件结构描述 📂 REACTWORKSPACE📂 node_modules📂 public📄 favicon.ico📄 index.html📄 logo192.png📄 logo512.png📄 manifest.json📄 robots.txt &#x1…...

光电开关-NPN-PNP

基础概念 有信号 “检测到物体/有物体遮挡” 工作原理 NPN:表示共正电压,输出负电压【只能输出低电压或者悬空 常开常闭是指 输出有没有跟“地”接通】; NPN NO:表示常态下是常开的,检测到物体时黑色线输出一个负电压…...

学会使用Git 和 GitHub

Git 和 GitHub 都是程序员每天都要用到的东西 —— 前者是目前最先进的 版本控制工具,拥有最多的用户,且管理着地球上最庞大的代码仓库;而后者是全球最大 同性交友 代码托管平台、开源社区。 在没有这两个工具时,编程可能是这样的…...

SoftwareTest3 - 要了人命的Bug

软件测试基础篇 一 . 如何合理的创建一个 Bug二 . Bug 等级2.1 崩溃2.2 严重2.3 一般2.4 次要 三 . Bug 的生命周期四 . 跟开发产生争执应该怎么解决 Hello , 大家好 , 又给大家带来新的专栏喽 ~ 这个专栏是专门为零基础小白从 0 到 1 了解软件测试基础理论设计的 , 虽然还不足…...

Linux系统中MySQL库的操作,实操sql代码

Linux系统中MySQL库的操作 本文主要是对linux系统下MySQL库操作的总结,包含创建、删除、修改数据库,数据库的编码格式和校验格式以及数据库的恢复和备份。 1.创建数据库 1.1基本语法: CREATE DATABASE [IF NOT EXISTS] db_name [create_s…...

Python基础分享之面向对象的进一步拓展

我们熟悉了对象和类的基本概念。我们将进一步拓展,以便能实际运用对象和类。 调用类的其它信息 上一讲中提到,在定义方法时,必须有self这一参数。这个参数表示某个对象。对象拥有类的所有性质,那么我们可以通过self,调…...

Windows安装Docker Desktop并配置镜像、修改内存占用大小

启用Hyper-V Win S 搜索控制面板 安装WSL2 第一种方法(推荐) 以管理员运行命令提示符,然后重启Docker Desktop wsl --updatewsl --set-default-version 2第2种方法去微软官网下载WSL2并安装 《微软官网下载WSL2》 配置WSL2最大内…...

Zipping

Zipping 信息收集端口扫描目录扫描webbanner信息收集 漏洞利用空字节绕过---->失败sqlI-preg_match bypass反弹shell 稳定维持 提权-共享库漏洞 参考:https://rouvin.gitbook.io/ibreakstuff/writeups/htb-season-2/zipping#sudo-privileges-greater-than-stock-…...

pytorch学习---实现线性回归初体验

假设我们的基础模型就是y wx b,其中w和b均为参数,我们使用y 3x0.8来构造数据x、y,所以最后通过模型应该能够得出w和b应该分别接近3和0.8。 步骤如下: 准备数据计算预测值计算损失,把参数的梯度置为0,进行反向传播…...

别再乱写git commit了

B站|公众号:啥都会一点的研究生 写在前面 在很长的一段时间中,使用git commit都是随心所欲,log肥肠简洁,随着代码的迭代,当时有多偷懒,返过头查看git日志就有多懊悔,就和写代码不写doc string…...

八大排序(一)冒泡排序,选择排序,插入排序,希尔排序

一、冒泡排序 冒泡排序的原理是:从左到右,相邻元素进行比较。每次比较一轮,就会找到序列中最大的一个或最小的一个。这个数就会从序列的最右边冒出来。 以从小到大排序为例,第一轮比较后,所有数中最大的那个数就会浮…...

泊松分布简要介绍

泊松分布是一种常见的离散概率分布,它用于描述某个时间段或区域内随机事件发生的次数。它得名于法国数学家西蒙丹尼泊松。 泊松分布的概率质量函数表示某个时间段或区域内事件发生次数的概率。如果随机变量 X 服从泊松分布,记作 X ~ Poisson(λ)&#x…...

C语言每日一题(10):无人生还

文章主题:无人生还🔥所属专栏:C语言每日一题📗作者简介:每天不定时更新C语言的小白一枚,记录分享自己每天的所思所想😄🎶个人主页:[₽]的个人主页🏄&#x1f…...

VSCode开发go手记

断点调试: 安装delve(windows): go get -u github.com/go-delve/delve/cmd/dlv 设置 launch.json 配置文件: ctrlshiftp 输入 Debug: Open launch.json 打开 launch.json 文件,如果第一次打开,会新建一…...

怎么选择AI伪原创工具-AI伪原创工具有哪些

在数字时代,创作和发布内容已经成为了一种不可或缺的活动。不论您是个人博主、企业家还是网站管理员,都会面临一个共同的挑战:如何在互联网上脱颖而出,吸引更多的读者和访客。而正是在这个背景下,AI伪原创工具逐渐崭露…...

【块状链表C++】文本编辑器(指针中 引用 的使用)

》》》算法竞赛 /*** file * author jUicE_g2R(qq:3406291309)————彬(bin-必应)* 一个某双流一大学通信与信息专业大二在读 * * brief 一直在竞赛算法学习的路上* * copyright 2023.9* COPYRIGHT 原创技术笔记:转载…...

React 第五十五节 Router 中 useAsyncError的使用详解

前言 useAsyncError 是 React Router v6.4 引入的一个钩子,用于处理异步操作(如数据加载)中的错误。下面我将详细解释其用途并提供代码示例。 一、useAsyncError 用途 处理异步错误:捕获在 loader 或 action 中发生的异步错误替…...

手游刚开服就被攻击怎么办?如何防御DDoS?

开服初期是手游最脆弱的阶段,极易成为DDoS攻击的目标。一旦遭遇攻击,可能导致服务器瘫痪、玩家流失,甚至造成巨大经济损失。本文为开发者提供一套简洁有效的应急与防御方案,帮助快速应对并构建长期防护体系。 一、遭遇攻击的紧急应…...

微软PowerBI考试 PL300-选择 Power BI 模型框架【附练习数据】

微软PowerBI考试 PL300-选择 Power BI 模型框架 20 多年来,Microsoft 持续对企业商业智能 (BI) 进行大量投资。 Azure Analysis Services (AAS) 和 SQL Server Analysis Services (SSAS) 基于无数企业使用的成熟的 BI 数据建模技术。 同样的技术也是 Power BI 数据…...

python/java环境配置

环境变量放一起 python: 1.首先下载Python Python下载地址:Download Python | Python.org downloads ---windows -- 64 2.安装Python 下面两个,然后自定义,全选 可以把前4个选上 3.环境配置 1)搜高级系统设置 2…...

(二)TensorRT-LLM | 模型导出(v0.20.0rc3)

0. 概述 上一节 对安装和使用有个基本介绍。根据这个 issue 的描述,后续 TensorRT-LLM 团队可能更专注于更新和维护 pytorch backend。但 tensorrt backend 作为先前一直开发的工作,其中包含了大量可以学习的地方。本文主要看看它导出模型的部分&#x…...

智能在线客服平台:数字化时代企业连接用户的 AI 中枢

随着互联网技术的飞速发展,消费者期望能够随时随地与企业进行交流。在线客服平台作为连接企业与客户的重要桥梁,不仅优化了客户体验,还提升了企业的服务效率和市场竞争力。本文将探讨在线客服平台的重要性、技术进展、实际应用,并…...

Android Bitmap治理全解析:从加载优化到泄漏防控的全生命周期管理

引言 Bitmap(位图)是Android应用内存占用的“头号杀手”。一张1080P(1920x1080)的图片以ARGB_8888格式加载时,内存占用高达8MB(192010804字节)。据统计,超过60%的应用OOM崩溃与Bitm…...

如何理解 IP 数据报中的 TTL?

目录 前言理解 前言 面试灵魂一问:说说对 IP 数据报中 TTL 的理解?我们都知道,IP 数据报由首部和数据两部分组成,首部又分为两部分:固定部分和可变部分,共占 20 字节,而即将讨论的 TTL 就位于首…...

Spring Cloud Gateway 中自定义验证码接口返回 404 的排查与解决

Spring Cloud Gateway 中自定义验证码接口返回 404 的排查与解决 问题背景 在一个基于 Spring Cloud Gateway WebFlux 构建的微服务项目中,新增了一个本地验证码接口 /code,使用函数式路由(RouterFunction)和 Hutool 的 Circle…...

Java编程之桥接模式

定义 桥接模式(Bridge Pattern)属于结构型设计模式,它的核心意图是将抽象部分与实现部分分离,使它们可以独立地变化。这种模式通过组合关系来替代继承关系,从而降低了抽象和实现这两个可变维度之间的耦合度。 用例子…...