“过度炒作”的大模型巨亏,Copilot每月收10刀,倒赔20刀
大模型无论是训练还是使用,都比较“烧钱”,只是其背后的成本究竟高到何处?已经推出大模型商用产品的公司到底有没有赚到钱?事实上,即使微软、亚马逊、Adobe 这些大厂,距离盈利之路还有很远!同时,使用这些大模型工具的人越多,相关企业需要支付基础设施的费用就越高,正因如此,贴本的买卖也开始了。
01
微软 GitHub Copilot,每月倒贴每位用户 20 美元
据《华尔街日报》10月9日报道,微软首批生成式AI产品中的GitHub Copilot正在亏损,对于目前在 AI 大模型商业应用维度走在最前沿的微软而言,它在推出的帮助程序员创建、修复和翻译代码服务的 GitHub Copilot 且拥有 150 万用户的基础上,向使用者收取每月 10 美元亦或者是每年 100 美元的费用之际,还贴了不少了钱。该服务平均每个用户每月损失 20 美元,有些用户每月高达 80 美元。此报道一出,引发了不少用户热议,本以为入局大模型是一笔赚钱的买卖,没想到它的成本费用如此高。
02
GPT-4、ChatGPT 为何会成为“吞金兽”?
论及收费 10 美元每月的 GitHub Copilot,其实费用也不算低,那为何还是无法让微软获得营收?从多个维度来看,这类大模型的运营成本之所以如此高,并非没有理由:
一,计算资源成本
运行一个大语言处理模型,如 ChatGPT,需要大量的计算资源,包括 GPU 或 CPU。这些资源的租用和维护费用通常占据了大部分运营成本。此前在与 OpenAI 合作时,透露,最初为支持 OpenAI 训练大模型,微软开发了一套新的 Azure 人工智能超级计算技术,也在 Azure 中建立超级计算资源,这些资源的设计和专用性使 OpenAI 能够训练一套日益强大的 AI 模型。为了训练出这套模型,微软在基础设施中使用了数以千计的英伟达人工智能优化 GPU,它们被连接在一个高吞吐量、低延迟的网络中,该网络基于英伟达量子 InfiniBand 通信,用于高性能计算。对此,促成微软和 OpenAI 合作的关键人物——负责战略合作伙伴关系的微软高级主管 Phil Waymouth 表示,OpenAI 训练其模型所需的云计算基础设施的规模是前所未有的,比业内任何人试图建立的网络 GPU 集群都要大得多。后来据彭博社报道,微软在该项目上已经花费了数亿美元。此外,还有博主根据论文,推算了一下开源大模型的费用:当训练一个 65B 参数的模型时,我们的代码在 2048 A100 GPU 和 80GB 的内存上处理大约 380 个 token /秒/GPU。这意味着在我们包含 1.4T 标记的数据集上进行训练大约需要 21 天。2048 个 GPU * 21*24 * 1$ ~ 100w刀,这还是确定数据集和参数后一次的训练成本
二,数据成本
训练一个类 ChatGPT 模型需要大规模的文本数据集,这些数据集的采集、准备和维护都需要资金。同时,数据的版权和许可成本也可能增加。早些时候,为了防止数据被“白嫖”,国外诸多问答社区、社交平台纷纷加入数据收费的队伍中,如 Reddit 对每 5000 万次 API 请求收费 1.2 万美元;Twitter 推出最便宜的套餐是每月需支付 4.2 万美元,用户可以访问 5000 万条推文;Stack Overflow 也曾一度被曝要向 AI 巨头收取训练数据费用......
三,工程师和研究人员成本
开发、维护和改进 ChatGPT 需要大量的工程师和研究人员。他们的薪资、福利和其他成本会对运营成本产生影响。不论科技巨头微软,只看 OpenAI。根据 OpenAI 之前发布的官方招聘信息显示,普通的 ChatGPT 软件工程师、机器学习研究科学家的薪资水平在 20 万美元 - 37 万美元(约 138.2 万-255.7 万元人民币)。主管的级别的薪资会更高一些,譬如 ChatGPT 移动端工程主管的薪酬在 30 万美元至 50 万美元(约 207.4 万-345.6 万元人民币)。
四,安全和隐私
在保护用户隐私和确保系统安全方面的额外投入可能会导致运营成本的增加。这包括监控系统,识别滥用和违规内容,以及实施安全措施。
五,能源成本
运行庞大的数据中心来支持 ChatGPT 所需的大量服务器和冷却设备,以及相关的能源成本也是一个重要因素。不久前,微软在发布了一份环境报告,其中透露,2022 年,公司用水量同比去年激增了 34%,较前几年大幅上涨,相当于超过 2500 个奥林匹克规格的游泳池水量,外部研究人员认为这与微软的人工智能研究有关。
六,维护和更新
模型需要定期维护和更新,以确保其性能、准确性和可用性。这可能需要定期的软件更新、改进和监控。
七,法规合规成本
符合各种法规和规定,如数据保护法规(如GDPR)和其他监管要求,也可能需要额外的成本,包括法律顾问和合规团队的费用。
八,性能优化和扩展
不断提高 ChatGPT 的性能和可扩展性可能需要投资于研究和开发,以应对更大的用户需求。总之,ChatGPT 等大模型的高运营成本是由多个因素共同作用造成的,包括硬件、数据、人力资源、安全、隐私和法规合规等多个方面。这些成本是维持系统高质量运行和用户满意度所必需的,同时也反映了大规模 AI 系统的复杂性。
“快速找补”的科技大厂们
有网友认为,「只有亏本经营才能获得迅速市场份额」。显然,这仅仅是一种短期策略。为了让大模型更长远地“存活”,微软等入局大模型的公司,已经想尽办法开始“补坑”。其中,最为值得关注的是,微软正在为其下一次人工智能软件升级提供更高的价格。除了按月定期收取 Microsoft 365 订阅费之外,该公司还将针对人工智能版本每月额外收取 30 美元,付费用户可以享受 AI 驱动的诸多功能,比如快速写邮件、一键把 Word 变成 PPT、快速处理 Excel 图表等。当然,也并不是微软一家这样做,据悉 Google 也为类似的 Duet AI 产品收取相同的额外费用。除了提高价格之外,知名外媒 The Information 独家爆料称,微软正在努力开发自己内部 AI 芯片,将其用在数据中心,并推动 PC 行业采用所谓的 NPU。据悉,微软有计划在下个月举行的年度开发者大会上,推出首款人工智能芯片,欲摆脱英伟达芯片带来的高昂费用。还有一些一些特殊方式正在入局 AI 大模型的企业中展开,如微软在考虑为 Bing 搜索引擎使用性能较低、成本更低的 AI 工具,还和在开源大模型领域撑起半边天的 Meta 牵手合作了;Zoom 结合了多种 AI 模型,开发了一个更为经济、简单的 AI 来降低成本;Adobe 采取积分制度,对每个月使用量设置了上限,并根据使用情况收费。
价值不明
Nature在一项1600名科学家的调查中也发现,那些在研究中使用AI的科学家中,认为AI工具现在已是“必需品”的人只占4%。简而言之,生成式AI最大的问题不是找到用例、需求,而是无法证明价值。指数风投(Index Ventures)合伙人Mark Goldberg表示,商业人工智能应用的出现曾经被寄予“光速实现”的乐观预期,但现在“出现了一种浅层次的幻灭感”:ChatGPT的初始用户增长激增,导致投资者高估了消费者将使用由生成式人工智能驱动的工具的速度。投资者在这些产品尚未拥有客户或收入之前便急于支持正在建设这些产品的初创公司,这引发了对市场可能过热的担忧。AI模型开发公司Writer的首席执行官May Habib表示,不断上升的估值反映了人们对人工智能前景的热情,但高管们很快就会更仔细地审视这些成本:我认为,明年将是生成式人工智能的融资基金消失的一年。
相关文章:

“过度炒作”的大模型巨亏,Copilot每月收10刀,倒赔20刀
大模型无论是训练还是使用,都比较“烧钱”,只是其背后的成本究竟高到何处?已经推出大模型商用产品的公司到底有没有赚到钱?事实上,即使微软、亚马逊、Adobe 这些大厂,距离盈利之路还有很远!同时…...

顺序表经典的OJ题
题目一 移除元素: 题目要求: 给你一个数组 nums 和一个值 val。你需要 原地 除所有数值等于 val 的素,并返回移除后数组的新长度.不要使用额外的数组空间。你必须仅使用 0(1) 额外空间并 原地 修改输入数组元素的顺序可以改变。你不需要考虑数…...

video_topic
使用qt5,ffmpeg6.0,opencv,os2来实现。qt并非必要,只是用惯了。 步骤是: 1.读取rtsp码流,转换成mat图像 2.发送ros::mat图像 项目结构如下: videoplayer.h #ifndef VIDEOPLAYER_H #define VIDEOPLAYER_H#include …...

uniapp获取公钥、MD5,‘keytool‘ 不是内部或外部命令,也不是可运行的程序 或批处理文件。
获取MD5、SHA1、SHA256指纹信息 通过命令的形式获取 winr调出黑窗口cd到证书所在目录输入keytool -list -v -keystore test.keystore,其中 test.keystore为你的证书名称加文件后缀按照提示输入你的证书密码,就可以查看证书的信息 通过uniapp云端查看(证书是在DClou…...

Jetson Orin NX 开发指南(5): 安装 OpenCV 4.6.0 并配置 CUDA 以支持 GPU 加速
一、前言 Jetson 系列的开发板 CPU 性能不是很强,往往需要采用 GPU 加速的方式处理图像数据,因此本文主要介绍如何安装带有 GPU 加速的 OpenCV,其中 GPU 加速通过 CUDA 来实现。 参考博客 Ubuntu 20.04 配置 VINS-Fusion-gpu OpenCV 4.6.…...

Spring Security 6.x 系列【67】认证篇之安装 ApacheDS
有道无术,术尚可求,有术无道,止于术。 本系列Spring Boot 版本 3.1.0 本系列Spring Security 版本 6.1.0 源码地址:https://gitee.com/pearl-organization/study-spring-security-demo 文章目录 1. 概述2. 安装3. 连接工具1. 概述 官方文档 在前两篇文档中,我们简单了…...

理解线程池源码 【C++】面试高频考点
理解线程池 C 文章目录 理解线程池 C程序源码知识点emplace_back 和 push_back有什么区别?互斥锁 mutexcondition_variablestd::move()函数bind()函数join 函数 线程池的原理就是管理一个任务队列和一个工作线程队列。 工作线程不断的从任务队列取任务,然…...

BP神经网络应用案例
目录 背景介绍 【神经网络符号说明】 【建立网络拓扑结构】 【神经网络学习步骤】 步骤1 准备输入和输出样本 步骤2 确定网络学习参数 步骤3 初始化网络权值W和阀值B 步骤4 计算网络第一层的输入和输出 步骤5 计算中间层(隐含层输入和输出) 步骤…...

日常学习记录随笔-大数据之日志(hadoop)收集实战
数据收集(nginx)--->数据分析---> 数据清洗--->数据聚合计算---数据展示 可能涉及到zabix 做任务调度我们的项目 电商日志分析 比如说我们现在有一个系统,我们的数仓建立也要有一个主题 我这个项目是什么我要干什么定义方向 对用户进行分析,用户信息 要懂整个数据的流…...

【云计算】相关解决方案介绍
文章目录 1.1 云服务环境 Eucalyptus1.1.1 介绍1.1.2 开源协议及语言1.1.3 官方网站 1.2 开源云计算平台 abiCloud1.2.1 开源协议及语言1.2.2 官方网站 1.3 分布式文件系统 Hadoop1.3.1 开源协议及语言1.3.2 官方网站 1.4 JBoss云计算项目集 StormGrind1.4.1 开源协议及语言1.4…...

攻防世界题目练习——Crypto密码新手+引导模式(二)(持续更新)
题目目录 1. 转轮机加密2. easychallenge 上一篇:攻防世界题目练习——Crypto密码新手引导模式(一)(持续更新) 1. 转轮机加密 首先了解一下轮转机加密吧。 传统密码学(三)——转轮密码机 题目内容如下: …...

LeetCode【1】两数之和
题目: 代码: public int[] twoSum(int[] nums, int target) {int[] result new int[2];Map<Integer, Integer> map new HashMap<>();// for (int i 0; i < nums.length; i) { // 这么写不能防重复啊!注意这里不…...

【运维笔记】VMWare 另一个程序已锁定文件的一部分,进程无法访问
情景再现 这里使用的是VMware 17 解决办法 进入设置 点击选项,全选复制里面内容 进入文件夹,删除所有包含.lck后缀的文件和文件夹 再启动虚拟机即可...

[Springboot]统一响应和异常处理配置
背景 前后端分离情况下,后端接口通常只需要返回JSON数据。 但有时候因为某些原因可能会导致得不到正确的结果。 比如 因为登录密码错误,你不能直接返回错误信息和null,这样前端很难处理。 又比如 因为后端接口爆出了异常,也不能直…...

Redis第四五六章 持久化事务主从复制
Redis ⽀持 RDB 和 AOF 两种持久化机制,持久化功能有效地避免因进程退出造成数据丢失问题, 当下次重启时利⽤之前持久化的⽂件即可实现数据恢复。 目录 第四章 持久化 4.1 RDB 4.1.1 触发机制 4.1.2 流程说明 4.1.3 RDB ⽂件的处理 4.1.4 RDB 的优…...

【强烈推荐】免费的PDF工具,包括PDF拆分/分割、转WORD等功能的免费在线软件工具,救了大命,找了半天什么pdf365、福xipdf、还有哔果pdf全是打着免费名义收费,烦死了
PDF拆分 - 图文工具箱 - imgtool.net,嘎嘎好用,主要是免费 除此之外,还有其他的功能,需要的可以去看看...

SpringMVC源码分析(二)启动过程之RequestMappingHandlerMapping分析
a、http请求中的url是如何与对应Handler的即Controller对应method映射的? 在上篇中提到在SpringMVC中,初始化9大内置组件的时候其中有一个组件就是HandlerMapping,在初始化HandlerMapping的时候会加载代码中所有标注了Controller和RequestMap…...

KWin、libdrm、DRM从上到下全过程 —— drmModeAddFBxxx(7)
接前一篇文章:KWin、libdrm、DRM从上到下全过程 —— drmModeAddFBxxx(6) 上一回讲到了drm_internal_framebuffer_create函数中的framebuffer_check函数。讲解了该函数的参数检查部分中的第二部分,本回对于该函数余下部分进行解析。 为了便于理解,再次贴出framebuffer_ch…...

2023 年 Arm A-Profile 架构发展
随着人工智能 (AI) 的兴起和安全威胁的加剧,计算需求不断发展,作为世界设备核心的基础计算架构也必须不断发展。这就是为什么我们的工程团队向普遍存在的 Arm 架构添加新功能和技术,然后软件团队确保软件尽可能无缝地适应这些未来的功能和技术。 Arm架构是如何开发的 Arm …...

2023年09月 C/C++(五级)真题解析#中国电子学会#全国青少年软件编程等级考试
C/C++编程(1~8级)全部真题・点这里 Python编程(1~6级)全部真题・点这里 第1题:红与黑 有一间长方形的房子,地上铺了红色、黑色两种颜色的正方形瓷砖。你站在其中一块黑色的瓷砖上,只能向相邻的黑色瓷砖移动。请写一个程序,计算你总共能够到达多少块黑色的瓷砖。 时间限…...

CentOS系统/root根目录扩容(扩展逻辑卷)
具体操作步骤 1、查看本机磁盘环境挂载情况 2、添加磁盘分区 3、开始扩容 4、同步到文件系统 1、查看本机磁盘环境挂载情况 [rooticon ~]# df -lh 可以看到/dev/mapper/centos-root 路径下容量为50G,我们要给这个路径下的容量扩容:[rooticon ~]# lsblk…...

苍穹外卖(三) 员工分页及技术实现细节
2. 员工分页查询 2.1 需求分析和设计 2.1.1 产品原型 2.1.2 接口设计 2.2 代码开发 2.2.1 设计DTO类 根据请求参数进行封装 2.2.2 封装PageResult 后面所有的分页查询,统一都封装为PageResult对象。 员工信息分页查询后端返回的对象类型为: Result 2.…...

二进制部署MySQL8.0
1、下载MySQL官方包 ## 下载MySQL [rootlocalhost ~]# wget https://dev.mysql.com/get/Downloads/MySQL-8.0/mysql-8.0.20-linux-glibc2.12-x86_64.tar.xz2、解压并移动安装包 # 解压安装包 [rootlocalhost ~]# tar xf mysql-8.0.20-linux-glibc2.12-x86_64.tar.xz# 移动 mv…...

全力以赴,火山引擎边缘云代表团出战亚运会
END 未来,火山引擎边缘云赛事阵容将继续全力以赴,通过领先、可信赖的云和智能技术,助力游戏行业呈现更加精彩的竞技赛事。...

WPF页面向后端传参
WPF页面(前端)向后端传参 1、编写一个Button,绑定后端命令,并传递参数: <ButtonWidth"100"Command"{Binding SendCommand}"CommandParameter"{Binding ElementNameSendMessage, PathTex…...

PyTorch 入门
一、说明 深度学习是机器学习的一个分支,其中编写的算法模仿人脑的功能。深度学习中最常用的库是 Tensorflow 和 PyTorch。由于有各种可用的深度学习框架,人们可能想知道何时使用 PyTorch。以下是人们更喜欢使用 Pytorch 来完成特定任务的原因。 Pytorch…...

微信自动批量添加好友的方法
在现在的营销中微信已成为一种重要的沟通方式。微信目前是没有自动批量添加好友的功能,需要运营者一个一个手动去添加,这样太过于浪费时间,并且加频繁了还容易被封号,今天给大家介绍几种手动批量加好友的方式以及怎么借助第三方软…...

[网鼎杯 2018]Comment git泄露 / 恢复 二次注入 .DS_Store bash_history文件查看
首先我们看到账号密码有提示了 我们bp爆破一下 我首先对数字爆破 因为全字符的话太多了 爆出来了哦 所以账号密码也出来了 zhangwei zhangwei666 没有什么用啊 扫一下吧 有git git泄露 那泄露看看 真有 <?php include "mysql.php"; session_start(); if(…...

生态兼容性进一步提升!白鲸开源 WhaleStudio 与火山引擎ByteHouse完成产品互认
数据作为新型生产要素,已快速融入生产、分配、流通、消费和社会服务管理等各环节,深刻改变着生产方式、生活方式和治理方式。越来越多企业也在尝试充分利用数据要素,开辟全新发展路径,进一步实现业务价值提升。 在数字化转型的大…...

iOS 内存管理和优化
对内存管理和拓展有独特的描述 iOS学习-内存管理 比较详细说明内存的关系 iOS 内存管理机制与原理 iOS 内存泄漏排查方法及原因分析 对weak的实现原理描写详细 【iOS】—— weak的基本原理 iOS copy & mutableCopy iOS 深拷贝与浅拷贝 对iOS的浅复制和深复制的深入解释…...