跟ChatGPT,聊聊ChatGPT
不仅“上知天文、下知地理”,似乎还能对答如流、出口成诗,甚至还能写剧本、编音乐、写代码——最近,一款名叫ChatGPT的人工智能聊天机器人火爆全球。由此,一系列关于新一代技术变革、人工智能替代人力、巨头企业扎堆入局AI的讨论在互联网上甚嚣尘上,并引发资本市场跟进炒作。
然而,随着越来越多的用户实测结果不及预期,许多人也在重新审视ChatGPT是否真如想象中那么完美。热闹过后,也许是时候开始冷静思考,ChatGPT的发展模式面临哪些不可规避的问题和风险?这对我国人工智能发展有何重要启示?
ChatGPT 的“无所不能”和“无能为力”
问:“ChatGPT和其他聊天机器人有什么不同?”
答:“ChatGPT是一种先进的语言模型,具有更强的语言能力和知识范围,能够与用户进行更自然有效的对话。”
以上是人民网财经和ChatGPT的一组对话截图。
正如ChatGPT在回答人民网财经提问时所言,相较于此前科技企业推出的聊天机器人,ChatGPT在智能化程度上大幅提升,给对话者的感觉也“更聪明”。
2022年11月底,ChatGPT由美国一家名为OpenAI的人工智能研究公司推出,可以实现与用户之间的智能聊天对话,属于偏任务型的多轮对话和问答系统。
“ChatGPT的出现,是人工智能技术发展的一次飞跃。”传播内容认知全国重点实验室首席科学家张勇东表示,其在交互和创作方面展现的出色能力,标志人工智能由决策式向生成式转变。
中国信通院云计算与大数据研究所内容科技部副主任石霖介绍,ChatGPT的技术基于OpenAI开发的GPT3.5系列模型。该模型参数规模据推测达十亿级别,加之在训练过程中引入人类反馈机制技术,使得ChatGPT在回答准确率、道德表现上进一步得到提升。
近期,有研究发现,ChatGPT的“聪明”程度足以通过美国行医执照、研究生入学等考试。清华大学计算机科学与技术系教授黄民烈表示,目前ChatGPT的对话能力已超出人类平均水准,未来其能达到的类人对话水平值得期待。
不过,看似“无所不能”的ChatGPT,也会存在“无能为力”的尴尬。
如,目前ChatGPT难以进行高级逻辑处理。在完成“多准快全”的基本资料梳理和内容整合后,ChatGPT尚不能提供综合判断、修改调整、逻辑完善等“画龙点睛”之笔,而这恰恰是人类高级智慧的体现。
此外,用于ChatGPT语言模型训练的数据为2021年底前的数据,因此在一些最新的数据和事件方面它可能会存在滞后。这在一定程度上造成了ChatGPT在内容准确性和知识性上的短板。不少用户反映它经常“一本正经地胡说八道”。
ChatGPT在常识问题和算术题上出现错误,被网友戏称“一本正经地胡说八道”。
预训练“机器人”潜藏侵权风险和监管隐忧
以ChatGPT为代表的预训练模型“机器人”,在预训练过程中需要“投喂”海量数据,才能使得模型能够成功理解人类语言并模拟出愈加真实的类人表达方式。
据OpenAI的相关论文透露,ChatGPT的训练集使用了总计约320TB的文字信息,涵盖超4000亿词和约31亿个网页,其中包括来自新闻、博客、社交媒体的内容。
但这种未经授权获取文本数据的预训练方式已引发争议和不满。推特(Twitter)现任首席执行官埃隆·马斯克就于近日宣布,叫停ChatGPT访问Twitter数据库来获取培训数据,声称“需要更多了解OpenAI的治理结构和未来收入计划”。
无独有偶,近日,拥有国际性体育资源的盖蒂图片社对同为人工智能企业的Stability AI提起诉讼,指责其未经许可从其数据库中复制了1200多万张图片,用于建立竞争性业务,并侵犯了该公司的版权和商标保护权。
左图为盖蒂图片社原图,右图为人工智能生成的图像,其包含了盖蒂图片社的版权水印,侧面印证了人工智能在学习过程中误将水印理解成了图片的一部分。图片来源于网络
张勇东表示,类似ChatGPT这样的预训练模型,其训练数据往往来源于书籍、网站等,而其用于训练的语料未经授权,存在版权风险。且这种训练过程往往不对外公开,训练数据也不对外公布,因此版权拥有者并不知情。待模型完成后,生成的内容往往是原始训练数据的某种组合,对外服务过程中就会存在侵犯原始版权的问题。
“这点与搜索引擎的服务机制不同。搜索引擎只是提供原始内容的链接,但ChatGPT则是以自身生成内容的形式提供服务,甚至连模型自己都无法确认是参考或综合了哪些原始素材。”他说。
正因如此,对于人工智能生成内容不能全盘接收,要注意甄别风险、加强监管,正成为业界共识。
近日,OpenAI首席技术官米拉·穆拉蒂在接受媒体采访时坦言,和其他聊天机器人一样,ChatGPT可能会编造事实,也可能会被坏人利用,需要政府部门尽早介入进行监管。
“从长远来看,社会各界应该积极推动制定人工智能生成内容(AIGC)的规范标准。世界各国应该共同努力,基于海量数据研发生产出更加符合全人类道德价值标准的内容。”张勇东说。
他建议,要强化数据源头把控,尤其是对涉及隐私、伦理、道德、政治偏见和种族主义等内容,要进行更严格的数据审查和清洗。
石霖建议,应加快布局人工智能安全标准、伦理规则的研究,针对人工智能新技术可能带来的版权风险、内容风险等推动形成行业自律。同时,还应做好AIGC技术应用的科普工作,提升民众的科学素养和风险认识。
炒作“哑火”后思考行业长远发展
ChatGPT的爆红,让OpenAI赚到了第一桶金,也让各路资本争相入局。
2023年1月,微软再次宣布向 OpenAI 投资数十亿美元。据了解,这是目前人工智能领域规模最大的一笔投资。投资机构红杉资本预测,未来AIGC有潜力产生数万亿美元的经济价值。
连日来,A股市场也经历了人工智能概念股大幅波动。但随着监管函的下达,炒作现象逐渐开始“哑火”,更多关于人工智能行业长远发展的思考和理性声音正在出现。
针对人工智能将取代部分人类职业的网络讨论,张勇东直言,人工智能技术距离真正达到类人的程度还有很长一段路要走。目前以ChatGPT为代表的AIGC在逻辑性、可解释性和可溯源性方面都有待完善。
“国际上先进的人工智能发展都不是一蹴而就的,而是有迹可循、不断突破的。”人工智能企业智谱AI首席执行官张鹏表示,“ChatGPT的出现是否意味着人工智能已经‘踩’到了通用人工智能这一终极目标的‘门槛’,还需冷静看待。”
多位行业专家表示,可以预见的是,在“人机共生”的未来时代,人工智能确将解放人类、提高效率,但其身份是“助手”而非“主人”。
而针对ChatGPT爆火引发的对国内人工智能产业的质疑,也需要用更加全面的眼光来看待。
多年来,我国人工智能产业在生态完善、技术研发、应用推广、人才建设等方面不断培育优势:过去十年间专利申请量位居世界第一,核心产业规模超过4000亿元。国际市场分析机构Gartner在研究报告中指出,阿里巴巴、百度、腾讯等科技企业在语言AI技术上的排名进入世界前十位……
“ChatGPT的成功再次给我们提了个醒,人工智能的发展需要在基础研究和技术研发方面不懈坚持。”张鹏表示,过去我国人工智能产业对基础设施和技术的重视和投入不足。未来,如何发挥长处、补齐短板,真正实现我国人工智能领域的关键跃升,值得期待。
展望未来,石霖认为,以ChatGPT为代表的AIGC技术应用,将形成“智能底座+服务”的商业模式。AIGC技术应用还将进一步发挥在数据、算力和算法上构筑的技术壁垒优势,对人工智能的应用推广带来深层次变革。
他指出,AIGC技术应用正在软件代码编写、工业设计、分子结构预测、基因编辑等科研生产领域探索应用场景,帮助缩短研发周期、降低试验成本,也将改变软件、工业、医疗、生物等行业运行模式。
张勇东表示,过去十年,人工智能领域主要围绕更好的感知和理解来发展,比如自动驾驶、数字医疗。未来十年,人工智能领域深层技术有望不断突破,将具备重塑数字化内容生产和消费模式的强大潜力。
深度学习技术及应用国家工程研究中心主任、百度首席技术官王海峰认为,融合大规模知识的深度学习是人工智能发展的重要方向。要联合产学研各方力量,探索协同育人创新模式,建立全方位多层次的人工智能人才培养体系。
相关文章:

跟ChatGPT,聊聊ChatGPT
不仅“上知天文、下知地理”,似乎还能对答如流、出口成诗,甚至还能写剧本、编音乐、写代码——最近,一款名叫ChatGPT的人工智能聊天机器人火爆全球。由此,一系列关于新一代技术变革、人工智能替代人力、巨头企业扎堆入局AI的讨论在…...
Java 数组(详细教学 基础篇)
一、数组的基本要素 标识符:数组的名称数组元素:数组中存放的数据元素下标:对数组元素进行编号,数组下标从0开始来访问元素类型:数组元素的数据类型 二、数组的五种赋值方法和使用方法 声明数组 int[] arr;//开辟三个…...
python装饰器原理 | 常用装饰器使用(@cache, @lru_cache)
🚀 关于python的装饰器原理介绍可看这里,讲的挺简洁易懂:python装饰器原理 ⭐ 弄懂装饰器原理后,来学学常用装饰器。 文章目录1、cache, lru_cache1、cache, lru_cache 也就是一种装饰在被执行的函数上,将其执行的结果…...

[oeasy]python0090_极客起源_wozniac_苹果公司_Jobs_Wozniac
极客起源 回忆上次内容 上次回顾了 DEC公司的兴起 从IBM的大型机 到DEC的小型机Mini Computer 再到DEC的终端 VT-100 计算机基础元器件发生了进化 从ENIAC的 电子管到PDP系列的 晶体管 新的器件 体积小了价格低了稳定性 提高了而且 连成了网络 ARPA网 就是 最初的Internet …...
Spring基础总结(下)
简介 本章节通过手写一个简单的 Spring 框架来加深对 Spring 框架源码以及设计思想的理解; 实现步骤 BeanScope 枚举代码 public enum BeanScope { sigleton, prototype; }AppConfig 配置类 // 定义包扫描路径 ComponentScan("com.dufu.spring"…...

设计模式面试题
设计模式分为 创建型 工厂模式 单例 原型行为性 责任链 迭代器 命令中介型结构性 适配器 代理 门面 装饰器 组合 桥接单例设计模式 懒汉式 用到时再创建,省内存 饿汉式 类创建时就创建,会占用内存 内部类 用到时再创建,省内存 线程池、数据…...
需要知道的一些API接口的基础知识
API是应用程序编程接口(Application Programming Interface)的缩写,能够起到两个软件组件之间的连接器或中介的作用。此类接口往往通过一组明确的协议,来表示各种原始的请求和响应。API文档可以向开发人员展示请求和响应是如何形成…...
互融云数字资产管理平台综合解决方案
自十八大以来,发展数字经济逐步成为了国家战略。从2015年国务院印发《促进大数据发展行动纲要》,到2020年4月中央发布《关于构建更加完善的要素市场化配置体制机制的意见》,再到2022年底出台《中共中央、国务院关于构建数据基础制度更好发挥数…...

记住这12个要点,你也能打造出让HR和技术主管前一亮的前端简历
第一篇章:吸引HR 如果你想在众多简历中脱颖而出,需要注意以下几点: 1、突出你的亮点: 给你的简历一个吸引人的文件命名和头部,突出你的关键技能和经验。 2、采用简洁的语言: 用简单易懂的语言来描述你的…...

AQS学习:ReentrantLock源码解析
前言 多线程知识中理解了ReentrantLock之后,对于整个AQS也会有大概的理解,后面再去看其它锁的源码就会比较容易。下面带大家一块来学习ReentrantLock源码。 概述 ReentrantLock是可重入的互斥锁,虽然具有与synchronized相同功能࿰…...
RocketMQ源码分析消息消费机制—-消费端消息负载均衡机制与重新分布
1、消息消费需要解决的问题 首先再次重复啰嗦一下 RocketMQ 消息消费的一些基本元素的关系 主题 —》 消息队列(MessageQueue) 1 对多。 主题 —》 消息生产者,一般主题会由多个生产者组成,生产者组。 主题 —》 消息消费者,一般一个主题…...
华为OD机试真题Python实现【数据分类】真题+解题思路+代码(20222023)
数据分类 题目 对一个数据a进行分类, 分类方法是,此数据a(4 个字节大小)的 4 个字节相加对一个给定值b取模, 如果得到的结果小于一个给定的值c则数据a为有效类型,其类型为取模的值。 如果得到的结果大于或者等于c则数据a为无效类型。 比如一个数据a = 0x01010101,b = 3…...

vue项目中引入字体包
问题: 项目开发过程中,因UI的显示要求,需要引入一些字体,那如何引入外部字体呢?很简单,只需要以下3步 一 下载对应的字体包文件,放置到我们的项目中 比如我需要PingFangSC的系列字体&#…...

Linux 文件相关操作
文件相关操作 编辑文件 命令: vi 文件名 然后输入i进入编辑模式 编辑完成后输入esc退出编辑 输入:wq保存即便目录下没有这个文件,也可以想使用vi 文件名进行编辑,保存退出后会创建这个文件 查看文件内容 命令: cat 文件名复…...

【计算机网络】应用题方法总结
0.前言本篇博客主要记录自己在学习到的部分解决计算机网络应用题方法,主要参考视频如下:计算机网络期末复习 应用题_哔哩哔哩_bilibili【计算机网络】子网划分题型总结_哔哩哔哩_bilibili循环冗余码step 1:确定冗余码长度。多项式最高位即为冗…...

Linux 浅谈之性能分析工具 perf
Linux 浅谈之性能分析工具 perf HELLO,各位博友好,我是阿呆 🙈🙈🙈 这里是 Linux 浅谈系列,收录在操作系统专栏中 😜😜😜 本系列将记录一些阿呆个人整理的 OS 相关知识…...
代码随想录-Day7:四数相加、三数之和
454. 四数相加 II 给你四个整数数组 nums1、nums2、nums3 和 nums4 ,数组长度都是 n ,请你计算有多少个元组 (i, j, k, l) 能满足: 0 < i, j, k, l < nnums1[i] nums2[j] nums3[k] nums4[l] 0示例 1: 输入࿱…...

jsp在线考试系统Myeclipse开发mysql数据库web结构java编程计算机网页项目
一、源码特点 jsp 在线考试系统 是一套完善的web设计系统,对理解JSP java编程开发语言有帮助,系统具有完整的源代码和数据库,系统主要采用B/S模式开发。开发环境为TOMCAT7.0,Myeclipse8.5 开发,数据库为Mysql,使用j…...

【总结】2023数学建模美赛!收官!
今年的美赛时间是2.17-2.21,这学期疫情放开了之后管的没那么严了,我们小组就都提前一天到学校了,全力准备17号的比赛。 时间流程 刚拿到6个题的时候,我们三个人一人看两个题,每个人从两个题中再选出来一个自己觉得有…...
C# GDI+ winform绘图知识总结
一、Graphics GDI是GDI(Windows Graphics Device Interface)的后继者,它是.NET Framework为操作图形提供的应用程序编程接口,主要用在窗体上绘制各种图形图像,可以用于绘制各种数据图像、数学仿真等。 Graphics类是G…...
Java如何权衡是使用无序的数组还是有序的数组
在 Java 中,选择有序数组还是无序数组取决于具体场景的性能需求与操作特点。以下是关键权衡因素及决策指南: ⚖️ 核心权衡维度 维度有序数组无序数组查询性能二分查找 O(log n) ✅线性扫描 O(n) ❌插入/删除需移位维护顺序 O(n) ❌直接操作尾部 O(1) ✅内存开销与无序数组相…...

CocosCreator 之 JavaScript/TypeScript和Java的相互交互
引擎版本: 3.8.1 语言: JavaScript/TypeScript、C、Java 环境:Window 参考:Java原生反射机制 您好,我是鹤九日! 回顾 在上篇文章中:CocosCreator Android项目接入UnityAds 广告SDK。 我们简单讲…...

ETLCloud可能遇到的问题有哪些?常见坑位解析
数据集成平台ETLCloud,主要用于支持数据的抽取(Extract)、转换(Transform)和加载(Load)过程。提供了一个简洁直观的界面,以便用户可以在不同的数据源之间轻松地进行数据迁移和转换。…...

微服务商城-商品微服务
数据表 CREATE TABLE product (id bigint(20) UNSIGNED NOT NULL AUTO_INCREMENT COMMENT 商品id,cateid smallint(6) UNSIGNED NOT NULL DEFAULT 0 COMMENT 类别Id,name varchar(100) NOT NULL DEFAULT COMMENT 商品名称,subtitle varchar(200) NOT NULL DEFAULT COMMENT 商…...
SQL慢可能是触发了ring buffer
简介 最近在进行 postgresql 性能排查的时候,发现 PG 在某一个时间并行执行的 SQL 变得特别慢。最后通过监控监观察到并行发起得时间 buffers_alloc 就急速上升,且低水位伴随在整个慢 SQL,一直是 buferIO 的等待事件,此时也没有其他会话的争抢。SQL 虽然不是高效 SQL ,但…...
JS手写代码篇----使用Promise封装AJAX请求
15、使用Promise封装AJAX请求 promise就有reject和resolve了,就不必写成功和失败的回调函数了 const BASEURL ./手写ajax/test.jsonfunction promiseAjax() {return new Promise((resolve, reject) > {const xhr new XMLHttpRequest();xhr.open("get&quo…...
jmeter聚合报告中参数详解
sample、average、min、max、90%line、95%line,99%line、Error错误率、吞吐量Thoughput、KB/sec每秒传输的数据量 sample(样本数) 表示测试中发送的请求数量,即测试执行了多少次请求。 单位,以个或者次数表示。 示例:…...
Spring AI Chat Memory 实战指南:Local 与 JDBC 存储集成
一个面向 Java 开发者的 Sring-Ai 示例工程项目,该项目是一个 Spring AI 快速入门的样例工程项目,旨在通过一些小的案例展示 Spring AI 框架的核心功能和使用方法。 项目采用模块化设计,每个模块都专注于特定的功能领域,便于学习和…...
【Elasticsearch】Elasticsearch 在大数据生态圈的地位 实践经验
Elasticsearch 在大数据生态圈的地位 & 实践经验 1.Elasticsearch 的优势1.1 Elasticsearch 解决的核心问题1.1.1 传统方案的短板1.1.2 Elasticsearch 的解决方案 1.2 与大数据组件的对比优势1.3 关键优势技术支撑1.4 Elasticsearch 的竞品1.4.1 全文搜索领域1.4.2 日志分析…...
uniapp 实现腾讯云IM群文件上传下载功能
UniApp 集成腾讯云IM实现群文件上传下载功能全攻略 一、功能背景与技术选型 在团队协作场景中,群文件共享是核心需求之一。本文将介绍如何基于腾讯云IMCOS,在uniapp中实现: 群内文件上传/下载文件元数据管理下载进度追踪跨平台文件预览 二…...