当前位置: 首页 > news >正文

跟ChatGPT,聊聊ChatGPT

不仅“上知天文、下知地理”,似乎还能对答如流、出口成诗,甚至还能写剧本、编音乐、写代码——最近,一款名叫ChatGPT的人工智能聊天机器人火爆全球。由此,一系列关于新一代技术变革、人工智能替代人力、巨头企业扎堆入局AI的讨论在互联网上甚嚣尘上,并引发资本市场跟进炒作。

然而,随着越来越多的用户实测结果不及预期,许多人也在重新审视ChatGPT是否真如想象中那么完美。热闹过后,也许是时候开始冷静思考,ChatGPT的发展模式面临哪些不可规避的问题和风险?这对我国人工智能发展有何重要启示?
在这里插入图片描述

ChatGPT 的“无所不能”和“无能为力”

问:“ChatGPT和其他聊天机器人有什么不同?”

答:“ChatGPT是一种先进的语言模型,具有更强的语言能力和知识范围,能够与用户进行更自然有效的对话。”
在这里插入图片描述
以上是人民网财经和ChatGPT的一组对话截图。

正如ChatGPT在回答人民网财经提问时所言,相较于此前科技企业推出的聊天机器人,ChatGPT在智能化程度上大幅提升,给对话者的感觉也“更聪明”。

2022年11月底,ChatGPT由美国一家名为OpenAI的人工智能研究公司推出,可以实现与用户之间的智能聊天对话,属于偏任务型的多轮对话和问答系统。

“ChatGPT的出现,是人工智能技术发展的一次飞跃。”传播内容认知全国重点实验室首席科学家张勇东表示,其在交互和创作方面展现的出色能力,标志人工智能由决策式向生成式转变。

中国信通院云计算与大数据研究所内容科技部副主任石霖介绍,ChatGPT的技术基于OpenAI开发的GPT3.5系列模型。该模型参数规模据推测达十亿级别,加之在训练过程中引入人类反馈机制技术,使得ChatGPT在回答准确率、道德表现上进一步得到提升。

近期,有研究发现,ChatGPT的“聪明”程度足以通过美国行医执照、研究生入学等考试。清华大学计算机科学与技术系教授黄民烈表示,目前ChatGPT的对话能力已超出人类平均水准,未来其能达到的类人对话水平值得期待。

不过,看似“无所不能”的ChatGPT,也会存在“无能为力”的尴尬。

如,目前ChatGPT难以进行高级逻辑处理。在完成“多准快全”的基本资料梳理和内容整合后,ChatGPT尚不能提供综合判断、修改调整、逻辑完善等“画龙点睛”之笔,而这恰恰是人类高级智慧的体现。

此外,用于ChatGPT语言模型训练的数据为2021年底前的数据,因此在一些最新的数据和事件方面它可能会存在滞后。这在一定程度上造成了ChatGPT在内容准确性和知识性上的短板。不少用户反映它经常“一本正经地胡说八道”。
在这里插入图片描述
ChatGPT在常识问题和算术题上出现错误,被网友戏称“一本正经地胡说八道”。

预训练“机器人”潜藏侵权风险和监管隐忧

以ChatGPT为代表的预训练模型“机器人”,在预训练过程中需要“投喂”海量数据,才能使得模型能够成功理解人类语言并模拟出愈加真实的类人表达方式。

据OpenAI的相关论文透露,ChatGPT的训练集使用了总计约320TB的文字信息,涵盖超4000亿词和约31亿个网页,其中包括来自新闻、博客、社交媒体的内容。

但这种未经授权获取文本数据的预训练方式已引发争议和不满。推特(Twitter)现任首席执行官埃隆·马斯克就于近日宣布,叫停ChatGPT访问Twitter数据库来获取培训数据,声称“需要更多了解OpenAI的治理结构和未来收入计划”。

无独有偶,近日,拥有国际性体育资源的盖蒂图片社对同为人工智能企业的Stability AI提起诉讼,指责其未经许可从其数据库中复制了1200多万张图片,用于建立竞争性业务,并侵犯了该公司的版权和商标保护权。
在这里插入图片描述
左图为盖蒂图片社原图,右图为人工智能生成的图像,其包含了盖蒂图片社的版权水印,侧面印证了人工智能在学习过程中误将水印理解成了图片的一部分。图片来源于网络

张勇东表示,类似ChatGPT这样的预训练模型,其训练数据往往来源于书籍、网站等,而其用于训练的语料未经授权,存在版权风险。且这种训练过程往往不对外公开,训练数据也不对外公布,因此版权拥有者并不知情。待模型完成后,生成的内容往往是原始训练数据的某种组合,对外服务过程中就会存在侵犯原始版权的问题。

“这点与搜索引擎的服务机制不同。搜索引擎只是提供原始内容的链接,但ChatGPT则是以自身生成内容的形式提供服务,甚至连模型自己都无法确认是参考或综合了哪些原始素材。”他说。

正因如此,对于人工智能生成内容不能全盘接收,要注意甄别风险、加强监管,正成为业界共识。

近日,OpenAI首席技术官米拉·穆拉蒂在接受媒体采访时坦言,和其他聊天机器人一样,ChatGPT可能会编造事实,也可能会被坏人利用,需要政府部门尽早介入进行监管。

“从长远来看,社会各界应该积极推动制定人工智能生成内容(AIGC)的规范标准。世界各国应该共同努力,基于海量数据研发生产出更加符合全人类道德价值标准的内容。”张勇东说。

他建议,要强化数据源头把控,尤其是对涉及隐私、伦理、道德、政治偏见和种族主义等内容,要进行更严格的数据审查和清洗。

石霖建议,应加快布局人工智能安全标准、伦理规则的研究,针对人工智能新技术可能带来的版权风险、内容风险等推动形成行业自律。同时,还应做好AIGC技术应用的科普工作,提升民众的科学素养和风险认识。

炒作“哑火”后思考行业长远发展

ChatGPT的爆红,让OpenAI赚到了第一桶金,也让各路资本争相入局。

2023年1月,微软再次宣布向 OpenAI 投资数十亿美元。据了解,这是目前人工智能领域规模最大的一笔投资。投资机构红杉资本预测,未来AIGC有潜力产生数万亿美元的经济价值。

连日来,A股市场也经历了人工智能概念股大幅波动。但随着监管函的下达,炒作现象逐渐开始“哑火”,更多关于人工智能行业长远发展的思考和理性声音正在出现。

针对人工智能将取代部分人类职业的网络讨论,张勇东直言,人工智能技术距离真正达到类人的程度还有很长一段路要走。目前以ChatGPT为代表的AIGC在逻辑性、可解释性和可溯源性方面都有待完善。

“国际上先进的人工智能发展都不是一蹴而就的,而是有迹可循、不断突破的。”人工智能企业智谱AI首席执行官张鹏表示,“ChatGPT的出现是否意味着人工智能已经‘踩’到了通用人工智能这一终极目标的‘门槛’,还需冷静看待。”

多位行业专家表示,可以预见的是,在“人机共生”的未来时代,人工智能确将解放人类、提高效率,但其身份是“助手”而非“主人”。

而针对ChatGPT爆火引发的对国内人工智能产业的质疑,也需要用更加全面的眼光来看待。

多年来,我国人工智能产业在生态完善、技术研发、应用推广、人才建设等方面不断培育优势:过去十年间专利申请量位居世界第一,核心产业规模超过4000亿元。国际市场分析机构Gartner在研究报告中指出,阿里巴巴、百度、腾讯等科技企业在语言AI技术上的排名进入世界前十位……

“ChatGPT的成功再次给我们提了个醒,人工智能的发展需要在基础研究和技术研发方面不懈坚持。”张鹏表示,过去我国人工智能产业对基础设施和技术的重视和投入不足。未来,如何发挥长处、补齐短板,真正实现我国人工智能领域的关键跃升,值得期待。

展望未来,石霖认为,以ChatGPT为代表的AIGC技术应用,将形成“智能底座+服务”的商业模式。AIGC技术应用还将进一步发挥在数据、算力和算法上构筑的技术壁垒优势,对人工智能的应用推广带来深层次变革。

他指出,AIGC技术应用正在软件代码编写、工业设计、分子结构预测、基因编辑等科研生产领域探索应用场景,帮助缩短研发周期、降低试验成本,也将改变软件、工业、医疗、生物等行业运行模式。

张勇东表示,过去十年,人工智能领域主要围绕更好的感知和理解来发展,比如自动驾驶、数字医疗。未来十年,人工智能领域深层技术有望不断突破,将具备重塑数字化内容生产和消费模式的强大潜力。

深度学习技术及应用国家工程研究中心主任、百度首席技术官王海峰认为,融合大规模知识的深度学习是人工智能发展的重要方向。要联合产学研各方力量,探索协同育人创新模式,建立全方位多层次的人工智能人才培养体系。

相关文章:

跟ChatGPT,聊聊ChatGPT

不仅“上知天文、下知地理”,似乎还能对答如流、出口成诗,甚至还能写剧本、编音乐、写代码——最近,一款名叫ChatGPT的人工智能聊天机器人火爆全球。由此,一系列关于新一代技术变革、人工智能替代人力、巨头企业扎堆入局AI的讨论在…...

Java 数组(详细教学 基础篇)

一、数组的基本要素 标识符:数组的名称数组元素:数组中存放的数据元素下标:对数组元素进行编号,数组下标从0开始来访问元素类型:数组元素的数据类型 二、数组的五种赋值方法和使用方法 声明数组 int[] arr;//开辟三个…...

python装饰器原理 | 常用装饰器使用(@cache, @lru_cache)

🚀 关于python的装饰器原理介绍可看这里,讲的挺简洁易懂:python装饰器原理 ⭐ 弄懂装饰器原理后,来学学常用装饰器。 文章目录1、cache, lru_cache1、cache, lru_cache 也就是一种装饰在被执行的函数上,将其执行的结果…...

[oeasy]python0090_极客起源_wozniac_苹果公司_Jobs_Wozniac

极客起源 回忆上次内容 上次回顾了 DEC公司的兴起 从IBM的大型机 到DEC的小型机Mini Computer 再到DEC的终端 VT-100 计算机基础元器件发生了进化 从ENIAC的 电子管到PDP系列的 晶体管 新的器件 体积小了价格低了稳定性 提高了而且 连成了网络 ARPA网 就是 最初的Internet …...

Spring基础总结(下)

简介 本章节通过手写一个简单的 Spring 框架来加深对 Spring 框架源码以及设计思想的理解; 实现步骤 BeanScope 枚举代码 public enum BeanScope { sigleton, prototype; }AppConfig 配置类 // 定义包扫描路径 ComponentScan("com.dufu.spring"…...

设计模式面试题

设计模式分为 创建型 工厂模式 单例 原型行为性 责任链 迭代器 命令中介型结构性 适配器 代理 门面 装饰器 组合 桥接单例设计模式 懒汉式 用到时再创建,省内存 饿汉式 类创建时就创建,会占用内存 内部类 用到时再创建,省内存 线程池、数据…...

需要知道的一些API接口的基础知识

API是应用程序编程接口(Application Programming Interface)的缩写,能够起到两个软件组件之间的连接器或中介的作用。此类接口往往通过一组明确的协议,来表示各种原始的请求和响应。API文档可以向开发人员展示请求和响应是如何形成…...

互融云数字资产管理平台综合解决方案

自十八大以来,发展数字经济逐步成为了国家战略。从2015年国务院印发《促进大数据发展行动纲要》,到2020年4月中央发布《关于构建更加完善的要素市场化配置体制机制的意见》,再到2022年底出台《中共中央、国务院关于构建数据基础制度更好发挥数…...

记住这12个要点,你也能打造出让HR和技术主管前一亮的前端简历

第一篇章:吸引HR 如果你想在众多简历中脱颖而出,需要注意以下几点: 1、突出你的亮点: 给你的简历一个吸引人的文件命名和头部,突出你的关键技能和经验。 2、采用简洁的语言: 用简单易懂的语言来描述你的…...

AQS学习:ReentrantLock源码解析

前言 多线程知识中理解了ReentrantLock之后,对于整个AQS也会有大概的理解,后面再去看其它锁的源码就会比较容易。下面带大家一块来学习ReentrantLock源码。 概述 ReentrantLock是可重入的互斥锁,虽然具有与synchronized相同功能&#xff0…...

RocketMQ源码分析消息消费机制—-消费端消息负载均衡机制与重新分布

1、消息消费需要解决的问题 首先再次重复啰嗦一下 RocketMQ 消息消费的一些基本元素的关系 主题 —》 消息队列(MessageQueue) 1 对多。 主题 —》 消息生产者,一般主题会由多个生产者组成,生产者组。 主题 —》 消息消费者,一般一个主题…...

华为OD机试真题Python实现【数据分类】真题+解题思路+代码(20222023)

数据分类 题目 对一个数据a进行分类, 分类方法是,此数据a(4 个字节大小)的 4 个字节相加对一个给定值b取模, 如果得到的结果小于一个给定的值c则数据a为有效类型,其类型为取模的值。 如果得到的结果大于或者等于c则数据a为无效类型。 比如一个数据a = 0x01010101,b = 3…...

vue项目中引入字体包

问题: 项目开发过程中,因UI的显示要求,需要引入一些字体,那如何引入外部字体呢?很简单,只需要以下3步 一 下载对应的字体包文件,放置到我们的项目中 ​ 比如我需要PingFangSC的系列字体&#…...

Linux 文件相关操作

文件相关操作 编辑文件 命令: vi 文件名 然后输入i进入编辑模式 编辑完成后输入esc退出编辑 输入:wq保存即便目录下没有这个文件,也可以想使用vi 文件名进行编辑,保存退出后会创建这个文件 查看文件内容 命令: cat 文件名复…...

【计算机网络】应用题方法总结

0.前言本篇博客主要记录自己在学习到的部分解决计算机网络应用题方法,主要参考视频如下:计算机网络期末复习 应用题_哔哩哔哩_bilibili【计算机网络】子网划分题型总结_哔哩哔哩_bilibili循环冗余码step 1:确定冗余码长度。多项式最高位即为冗…...

Linux 浅谈之性能分析工具 perf

Linux 浅谈之性能分析工具 perf HELLO,各位博友好,我是阿呆 🙈🙈🙈 这里是 Linux 浅谈系列,收录在操作系统专栏中 😜😜😜 本系列将记录一些阿呆个人整理的 OS 相关知识…...

代码随想录-Day7:四数相加、三数之和

454. 四数相加 II 给你四个整数数组 nums1、nums2、nums3 和 nums4 &#xff0c;数组长度都是 n &#xff0c;请你计算有多少个元组 (i, j, k, l) 能满足&#xff1a; 0 < i, j, k, l < nnums1[i] nums2[j] nums3[k] nums4[l] 0示例 1&#xff1a; 输入&#xff1…...

jsp在线考试系统Myeclipse开发mysql数据库web结构java编程计算机网页项目

一、源码特点 jsp 在线考试系统 是一套完善的web设计系统&#xff0c;对理解JSP java编程开发语言有帮助&#xff0c;系统具有完整的源代码和数据库&#xff0c;系统主要采用B/S模式开发。开发环境为TOMCAT7.0,Myeclipse8.5 开发&#xff0c;数据库为Mysql&#xff0c;使用j…...

【总结】2023数学建模美赛!收官!

今年的美赛时间是2.17-2.21&#xff0c;这学期疫情放开了之后管的没那么严了&#xff0c;我们小组就都提前一天到学校了&#xff0c;全力准备17号的比赛。 时间流程 刚拿到6个题的时候&#xff0c;我们三个人一人看两个题&#xff0c;每个人从两个题中再选出来一个自己觉得有…...

C# GDI+ winform绘图知识总结

一、Graphics GDI是GDI&#xff08;Windows Graphics Device Interface&#xff09;的后继者&#xff0c;它是.NET Framework为操作图形提供的应用程序编程接口&#xff0c;主要用在窗体上绘制各种图形图像&#xff0c;可以用于绘制各种数据图像、数学仿真等。 Graphics类是G…...

【研究空间复用及函数调用问题】

本篇总结函数调用过程会存在的一些奇怪现象&#xff0c;空间复用问题&#xff0c;其实本质上涉及函数调用的底层原理&#xff0c;理解函数栈帧的创建和销毁这样的问题直接迎刃而解。1.空间复用问题案例1案例22.函数调用过程不清晰问题案例33.总结1.空间复用问题 案例1 我们先…...

SQL常用查询语句

SELECT语句用于查询数据库中的内容 目录 1 查询指定表的所有内容 2 显示所有行的指定列 3 显示指定行的指定列 4 对查询结果进行排序 4.1 按照单一字段排序 4.2 多重排序 5 查询数据总数 5.1 查询一共有多少行 5.2 统计符合条件的有多少行 6 给查询出来的…...

【Python实战】一大波高颜值主播来袭:快看,某网站颜值排名,为了这个排名我可是大费周章啦,第一名不亏是你...(人脸检测+爬虫实战)

导语 民间一直有个传闻......「听说某站的小哥哥小姐姐颜值都很高哦&#xff01;」 &#xff08;不是颜值高才能加入&#xff0c;是优秀的人恰好颜值高&#xff09; 所有文章完整的素材源码都在&#x1f447;&#x1f447; 粉丝白嫖源码福利&#xff0c;请移步至CSDN社区或文末…...

Linux进程学习【三】

✨个人主页&#xff1a; Yohifo &#x1f389;所属专栏&#xff1a; Linux学习之旅 &#x1f38a;每篇一句&#xff1a; 图片来源 &#x1f383;操作环境&#xff1a; CentOS 7.6 阿里云远程服务器 Perseverance is not a long race; it is many short races one after another…...

Spring自动装配的底层逻辑

Spring是如何自动装配Bean的&#xff1f;看源码一些自己的理解&#xff0c;如有错漏&#xff0c;请指正 使用Spring之前我们要先去web.xml中设置一下Spring的配置文件&#xff0c;在Spring的配置文件中&#xff0c;是通过component-scan扫描器去扫描base-package底下所有的类装…...

华为OD机试 - 数组合并(C++) | 附带编码思路 【2023】

刷算法题之前必看 参加华为od机试,一定要注意不要完全背诵代码,需要理解之后模仿写出,通过率才会高。 华为 OD 清单查看地址:https://blog.csdn.net/hihell/category_12199283.html 华为OD详细说明:https://dream.blog.csdn.net/article/details/128980730 华为OD机试题…...

在vue3+ts的项目中,如何解决vant组件自带表单校验不生效?

问题描述&#xff1a; 点击发送验证码后&#xff0c;为了让逻辑更加严谨&#xff0c;使用了vant组件自带的表单校验&#xff0c;进行二次校验&#xff0c;防止验证码发送成功后&#xff0c;登录手机号被二次修改&#xff0c;但根据官网描述cv之后不生效&#xff0c;甚至连获取…...

华为OD机试真题Python实现【子序列长度】真题+解题思路+代码(20222023)

子序列长度 题目 有 N 个正整数组成的一个序列 给定一个整数sum 求长度最长的的连续子序列使他们的和等于sum 返回次子序列的长度 如果没有满足要求的序列 返回-1 🔥🔥🔥🔥🔥👉👉👉👉👉👉 华为OD机试(Python)真题目录汇总 ## 输入 两行输入 第一行…...

【答疑现场】我一个搞嵌入式的,有必要学习Python吗?

【答疑现场】我一个搞嵌入式的&#xff0c;有必要学习Python吗&#xff1f; 文章目录1 写在前面2 一个结论3 Python在嵌入式领域能干啥事4 Python是用来干大事的5 友情推荐6 福利活动大家好&#xff0c;我是架构师李肯&#xff0c;一个专注于嵌入式物联网系统架构设计的攻城狮。…...

MySQL存表报错问题 Incorrect string value

MySQL存表报错问题 Incorrect string value 问题 Incorrect string value: ‘\xF0\xA8\xA5\xA5\xE5\xAD…’ for column ‘xxxxxxx’ at row 1 意思是错误的字符&#xff0c;常出现在添加中文字符的时候。这个问题的产生原因主要是因为一些特色中文字符或者Emoji表情占4个字…...