ChatGPT能够干翻谷歌吗?
目前大多数人对于ChatGPT的喜爱,主要源自于其强大的沟通能力,当我们向ChatGPT提出问题时,它不仅能够为我们提供结论,而且还能够与我们建立沟通,向ChatGPT提出任何问题,感觉都像是在与一个真实的人类进行交谈。
在ChatGPT发布前夕,谷歌人工智能实验室——谷歌大脑(Google Brain)的负责人Zoubin Ghahramani还曾公开表示:“聊天机器人并不是人们每天都能可靠地使用的东西。”然而Zoubin Ghahramani一定没有想到,“打脸”居然来的如此之快。就在其发表言论的几周之后,几乎全世界都在使用和讨论ChatGPT。
自11月底发布以来,ChatGPT迅速火遍全网,仅一周之内便拥有了超100万的用户量。如今,ChatGPT已经成为了有史以来全球用户数量最多的LLM(大型语言模型)聊天机器人。且由于ChatGPT在信息搜索模式上的创新,目前不少ChatGPT的拥护者为其披上了“谷歌杀手”的外衣,认为ChatGPT将能够在短时间内颠覆传统的信息搜索模式,进而取代谷歌在信息检索领域的统治地位。
那么,事实是否真如广大ChatGPT的粉丝所言?ChatGPT目前是否已具备挑战搜索引擎的能力;谷歌这位制霸搜索领域数十年的科技巨人又是否真的像ChatGPT粉丝们所认为的那样不堪一击呢?
1、ChatGPT的蜜糖与毒药
目前大多数人对于ChatGPT的喜爱,主要源自于其强大的沟通能力,当我们向ChatGPT提出问题时,它不仅能够为我们提供结论,而且还能够与我们建立沟通,向ChatGPT提出任何问题,感觉都像是在与一个真实的人类进行交谈。这的确是聊天机器人相比于搜索引擎的一大优势,以聊天形式进行答案的输出,远比搜索引擎一行行的网址要来的直接与亲切。
但是在硬币的另一面,ChatGPT在信息搜索方面却也存在着回答不可靠、易受外界影响以及伪造信息三大问题。
首先,ChatGPT的回答并不总是可靠的,其经常会在推理以及事实上犯错误。其次,ChatGPT容易受到外界信息的影响。在ChatGPT的独特特征中,最主要的便是学习能力,模型能够记住此前与其他用户的对话内容,并将其进行复述。这也导致了用户将能够非常轻易地干预ChatGPT对于问题的判断与回答。最近Stack Overflow论坛禁止了ChatGPT创建的所有答案,其理由便是由于ChatGPT对于大量问题都提供了从用户那里学习到的错误示例。
此外,在面对某些模糊问题或是论述性问题时,ChatGPT为了能够使其回答更具有信服力,似乎选择了对其生成的部分内容进行造假。例如当ChatGPT在引用各类社交媒体中专家对于特定问题的答复时,有时会对文本内容进行修改,或是将A的言论或事件匹配至B的名下。在这方面最典型的一个例子便是,当一位记者要求ChatGPT撰写一篇微软季度收益的文章时,ChatGPT为了增加文章的可信度,将微软首席执行官Satya Nadella的一次报价进行了伪造。
由此可见,虽然ChatGPT目前已经通过创新性的问答模式在信息检索方面取得了的一定影响力与大量的关注度,但在信息供给的准确性和可靠性方面,ChatGPT仍存在着一些明显的缺陷,这与搜索引擎的定位及目标显然是背道而驰的。且由于ChatGPT的设计初衷是用以对话式问答以及模拟人类的对话行为,ChatGPT在面对某些关键词检索场景时,虽然能够给出一定的解释,但却无法为用户提供足够有帮助的增量信息。因此,对于目前ChatGPT的定位与能力而言,想要挑战谷歌甚至于完全取代搜索引擎,显然还不是一件现实的事情。
2、谷歌的布局与取舍
反观谷歌,其实早在ChatGPT推出之前,这位巨人就已经参与了大量LLM项目的研发,其中最为著名的项目,便是几个月前被谷歌工程师称为“已具备人类感情”的LaMDA聊天机器人。那么,与目前大红大紫的ChatGPT相比,谷歌一直有意藏其锋芒的LaMDA的又表现如何呢?
作为谷歌现阶段最为成熟的对话式语言模型,LaMDA由1370亿个参数组成,并根据1.56TB的公开可用对话数据和web文档进行训练。另一方面,ChatGPT基于GPT-3.5架构,具有1750亿个参数,通过对人类书写文本的演示和由人类标注员在总体质量分数上所评定的样本进行有监督微调训练。
初看之下,LaMDA与ChatGPT在参数量及训练方式上的差别并不明显,但在具体的使用体验方面,二者却表现出了各自不同的特点。Scale AI的研究员Riley Goodside曾在一篇博客中表示:在面对相同问题时,ChatGPT往往能够给出较为明确地回应,但LaMDA所给出的回复表述形式更加友好,且更接近人类的语言模式。这可能与LaMDA接受对话训练直接相关,而ChatGPT则是在网络文本方面接受了更多的训练。
因此,尽管LaMDA自身也存在着一些漏洞,但在实际应用层面,如果谷歌希望使用LaMDA与ChatGPT进行竞争,二者之间的胜败还真犹未可知。而谷歌之所以至今还未对外发布LaMDA,也主要是出于对公司声誉的考虑。谷歌AI负责人Jeff Dean也曾在12月中旬的一次内部会议中声称:谷歌目前拥有做AI产品与技术的能力,但比起中小型公司,他们必须更加保守的做出一些决策。
在谈到谷歌AI时,Jeff Dean表示:聊天机器人很容易受到偏见和虚假信息的影响,而谷歌是一家拥有超过十亿用户的大企业,就更不容易摆脱这种影响。我们当然非常希望将这些技术使用到真正的产品当中,尤其是利用更加优秀的语言模型,但更重要的是,我们要做正确的事情。除此之外,值得我们注意的是,谷歌也于近期对内部团队的工作进行了调整,加强了对于AI技术及产品的研发支持。从以上的动作我们也不难看出,谷歌对于正面应对ChatGPT所带来的一些挑战还是非常有信心的。
3、融合或成新的机遇
归根结底,将聊天机器人与搜索引擎进行比较本就是一个伪命题。ChatGPT的价值在于,其能够模拟真人的“思考”行为,并通过交谈的方式运用其所学的知识回答我们的一些问题,或是完成具有创造性的简单的写作任务。而对搜索引擎而言,其主要职责则是为人们快速且精准地提供所需信息。其二者之间所存在的壁垒并非通过技术手段便能够实现有效弥合。
而对于二者未来的发展趋势,不少业内专家也给出了几乎趋于一致的看法,也就是ChatGPT类对话机器人将在未来与搜索引擎形成1+1>2的“共生”关系,成为搜索引擎新的入口。在这种全新模态下,人们或将能够通过语音或是文本的形式与搜索引擎进行直接的对话沟通,而搜索引擎也能够借助对话式机器人的理解与认知为人们从海量数据中快速总结出更具精度和符合偏好的搜索结果,帮助人们节省在信息搜索上的操作步骤,使人们整个搜索流程的效率得到极大地优化。
如此看来,尽管目前ChatGPT与谷歌表面上形成了一定的对立,但这种趋势更多的是出于对利益的考虑。相信随着时间的推移以及技术的持续演进,二者眼前的矛盾将会逐渐烟消云散。
相关文章:

ChatGPT能够干翻谷歌吗?
目前大多数人对于ChatGPT的喜爱,主要源自于其强大的沟通能力,当我们向ChatGPT提出问题时,它不仅能够为我们提供结论,而且还能够与我们建立沟通,向ChatGPT提出任何问题,感觉都像是在与一个真实的人类进行交谈…...

PCL 使用点云创建数字高程模型DEM
目录 一、DEM1、数字高程模型二、代码实现三、结果展示1、点云2、DEM四、相关链接一、DEM 1、数字高程模型 数字高程模型(Digital Elevation Model),简称DEM,是通过有限的地形高程数据实现对地面地形的数字化模拟(即地形表面形态的数字化表达),它是用一组有序数值阵列形…...

我体验了首个接入GPT-4的代码编辑器,太炸裂了
最近一款名为Cursor的代码编辑器已经传遍了圈内,受到众多编程爱好者的追捧。 它主打的亮点就是,通过 GPT-4 来辅助你编程,完成 AI 智能生成代码、修改 Bug、生成测试等操作。 确实很吸引人,而且貌似也能大大节省人为的重复工作&…...

互联网数据挖掘与分析讲解
一、定义 数据挖掘(英语:Data mining),又译为资料探勘、数据采矿。它是数据库知识发现(英语:Knowledge-Discovery in Databases,简称:KDD)中的一个步骤。数据挖掘一般是指从大量的数…...

linux之cut的使用
cut是一个选取命令,就是将一段数据经过分析,取出我们想要的。一般来说,选取信息通常是针对“行”来进行分析的,并不是整篇信息分析的 其语法格式为: cut [-bn] [file] 或 cut [-c][file] 或 cut [-df] [file]使用说明:…...

Redis第十讲 Redis之Hash数据结构Dict-rehash扩容操作
Rehash 执行过程 字典的 rehash 操作实际上就是执行以下任务: 创建一个比 ht[0]->table 更大的 ht[1]->table ;将 ht[0]->table 中的所有键值对迁移到 ht[1]->table ;将原有 ht[0] 的数据清空,并将 ht[1] 替换为新的 ht[0] ; 经过以上步骤之后, 程序就在不改…...

电动力学问题中的Matlab可视化
电磁场的经典描述 小说一则 电磁场的经典描述就是没有啥玩意量子力学的经典电动力学下对电磁场的描述,以后有空写个科幻小说,写啥呢,就写有天张三遇见了一个外星人,外星人来自这样一个星球,星球上的物质密度特别低,导致外星人的测量会明显的影响物质的运动,外星人不能同时得到…...

云原生周刊:编程即将终结?
近日哈佛大学计算机科学的前教授 Matt Welsh,分享了他对计算机科学、分布式计算的未来以及 ChatGPT 和 GitHub Copilot 是否代表编程结束的开始的看法。 威尔士说,编程语言仍然很复杂。再多的工作也无法让它变得简单。 “在我看来,任何改进…...

C++ STL,resize 和 reserve 的区别
结论放前边:resize和reserve都可以给容器扩容,区别在于resize会进行填充,使容器处于满员的状态,即sizecapacity,而reserve不会填充,有size<capacity. 1. size 和 capacity 的区别 size和capacity是容器…...

Java——详解ReentrantLock与AQS的关联以及AQS的数据结构和同步状态State
前言 Java中大部分同步类(Lock、Semaphore、ReentrantLock等)都是基于AbstractQueuedSynchronizer(简称为 AQS)实现的。 AQS 是一种提供了原子式管理同步状态、阻塞和唤醒线程功能以及队列模型的简单框架。 本文会先介绍应用层&a…...

vue3+vite+ts 接入QQ登录
说明 前提资料准备 在QQ互联中心注册成为开发者 站点:https://connect.qq.com/创建应用,如图 js sdk方式 下载对应的sdk包 sdk下载:https://wiki.connect.qq.com/sdk%e4%b8%8b%e8%bd%bd 使用 下载离线js sdk 打开:https:…...

消息队列kafka及zookeeper机制
目录 一、zookeeper 1、zookeeper简介 2、zookeeper特点 3、zookeeper工作模式及机制 4、zookeeper应用场景及选举机制 5、zookeeper集群部署 ①实验环境 ②安装zookeeper 二、消息队列kafka 1、为什么要有消息队列 2、使用消息队列的好处 3、kafka简介 4、kafka…...

分布式 - 分布式体系架构:IT架构的演进过程
文章目录01. 应用与数据一体模式02. 应用服务和数据服务的分离03. 缓存与性能的提升04. 服务器集群处理并发05. 数据库读写分离06. 反向代理和 CDN07. 分布式文件系统和分布式数据库系统08. NoSQL和搜索引擎09. 业务拆分10. Redis缓存在应用服务器上是进程内缓存还是进程外缓存…...

CSDN 周赛42期
CSDN 周赛42期1、题目名称:鬼画符门之宗门大比2、题目名称:K皇把妹3、题目名称:影分身4、题目名称:开心的金明小结1、题目名称:鬼画符门之宗门大比 给定整数序列A。 求在整数序列A中连续权值最大的子序列的权值。 &…...

Vue:初识Vue
1、首先要导入vue.js <!-- 当你使用script标签安装vue之后,上下文就注册了一个全局变量vue --><script src"../1.Vue/js/vue.js"></script> 不能直接调用vue(),需要new vue(),否则会报错。 2、关于vue构造函数的参数opti…...

linux语言学习记录
文章目录前言一、linux文件结构二、指令三、Gvim编辑器1、命令模式2、底行命令四、正则表达式1、表达式匹配举例2、对文件里面内容进行操作3、使用 \( 和 )\ 符号括起正规表达式,即可在后面使用\1和\2等变量来访问和中的内容前言 记录自己学习linux的笔记ÿ…...

面向对象编程(进阶)7:面向对象特征三:多态性
一千个读者眼中有一千个哈姆雷特。 目录 7.1 多态的形式和体现 7.1.1 对象的多态性 举例: 7.1.2 多态的理解 7.1.3 举例 1、方法内局部变量的赋值体现多态 2、方法的形参声明体现多态 3、方法返回值类型体现多态 7.2 为什么需要多态性(polymorphism)&#x…...

vue尚品汇商城项目-day04【29.加入购物车操作(难点)】
文章目录29.加入购物车操作(难点)29.1加入购物车按钮29.2addCartSuce29.3购物车29.3.1 向服务器发送ajax请求,获取购物车数据29.3.2UUID临时游客身份29.3.3动态展示购物车29.4修改购物车产品的数量(需要发请求:参数理解…...

KubeSphere 社区双周报 | 4.8 深圳站 Meetup 火热报名中 | 2023.3.17-3.30
KubeSphere 社区双周报主要整理展示新增的贡献者名单和证书、新增的讲师证书以及两周内提交过 commit 的贡献者,并对近期重要的 PR 进行解析,同时还包含了线上/线下活动和布道推广等一系列社区动态。 本次双周报涵盖时间为:2023.03.17-2023.…...

ChatGPT热炒之前 搜索引擎SEO算法已经悄然改变
2022年4月起,某度算法有了新的调整,这对于靠SEO获得流量的公司简直可以说是灭顶之灾。原本SEO从业者还指望跟之前一样,等算法调整稳定后,网站的自然排名还会再回来,但等到了10月份,仍然没有回暖的迹象&…...

【Linux】Mysql之视图的基本操作
一、什么是视图 MySQL 视图(View)是一种虚拟存在的表,同真实表一样,视图也由列和行构成, 但视图并不实际存在于数据库中。行和列的数据来自于定义视图的查询中所使用的 表,并且还是在使用视图时动态生成的。…...

《扬帆优配》西藏地震!美史上最严排放新规将出台,美股收涨
当地时间周四,美股遍及收高,科技股领涨。因耶稣受难日,美股4月7日(周五)休市,周四为美股本周最终一个买卖日,从本周状况来看,纳指与标普500指数均录得跌幅,别离跌1.1%和0…...

Python 小型项目大全 66~70
六十六、简单替换密码 原文:http://inventwithpython.com/bigbookpython/project66.html 简单替换密码用一个字母代替另一个字母。由于字母A有 26 种可能的替换,B有 25 种可能的替换,C有 24 种可能的替换,等等,所以可能…...

Barra模型因子的构建及应用系列八之Earning_Yeild因子
一、摘要 在前期的Barra模型系列文章中,我们构建了Size因子、Beta因子、Momentum因子、Residual Volatility因子、NonLinear Size因子、Book-to-Price因子和Liquidity因子,并分别创建了对应的单因子策略,其中Size因子和NonLinear Siz因子具有…...

2022蓝桥杯省赛——卡片
问题描述 小蓝有 k 种卡片, 一个班有 n 位同学, 小蓝给每位同学发了两张卡片, 一位同学的两张卡片可能是同一种, 也可能是不同种, 两张卡片没有顺序。没有两位同学的卡片都是一样的。 给定 n, 请问小蓝的卡片至少有多少种? 输入格式 输入一行包含一个正整数表示 n 。 输出…...

数据结构-快速排序
一.概要 快速排序是一种基于分治思想的排序算法,其基本思路是选取一个基准值(pivot),通过一趟排序将待排序列分成两个部分,其中左半部分都小于基准值,右半部分都大于基准值,然后对左右两部分分…...

WuThreat身份安全云-TVD每日漏洞情报-2023-04-10
漏洞名称:Apple iOS/iPadOS 越界写入 漏洞级别:高危 漏洞编号:CVE-2023-28206 相关涉及:Apple iOS <16.4.0 漏洞状态:在野 参考链接:https://tvd.wuthreat.com/#/listDetail?TVD_IDTVD-2023-08810 漏洞名称:PHPGurukul Bank Locker Management System SQL 注入 漏洞级别:高…...

IDEA中查看源码点击Download Sources时出现Cannot download sources的问题复现及解决
IDEA中查看源码点击Download Sources时出现Cannot download sources的问题复现及解决 注意:实验环境的IDEA版本:2021.3.1 1、问题描述 1.1、当想看源码时,点击Download Sources 1.2、此时出现了Cannot download sources 2、解决办法 2.1、…...

R+VIC模型融合实践技术应用及未来气候变化模型预测/SWAT/HSPF/HEC-HMS
在气候变化问题日益严重的今天,水文模型在防洪规划,未来预测等方面发挥着不可替代的重要作用。目前,无论是工程实践或是科学研究中都存在很多著名的水文模型如SWAT/HSPF/HEC-HMS等。虽然,这些软件有各自的优点;但是&am…...

Python 02 数据类型(04元组)
一、元组 元组和列表的唯一不同:不能直接对元组的元素进行修改,删除,添加。 不能修改 1.1 创建元组 1.1.1 创建一个空元组 touple1() # ‘() 里面没有元素,表示为空元组 1.1.2 元组可以容纳任意数据类型的数据的有序集合&…...