ChatGPT能够干翻谷歌吗?
目前大多数人对于ChatGPT的喜爱,主要源自于其强大的沟通能力,当我们向ChatGPT提出问题时,它不仅能够为我们提供结论,而且还能够与我们建立沟通,向ChatGPT提出任何问题,感觉都像是在与一个真实的人类进行交谈。
在ChatGPT发布前夕,谷歌人工智能实验室——谷歌大脑(Google Brain)的负责人Zoubin Ghahramani还曾公开表示:“聊天机器人并不是人们每天都能可靠地使用的东西。”然而Zoubin Ghahramani一定没有想到,“打脸”居然来的如此之快。就在其发表言论的几周之后,几乎全世界都在使用和讨论ChatGPT。
自11月底发布以来,ChatGPT迅速火遍全网,仅一周之内便拥有了超100万的用户量。如今,ChatGPT已经成为了有史以来全球用户数量最多的LLM(大型语言模型)聊天机器人。且由于ChatGPT在信息搜索模式上的创新,目前不少ChatGPT的拥护者为其披上了“谷歌杀手”的外衣,认为ChatGPT将能够在短时间内颠覆传统的信息搜索模式,进而取代谷歌在信息检索领域的统治地位。
那么,事实是否真如广大ChatGPT的粉丝所言?ChatGPT目前是否已具备挑战搜索引擎的能力;谷歌这位制霸搜索领域数十年的科技巨人又是否真的像ChatGPT粉丝们所认为的那样不堪一击呢?
1、ChatGPT的蜜糖与毒药
目前大多数人对于ChatGPT的喜爱,主要源自于其强大的沟通能力,当我们向ChatGPT提出问题时,它不仅能够为我们提供结论,而且还能够与我们建立沟通,向ChatGPT提出任何问题,感觉都像是在与一个真实的人类进行交谈。这的确是聊天机器人相比于搜索引擎的一大优势,以聊天形式进行答案的输出,远比搜索引擎一行行的网址要来的直接与亲切。
但是在硬币的另一面,ChatGPT在信息搜索方面却也存在着回答不可靠、易受外界影响以及伪造信息三大问题。
首先,ChatGPT的回答并不总是可靠的,其经常会在推理以及事实上犯错误。其次,ChatGPT容易受到外界信息的影响。在ChatGPT的独特特征中,最主要的便是学习能力,模型能够记住此前与其他用户的对话内容,并将其进行复述。这也导致了用户将能够非常轻易地干预ChatGPT对于问题的判断与回答。最近Stack Overflow论坛禁止了ChatGPT创建的所有答案,其理由便是由于ChatGPT对于大量问题都提供了从用户那里学习到的错误示例。
此外,在面对某些模糊问题或是论述性问题时,ChatGPT为了能够使其回答更具有信服力,似乎选择了对其生成的部分内容进行造假。例如当ChatGPT在引用各类社交媒体中专家对于特定问题的答复时,有时会对文本内容进行修改,或是将A的言论或事件匹配至B的名下。在这方面最典型的一个例子便是,当一位记者要求ChatGPT撰写一篇微软季度收益的文章时,ChatGPT为了增加文章的可信度,将微软首席执行官Satya Nadella的一次报价进行了伪造。
由此可见,虽然ChatGPT目前已经通过创新性的问答模式在信息检索方面取得了的一定影响力与大量的关注度,但在信息供给的准确性和可靠性方面,ChatGPT仍存在着一些明显的缺陷,这与搜索引擎的定位及目标显然是背道而驰的。且由于ChatGPT的设计初衷是用以对话式问答以及模拟人类的对话行为,ChatGPT在面对某些关键词检索场景时,虽然能够给出一定的解释,但却无法为用户提供足够有帮助的增量信息。因此,对于目前ChatGPT的定位与能力而言,想要挑战谷歌甚至于完全取代搜索引擎,显然还不是一件现实的事情。
2、谷歌的布局与取舍
反观谷歌,其实早在ChatGPT推出之前,这位巨人就已经参与了大量LLM项目的研发,其中最为著名的项目,便是几个月前被谷歌工程师称为“已具备人类感情”的LaMDA聊天机器人。那么,与目前大红大紫的ChatGPT相比,谷歌一直有意藏其锋芒的LaMDA的又表现如何呢?
作为谷歌现阶段最为成熟的对话式语言模型,LaMDA由1370亿个参数组成,并根据1.56TB的公开可用对话数据和web文档进行训练。另一方面,ChatGPT基于GPT-3.5架构,具有1750亿个参数,通过对人类书写文本的演示和由人类标注员在总体质量分数上所评定的样本进行有监督微调训练。
初看之下,LaMDA与ChatGPT在参数量及训练方式上的差别并不明显,但在具体的使用体验方面,二者却表现出了各自不同的特点。Scale AI的研究员Riley Goodside曾在一篇博客中表示:在面对相同问题时,ChatGPT往往能够给出较为明确地回应,但LaMDA所给出的回复表述形式更加友好,且更接近人类的语言模式。这可能与LaMDA接受对话训练直接相关,而ChatGPT则是在网络文本方面接受了更多的训练。
因此,尽管LaMDA自身也存在着一些漏洞,但在实际应用层面,如果谷歌希望使用LaMDA与ChatGPT进行竞争,二者之间的胜败还真犹未可知。而谷歌之所以至今还未对外发布LaMDA,也主要是出于对公司声誉的考虑。谷歌AI负责人Jeff Dean也曾在12月中旬的一次内部会议中声称:谷歌目前拥有做AI产品与技术的能力,但比起中小型公司,他们必须更加保守的做出一些决策。
在谈到谷歌AI时,Jeff Dean表示:聊天机器人很容易受到偏见和虚假信息的影响,而谷歌是一家拥有超过十亿用户的大企业,就更不容易摆脱这种影响。我们当然非常希望将这些技术使用到真正的产品当中,尤其是利用更加优秀的语言模型,但更重要的是,我们要做正确的事情。除此之外,值得我们注意的是,谷歌也于近期对内部团队的工作进行了调整,加强了对于AI技术及产品的研发支持。从以上的动作我们也不难看出,谷歌对于正面应对ChatGPT所带来的一些挑战还是非常有信心的。
3、融合或成新的机遇
归根结底,将聊天机器人与搜索引擎进行比较本就是一个伪命题。ChatGPT的价值在于,其能够模拟真人的“思考”行为,并通过交谈的方式运用其所学的知识回答我们的一些问题,或是完成具有创造性的简单的写作任务。而对搜索引擎而言,其主要职责则是为人们快速且精准地提供所需信息。其二者之间所存在的壁垒并非通过技术手段便能够实现有效弥合。
而对于二者未来的发展趋势,不少业内专家也给出了几乎趋于一致的看法,也就是ChatGPT类对话机器人将在未来与搜索引擎形成1+1>2的“共生”关系,成为搜索引擎新的入口。在这种全新模态下,人们或将能够通过语音或是文本的形式与搜索引擎进行直接的对话沟通,而搜索引擎也能够借助对话式机器人的理解与认知为人们从海量数据中快速总结出更具精度和符合偏好的搜索结果,帮助人们节省在信息搜索上的操作步骤,使人们整个搜索流程的效率得到极大地优化。
如此看来,尽管目前ChatGPT与谷歌表面上形成了一定的对立,但这种趋势更多的是出于对利益的考虑。相信随着时间的推移以及技术的持续演进,二者眼前的矛盾将会逐渐烟消云散。
相关文章:

ChatGPT能够干翻谷歌吗?
目前大多数人对于ChatGPT的喜爱,主要源自于其强大的沟通能力,当我们向ChatGPT提出问题时,它不仅能够为我们提供结论,而且还能够与我们建立沟通,向ChatGPT提出任何问题,感觉都像是在与一个真实的人类进行交谈…...
PCL 使用点云创建数字高程模型DEM
目录 一、DEM1、数字高程模型二、代码实现三、结果展示1、点云2、DEM四、相关链接一、DEM 1、数字高程模型 数字高程模型(Digital Elevation Model),简称DEM,是通过有限的地形高程数据实现对地面地形的数字化模拟(即地形表面形态的数字化表达),它是用一组有序数值阵列形…...

我体验了首个接入GPT-4的代码编辑器,太炸裂了
最近一款名为Cursor的代码编辑器已经传遍了圈内,受到众多编程爱好者的追捧。 它主打的亮点就是,通过 GPT-4 来辅助你编程,完成 AI 智能生成代码、修改 Bug、生成测试等操作。 确实很吸引人,而且貌似也能大大节省人为的重复工作&…...

互联网数据挖掘与分析讲解
一、定义 数据挖掘(英语:Data mining),又译为资料探勘、数据采矿。它是数据库知识发现(英语:Knowledge-Discovery in Databases,简称:KDD)中的一个步骤。数据挖掘一般是指从大量的数…...

linux之cut的使用
cut是一个选取命令,就是将一段数据经过分析,取出我们想要的。一般来说,选取信息通常是针对“行”来进行分析的,并不是整篇信息分析的 其语法格式为: cut [-bn] [file] 或 cut [-c][file] 或 cut [-df] [file]使用说明:…...

Redis第十讲 Redis之Hash数据结构Dict-rehash扩容操作
Rehash 执行过程 字典的 rehash 操作实际上就是执行以下任务: 创建一个比 ht[0]->table 更大的 ht[1]->table ;将 ht[0]->table 中的所有键值对迁移到 ht[1]->table ;将原有 ht[0] 的数据清空,并将 ht[1] 替换为新的 ht[0] ; 经过以上步骤之后, 程序就在不改…...

电动力学问题中的Matlab可视化
电磁场的经典描述 小说一则 电磁场的经典描述就是没有啥玩意量子力学的经典电动力学下对电磁场的描述,以后有空写个科幻小说,写啥呢,就写有天张三遇见了一个外星人,外星人来自这样一个星球,星球上的物质密度特别低,导致外星人的测量会明显的影响物质的运动,外星人不能同时得到…...
云原生周刊:编程即将终结?
近日哈佛大学计算机科学的前教授 Matt Welsh,分享了他对计算机科学、分布式计算的未来以及 ChatGPT 和 GitHub Copilot 是否代表编程结束的开始的看法。 威尔士说,编程语言仍然很复杂。再多的工作也无法让它变得简单。 “在我看来,任何改进…...

C++ STL,resize 和 reserve 的区别
结论放前边:resize和reserve都可以给容器扩容,区别在于resize会进行填充,使容器处于满员的状态,即sizecapacity,而reserve不会填充,有size<capacity. 1. size 和 capacity 的区别 size和capacity是容器…...

Java——详解ReentrantLock与AQS的关联以及AQS的数据结构和同步状态State
前言 Java中大部分同步类(Lock、Semaphore、ReentrantLock等)都是基于AbstractQueuedSynchronizer(简称为 AQS)实现的。 AQS 是一种提供了原子式管理同步状态、阻塞和唤醒线程功能以及队列模型的简单框架。 本文会先介绍应用层&a…...

vue3+vite+ts 接入QQ登录
说明 前提资料准备 在QQ互联中心注册成为开发者 站点:https://connect.qq.com/创建应用,如图 js sdk方式 下载对应的sdk包 sdk下载:https://wiki.connect.qq.com/sdk%e4%b8%8b%e8%bd%bd 使用 下载离线js sdk 打开:https:…...

消息队列kafka及zookeeper机制
目录 一、zookeeper 1、zookeeper简介 2、zookeeper特点 3、zookeeper工作模式及机制 4、zookeeper应用场景及选举机制 5、zookeeper集群部署 ①实验环境 ②安装zookeeper 二、消息队列kafka 1、为什么要有消息队列 2、使用消息队列的好处 3、kafka简介 4、kafka…...

分布式 - 分布式体系架构:IT架构的演进过程
文章目录01. 应用与数据一体模式02. 应用服务和数据服务的分离03. 缓存与性能的提升04. 服务器集群处理并发05. 数据库读写分离06. 反向代理和 CDN07. 分布式文件系统和分布式数据库系统08. NoSQL和搜索引擎09. 业务拆分10. Redis缓存在应用服务器上是进程内缓存还是进程外缓存…...

CSDN 周赛42期
CSDN 周赛42期1、题目名称:鬼画符门之宗门大比2、题目名称:K皇把妹3、题目名称:影分身4、题目名称:开心的金明小结1、题目名称:鬼画符门之宗门大比 给定整数序列A。 求在整数序列A中连续权值最大的子序列的权值。 &…...

Vue:初识Vue
1、首先要导入vue.js <!-- 当你使用script标签安装vue之后,上下文就注册了一个全局变量vue --><script src"../1.Vue/js/vue.js"></script> 不能直接调用vue(),需要new vue(),否则会报错。 2、关于vue构造函数的参数opti…...

linux语言学习记录
文章目录前言一、linux文件结构二、指令三、Gvim编辑器1、命令模式2、底行命令四、正则表达式1、表达式匹配举例2、对文件里面内容进行操作3、使用 \( 和 )\ 符号括起正规表达式,即可在后面使用\1和\2等变量来访问和中的内容前言 记录自己学习linux的笔记ÿ…...

面向对象编程(进阶)7:面向对象特征三:多态性
一千个读者眼中有一千个哈姆雷特。 目录 7.1 多态的形式和体现 7.1.1 对象的多态性 举例: 7.1.2 多态的理解 7.1.3 举例 1、方法内局部变量的赋值体现多态 2、方法的形参声明体现多态 3、方法返回值类型体现多态 7.2 为什么需要多态性(polymorphism)&#x…...

vue尚品汇商城项目-day04【29.加入购物车操作(难点)】
文章目录29.加入购物车操作(难点)29.1加入购物车按钮29.2addCartSuce29.3购物车29.3.1 向服务器发送ajax请求,获取购物车数据29.3.2UUID临时游客身份29.3.3动态展示购物车29.4修改购物车产品的数量(需要发请求:参数理解…...

KubeSphere 社区双周报 | 4.8 深圳站 Meetup 火热报名中 | 2023.3.17-3.30
KubeSphere 社区双周报主要整理展示新增的贡献者名单和证书、新增的讲师证书以及两周内提交过 commit 的贡献者,并对近期重要的 PR 进行解析,同时还包含了线上/线下活动和布道推广等一系列社区动态。 本次双周报涵盖时间为:2023.03.17-2023.…...

ChatGPT热炒之前 搜索引擎SEO算法已经悄然改变
2022年4月起,某度算法有了新的调整,这对于靠SEO获得流量的公司简直可以说是灭顶之灾。原本SEO从业者还指望跟之前一样,等算法调整稳定后,网站的自然排名还会再回来,但等到了10月份,仍然没有回暖的迹象&…...
零门槛NAS搭建:WinNAS如何让普通电脑秒变私有云?
一、核心优势:专为Windows用户设计的极简NAS WinNAS由深圳耘想存储科技开发,是一款收费低廉但功能全面的Windows NAS工具,主打“无学习成本部署” 。与其他NAS软件相比,其优势在于: 无需硬件改造:将任意W…...

盘古信息PCB行业解决方案:以全域场景重构,激活智造新未来
一、破局:PCB行业的时代之问 在数字经济蓬勃发展的浪潮中,PCB(印制电路板)作为 “电子产品之母”,其重要性愈发凸显。随着 5G、人工智能等新兴技术的加速渗透,PCB行业面临着前所未有的挑战与机遇。产品迭代…...
R语言AI模型部署方案:精准离线运行详解
R语言AI模型部署方案:精准离线运行详解 一、项目概述 本文将构建一个完整的R语言AI部署解决方案,实现鸢尾花分类模型的训练、保存、离线部署和预测功能。核心特点: 100%离线运行能力自包含环境依赖生产级错误处理跨平台兼容性模型版本管理# 文件结构说明 Iris_AI_Deployme…...
day52 ResNet18 CBAM
在深度学习的旅程中,我们不断探索如何提升模型的性能。今天,我将分享我在 ResNet18 模型中插入 CBAM(Convolutional Block Attention Module)模块,并采用分阶段微调策略的实践过程。通过这个过程,我不仅提升…...
【解密LSTM、GRU如何解决传统RNN梯度消失问题】
解密LSTM与GRU:如何让RNN变得更聪明? 在深度学习的世界里,循环神经网络(RNN)以其卓越的序列数据处理能力广泛应用于自然语言处理、时间序列预测等领域。然而,传统RNN存在的一个严重问题——梯度消失&#…...

(二)原型模式
原型的功能是将一个已经存在的对象作为源目标,其余对象都是通过这个源目标创建。发挥复制的作用就是原型模式的核心思想。 一、源型模式的定义 原型模式是指第二次创建对象可以通过复制已经存在的原型对象来实现,忽略对象创建过程中的其它细节。 📌 核心特点: 避免重复初…...
Unit 1 深度强化学习简介
Deep RL Course ——Unit 1 Introduction 从理论和实践层面深入学习深度强化学习。学会使用知名的深度强化学习库,例如 Stable Baselines3、RL Baselines3 Zoo、Sample Factory 和 CleanRL。在独特的环境中训练智能体,比如 SnowballFight、Huggy the Do…...
在web-view 加载的本地及远程HTML中调用uniapp的API及网页和vue页面是如何通讯的?
uni-app 中 Web-view 与 Vue 页面的通讯机制详解 一、Web-view 简介 Web-view 是 uni-app 提供的一个重要组件,用于在原生应用中加载 HTML 页面: 支持加载本地 HTML 文件支持加载远程 HTML 页面实现 Web 与原生的双向通讯可用于嵌入第三方网页或 H5 应…...
Python 包管理器 uv 介绍
Python 包管理器 uv 全面介绍 uv 是由 Astral(热门工具 Ruff 的开发者)推出的下一代高性能 Python 包管理器和构建工具,用 Rust 编写。它旨在解决传统工具(如 pip、virtualenv、pip-tools)的性能瓶颈,同时…...

R语言速释制剂QBD解决方案之三
本文是《Quality by Design for ANDAs: An Example for Immediate-Release Dosage Forms》第一个处方的R语言解决方案。 第一个处方研究评估原料药粒径分布、MCC/Lactose比例、崩解剂用量对制剂CQAs的影响。 第二处方研究用于理解颗粒外加硬脂酸镁和滑石粉对片剂质量和可生产…...