ChatGPT能够干翻谷歌吗?
目前大多数人对于ChatGPT的喜爱,主要源自于其强大的沟通能力,当我们向ChatGPT提出问题时,它不仅能够为我们提供结论,而且还能够与我们建立沟通,向ChatGPT提出任何问题,感觉都像是在与一个真实的人类进行交谈。
在ChatGPT发布前夕,谷歌人工智能实验室——谷歌大脑(Google Brain)的负责人Zoubin Ghahramani还曾公开表示:“聊天机器人并不是人们每天都能可靠地使用的东西。”然而Zoubin Ghahramani一定没有想到,“打脸”居然来的如此之快。就在其发表言论的几周之后,几乎全世界都在使用和讨论ChatGPT。
自11月底发布以来,ChatGPT迅速火遍全网,仅一周之内便拥有了超100万的用户量。如今,ChatGPT已经成为了有史以来全球用户数量最多的LLM(大型语言模型)聊天机器人。且由于ChatGPT在信息搜索模式上的创新,目前不少ChatGPT的拥护者为其披上了“谷歌杀手”的外衣,认为ChatGPT将能够在短时间内颠覆传统的信息搜索模式,进而取代谷歌在信息检索领域的统治地位。
那么,事实是否真如广大ChatGPT的粉丝所言?ChatGPT目前是否已具备挑战搜索引擎的能力;谷歌这位制霸搜索领域数十年的科技巨人又是否真的像ChatGPT粉丝们所认为的那样不堪一击呢?
1、ChatGPT的蜜糖与毒药
目前大多数人对于ChatGPT的喜爱,主要源自于其强大的沟通能力,当我们向ChatGPT提出问题时,它不仅能够为我们提供结论,而且还能够与我们建立沟通,向ChatGPT提出任何问题,感觉都像是在与一个真实的人类进行交谈。这的确是聊天机器人相比于搜索引擎的一大优势,以聊天形式进行答案的输出,远比搜索引擎一行行的网址要来的直接与亲切。
但是在硬币的另一面,ChatGPT在信息搜索方面却也存在着回答不可靠、易受外界影响以及伪造信息三大问题。
首先,ChatGPT的回答并不总是可靠的,其经常会在推理以及事实上犯错误。其次,ChatGPT容易受到外界信息的影响。在ChatGPT的独特特征中,最主要的便是学习能力,模型能够记住此前与其他用户的对话内容,并将其进行复述。这也导致了用户将能够非常轻易地干预ChatGPT对于问题的判断与回答。最近Stack Overflow论坛禁止了ChatGPT创建的所有答案,其理由便是由于ChatGPT对于大量问题都提供了从用户那里学习到的错误示例。
此外,在面对某些模糊问题或是论述性问题时,ChatGPT为了能够使其回答更具有信服力,似乎选择了对其生成的部分内容进行造假。例如当ChatGPT在引用各类社交媒体中专家对于特定问题的答复时,有时会对文本内容进行修改,或是将A的言论或事件匹配至B的名下。在这方面最典型的一个例子便是,当一位记者要求ChatGPT撰写一篇微软季度收益的文章时,ChatGPT为了增加文章的可信度,将微软首席执行官Satya Nadella的一次报价进行了伪造。
由此可见,虽然ChatGPT目前已经通过创新性的问答模式在信息检索方面取得了的一定影响力与大量的关注度,但在信息供给的准确性和可靠性方面,ChatGPT仍存在着一些明显的缺陷,这与搜索引擎的定位及目标显然是背道而驰的。且由于ChatGPT的设计初衷是用以对话式问答以及模拟人类的对话行为,ChatGPT在面对某些关键词检索场景时,虽然能够给出一定的解释,但却无法为用户提供足够有帮助的增量信息。因此,对于目前ChatGPT的定位与能力而言,想要挑战谷歌甚至于完全取代搜索引擎,显然还不是一件现实的事情。
2、谷歌的布局与取舍
反观谷歌,其实早在ChatGPT推出之前,这位巨人就已经参与了大量LLM项目的研发,其中最为著名的项目,便是几个月前被谷歌工程师称为“已具备人类感情”的LaMDA聊天机器人。那么,与目前大红大紫的ChatGPT相比,谷歌一直有意藏其锋芒的LaMDA的又表现如何呢?
作为谷歌现阶段最为成熟的对话式语言模型,LaMDA由1370亿个参数组成,并根据1.56TB的公开可用对话数据和web文档进行训练。另一方面,ChatGPT基于GPT-3.5架构,具有1750亿个参数,通过对人类书写文本的演示和由人类标注员在总体质量分数上所评定的样本进行有监督微调训练。
初看之下,LaMDA与ChatGPT在参数量及训练方式上的差别并不明显,但在具体的使用体验方面,二者却表现出了各自不同的特点。Scale AI的研究员Riley Goodside曾在一篇博客中表示:在面对相同问题时,ChatGPT往往能够给出较为明确地回应,但LaMDA所给出的回复表述形式更加友好,且更接近人类的语言模式。这可能与LaMDA接受对话训练直接相关,而ChatGPT则是在网络文本方面接受了更多的训练。
因此,尽管LaMDA自身也存在着一些漏洞,但在实际应用层面,如果谷歌希望使用LaMDA与ChatGPT进行竞争,二者之间的胜败还真犹未可知。而谷歌之所以至今还未对外发布LaMDA,也主要是出于对公司声誉的考虑。谷歌AI负责人Jeff Dean也曾在12月中旬的一次内部会议中声称:谷歌目前拥有做AI产品与技术的能力,但比起中小型公司,他们必须更加保守的做出一些决策。
在谈到谷歌AI时,Jeff Dean表示:聊天机器人很容易受到偏见和虚假信息的影响,而谷歌是一家拥有超过十亿用户的大企业,就更不容易摆脱这种影响。我们当然非常希望将这些技术使用到真正的产品当中,尤其是利用更加优秀的语言模型,但更重要的是,我们要做正确的事情。除此之外,值得我们注意的是,谷歌也于近期对内部团队的工作进行了调整,加强了对于AI技术及产品的研发支持。从以上的动作我们也不难看出,谷歌对于正面应对ChatGPT所带来的一些挑战还是非常有信心的。
3、融合或成新的机遇
归根结底,将聊天机器人与搜索引擎进行比较本就是一个伪命题。ChatGPT的价值在于,其能够模拟真人的“思考”行为,并通过交谈的方式运用其所学的知识回答我们的一些问题,或是完成具有创造性的简单的写作任务。而对搜索引擎而言,其主要职责则是为人们快速且精准地提供所需信息。其二者之间所存在的壁垒并非通过技术手段便能够实现有效弥合。
而对于二者未来的发展趋势,不少业内专家也给出了几乎趋于一致的看法,也就是ChatGPT类对话机器人将在未来与搜索引擎形成1+1>2的“共生”关系,成为搜索引擎新的入口。在这种全新模态下,人们或将能够通过语音或是文本的形式与搜索引擎进行直接的对话沟通,而搜索引擎也能够借助对话式机器人的理解与认知为人们从海量数据中快速总结出更具精度和符合偏好的搜索结果,帮助人们节省在信息搜索上的操作步骤,使人们整个搜索流程的效率得到极大地优化。
如此看来,尽管目前ChatGPT与谷歌表面上形成了一定的对立,但这种趋势更多的是出于对利益的考虑。相信随着时间的推移以及技术的持续演进,二者眼前的矛盾将会逐渐烟消云散。
相关文章:

ChatGPT能够干翻谷歌吗?
目前大多数人对于ChatGPT的喜爱,主要源自于其强大的沟通能力,当我们向ChatGPT提出问题时,它不仅能够为我们提供结论,而且还能够与我们建立沟通,向ChatGPT提出任何问题,感觉都像是在与一个真实的人类进行交谈…...
PCL 使用点云创建数字高程模型DEM
目录 一、DEM1、数字高程模型二、代码实现三、结果展示1、点云2、DEM四、相关链接一、DEM 1、数字高程模型 数字高程模型(Digital Elevation Model),简称DEM,是通过有限的地形高程数据实现对地面地形的数字化模拟(即地形表面形态的数字化表达),它是用一组有序数值阵列形…...

我体验了首个接入GPT-4的代码编辑器,太炸裂了
最近一款名为Cursor的代码编辑器已经传遍了圈内,受到众多编程爱好者的追捧。 它主打的亮点就是,通过 GPT-4 来辅助你编程,完成 AI 智能生成代码、修改 Bug、生成测试等操作。 确实很吸引人,而且貌似也能大大节省人为的重复工作&…...

互联网数据挖掘与分析讲解
一、定义 数据挖掘(英语:Data mining),又译为资料探勘、数据采矿。它是数据库知识发现(英语:Knowledge-Discovery in Databases,简称:KDD)中的一个步骤。数据挖掘一般是指从大量的数…...

linux之cut的使用
cut是一个选取命令,就是将一段数据经过分析,取出我们想要的。一般来说,选取信息通常是针对“行”来进行分析的,并不是整篇信息分析的 其语法格式为: cut [-bn] [file] 或 cut [-c][file] 或 cut [-df] [file]使用说明:…...

Redis第十讲 Redis之Hash数据结构Dict-rehash扩容操作
Rehash 执行过程 字典的 rehash 操作实际上就是执行以下任务: 创建一个比 ht[0]->table 更大的 ht[1]->table ;将 ht[0]->table 中的所有键值对迁移到 ht[1]->table ;将原有 ht[0] 的数据清空,并将 ht[1] 替换为新的 ht[0] ; 经过以上步骤之后, 程序就在不改…...

电动力学问题中的Matlab可视化
电磁场的经典描述 小说一则 电磁场的经典描述就是没有啥玩意量子力学的经典电动力学下对电磁场的描述,以后有空写个科幻小说,写啥呢,就写有天张三遇见了一个外星人,外星人来自这样一个星球,星球上的物质密度特别低,导致外星人的测量会明显的影响物质的运动,外星人不能同时得到…...
云原生周刊:编程即将终结?
近日哈佛大学计算机科学的前教授 Matt Welsh,分享了他对计算机科学、分布式计算的未来以及 ChatGPT 和 GitHub Copilot 是否代表编程结束的开始的看法。 威尔士说,编程语言仍然很复杂。再多的工作也无法让它变得简单。 “在我看来,任何改进…...

C++ STL,resize 和 reserve 的区别
结论放前边:resize和reserve都可以给容器扩容,区别在于resize会进行填充,使容器处于满员的状态,即sizecapacity,而reserve不会填充,有size<capacity. 1. size 和 capacity 的区别 size和capacity是容器…...

Java——详解ReentrantLock与AQS的关联以及AQS的数据结构和同步状态State
前言 Java中大部分同步类(Lock、Semaphore、ReentrantLock等)都是基于AbstractQueuedSynchronizer(简称为 AQS)实现的。 AQS 是一种提供了原子式管理同步状态、阻塞和唤醒线程功能以及队列模型的简单框架。 本文会先介绍应用层&a…...

vue3+vite+ts 接入QQ登录
说明 前提资料准备 在QQ互联中心注册成为开发者 站点:https://connect.qq.com/创建应用,如图 js sdk方式 下载对应的sdk包 sdk下载:https://wiki.connect.qq.com/sdk%e4%b8%8b%e8%bd%bd 使用 下载离线js sdk 打开:https:…...

消息队列kafka及zookeeper机制
目录 一、zookeeper 1、zookeeper简介 2、zookeeper特点 3、zookeeper工作模式及机制 4、zookeeper应用场景及选举机制 5、zookeeper集群部署 ①实验环境 ②安装zookeeper 二、消息队列kafka 1、为什么要有消息队列 2、使用消息队列的好处 3、kafka简介 4、kafka…...

分布式 - 分布式体系架构:IT架构的演进过程
文章目录01. 应用与数据一体模式02. 应用服务和数据服务的分离03. 缓存与性能的提升04. 服务器集群处理并发05. 数据库读写分离06. 反向代理和 CDN07. 分布式文件系统和分布式数据库系统08. NoSQL和搜索引擎09. 业务拆分10. Redis缓存在应用服务器上是进程内缓存还是进程外缓存…...

CSDN 周赛42期
CSDN 周赛42期1、题目名称:鬼画符门之宗门大比2、题目名称:K皇把妹3、题目名称:影分身4、题目名称:开心的金明小结1、题目名称:鬼画符门之宗门大比 给定整数序列A。 求在整数序列A中连续权值最大的子序列的权值。 &…...

Vue:初识Vue
1、首先要导入vue.js <!-- 当你使用script标签安装vue之后,上下文就注册了一个全局变量vue --><script src"../1.Vue/js/vue.js"></script> 不能直接调用vue(),需要new vue(),否则会报错。 2、关于vue构造函数的参数opti…...

linux语言学习记录
文章目录前言一、linux文件结构二、指令三、Gvim编辑器1、命令模式2、底行命令四、正则表达式1、表达式匹配举例2、对文件里面内容进行操作3、使用 \( 和 )\ 符号括起正规表达式,即可在后面使用\1和\2等变量来访问和中的内容前言 记录自己学习linux的笔记ÿ…...

面向对象编程(进阶)7:面向对象特征三:多态性
一千个读者眼中有一千个哈姆雷特。 目录 7.1 多态的形式和体现 7.1.1 对象的多态性 举例: 7.1.2 多态的理解 7.1.3 举例 1、方法内局部变量的赋值体现多态 2、方法的形参声明体现多态 3、方法返回值类型体现多态 7.2 为什么需要多态性(polymorphism)&#x…...

vue尚品汇商城项目-day04【29.加入购物车操作(难点)】
文章目录29.加入购物车操作(难点)29.1加入购物车按钮29.2addCartSuce29.3购物车29.3.1 向服务器发送ajax请求,获取购物车数据29.3.2UUID临时游客身份29.3.3动态展示购物车29.4修改购物车产品的数量(需要发请求:参数理解…...

KubeSphere 社区双周报 | 4.8 深圳站 Meetup 火热报名中 | 2023.3.17-3.30
KubeSphere 社区双周报主要整理展示新增的贡献者名单和证书、新增的讲师证书以及两周内提交过 commit 的贡献者,并对近期重要的 PR 进行解析,同时还包含了线上/线下活动和布道推广等一系列社区动态。 本次双周报涵盖时间为:2023.03.17-2023.…...

ChatGPT热炒之前 搜索引擎SEO算法已经悄然改变
2022年4月起,某度算法有了新的调整,这对于靠SEO获得流量的公司简直可以说是灭顶之灾。原本SEO从业者还指望跟之前一样,等算法调整稳定后,网站的自然排名还会再回来,但等到了10月份,仍然没有回暖的迹象&…...
云计算——弹性云计算器(ECS)
弹性云服务器:ECS 概述 云计算重构了ICT系统,云计算平台厂商推出使得厂家能够主要关注应用管理而非平台管理的云平台,包含如下主要概念。 ECS(Elastic Cloud Server):即弹性云服务器,是云计算…...
React Native 导航系统实战(React Navigation)
导航系统实战(React Navigation) React Navigation 是 React Native 应用中最常用的导航库之一,它提供了多种导航模式,如堆栈导航(Stack Navigator)、标签导航(Tab Navigator)和抽屉…...
css的定位(position)详解:相对定位 绝对定位 固定定位
在 CSS 中,元素的定位通过 position 属性控制,共有 5 种定位模式:static(静态定位)、relative(相对定位)、absolute(绝对定位)、fixed(固定定位)和…...
Android Bitmap治理全解析:从加载优化到泄漏防控的全生命周期管理
引言 Bitmap(位图)是Android应用内存占用的“头号杀手”。一张1080P(1920x1080)的图片以ARGB_8888格式加载时,内存占用高达8MB(192010804字节)。据统计,超过60%的应用OOM崩溃与Bitm…...

Redis数据倾斜问题解决
Redis 数据倾斜问题解析与解决方案 什么是 Redis 数据倾斜 Redis 数据倾斜指的是在 Redis 集群中,部分节点存储的数据量或访问量远高于其他节点,导致这些节点负载过高,影响整体性能。 数据倾斜的主要表现 部分节点内存使用率远高于其他节…...

Maven 概述、安装、配置、仓库、私服详解
目录 1、Maven 概述 1.1 Maven 的定义 1.2 Maven 解决的问题 1.3 Maven 的核心特性与优势 2、Maven 安装 2.1 下载 Maven 2.2 安装配置 Maven 2.3 测试安装 2.4 修改 Maven 本地仓库的默认路径 3、Maven 配置 3.1 配置本地仓库 3.2 配置 JDK 3.3 IDEA 配置本地 Ma…...
AGain DB和倍数增益的关系
我在设置一款索尼CMOS芯片时,Again增益0db变化为6DB,画面的变化只有2倍DN的增益,比如10变为20。 这与dB和线性增益的关系以及传感器处理流程有关。以下是具体原因分析: 1. dB与线性增益的换算关系 6dB对应的理论线性增益应为&…...

MFC 抛体运动模拟:常见问题解决与界面美化
在 MFC 中开发抛体运动模拟程序时,我们常遇到 轨迹残留、无效刷新、视觉单调、物理逻辑瑕疵 等问题。本文将针对这些痛点,详细解析原因并提供解决方案,同时兼顾界面美化,让模拟效果更专业、更高效。 问题一:历史轨迹与小球残影残留 现象 小球运动后,历史位置的 “残影”…...
腾讯云V3签名
想要接入腾讯云的Api,必然先按其文档计算出所要求的签名。 之前也调用过腾讯云的接口,但总是卡在签名这一步,最后放弃选择SDK,这次终于自己代码实现。 可能腾讯云翻新了接口文档,现在阅读起来,清晰了很多&…...
人工智能--安全大模型训练计划:基于Fine-tuning + LLM Agent
安全大模型训练计划:基于Fine-tuning LLM Agent 1. 构建高质量安全数据集 目标:为安全大模型创建高质量、去偏、符合伦理的训练数据集,涵盖安全相关任务(如有害内容检测、隐私保护、道德推理等)。 1.1 数据收集 描…...