当前位置: 首页 > news >正文

百度文心一言4.0抢先体验教程!

🍁 展望:关注我, AI学习之旅上,我与您一同成长!

一、 引言

想快速体验文心一言4.0,但又觉得技术难度太高?别担心,我来手把手教你! 🚀

10月17日,文心一言4.0震撼亮相,带着一系列闪亮的AI原生应用与服务。这包括了 百度新搜索、百度地图、百度新文库、百度网盘、百度新如流、百度输入法,甚至还有国内首创的生成式商业智能产品——百度GBI

令人瞩目的是,百度宣布文心大模型4.0在理解、生成、逻辑及记忆四大领域都有了突破性进展,与GPT4的综合表现不相上下!

作为一个ChatGPT的忠实用户,我对此感到无比兴奋,并迫不及待想亲自试试。初次公开的只是API版本,对于不熟悉技术的朋友们来说,可能显得有些遥不可及。

但现在,文心一言4.0已全面开放!对于想快速上手体验的你,我写了一篇通俗易懂的教程,希望能助你一臂之力。

二、创建应用

登陆,进入链接 https://console.bce.baidu.com/qianfan/ais/console/applicationConsole/application

填写应用名称、应用描述,再点击确认。

image-20231024180437671

三、在线测试

进入链接:https://console.bce.baidu.com/qianfan/ais/console/onlineTest

一)参数设置

  1. 选择服务:必填,ERNIE-Bot 4.0
  2. 选择应用:必填,<上一步创建的应用>
  3. 温度:可默认,较高的数值会使输出更加随机,而较低的数值会使其更加集中和确定。
  4. 多样性:可默认,影响输出文本的多样性,取值越大,生成文本的多样性越强。
  5. 重复惩罚:可默认,用通过对已生成的token增加惩罚,减少重复生成的现象。说明:值越大表示惩罚越大。
  6. 系统人设:可为空,设定角色。

二)Prompt模版

1、预置模版

文心一言提供了很多预置模版。可以方便用户快速使用。

1)切换到 Prompt模版

2)点击 预置模版。

image-20231024181052482

3)选择自己需要的模版进行对话。

2、自制模版

自定义一些个人使用的常规模版,方便后期直接引用。

1)点击 Prompt模版。

2)选择 自制模版

3)点击 创建模版

image-20231024181240580

4)自动跳入该页面后,点击 创建模版

image-20231024183151045

5)输入模版的相关信息。

变量,可以再引用模版时进行输入,从而完善提示词内容。

6)创建成功。

7)引用模版。

8)使用效果。

四、实测结果对比

相对于目前4.0关于多模态的功能更新,我反而更加关心文心一言4.0的推理能力和中文理解能力,话不多说,我们来测试一下。

一)推理能力

文心大模型4.0说是重点升级了数学计算能力,那我们来看看下面两个案例的效果:

1、案例一

之前测试过一个问题 ,把4杯25度的水倒在一起是多少度, 我们看下不同模型之间的回答。

文心一言 2.4.0:

image-20231024190156451

文心一言 4.0:

GTP-4:

Claude2

针对这个问题,文心一言4.0的推理能力很不错了,相比于之前2.4.0是聪明不少了,并且相比于 GPT-4 和 Claude2,推理过程更加清晰。

2、案例二

我们再测试一个案例。在公园的长椅上坐了三人,他们之间有两个兄长,两个弟弟,这是怎么回事?

文心一言 2.4.0:

文心一言 4.0:

image-20231024191414310

GPT-4:

Claude2:

文心一言2.4.0的答案是错的,文心一言4.0的推理结果也是比较清晰符,GPT-4像是在做算术题,答案的确是对的,就是看着有点费脑。

二)中文理解能力

理解能力,尤其是中文理解能力,一直是国外大模型的弱点。对于这次文心一言4.0的发布,我最大的期待其实就是中文理解能力,能拥有懂中文的大模型那是一件多么幸福的事情!

1、案例一

小偷偷偷偷东西,这句话是什么意思?

文心一言2.4.0:

文心一言4.0

GPT-4

Claude2:

4个模型的输出结果不分伯仲,都可以比较好的解释这句话的意思。但是,文心一言4.0可以识别出这句话是个口语,并不是规范表达,这是文心一言4.0的亮点。

2、案例二

文心一言2.4.0:

文心一言4.0

GPT-4:

Claude2:

由于这个梗的事件发生在 2023年9月,而GPT-4的模型数据截止为 2022年1月,所以这里直接使用ChatGPT的联网模式来测试。整体测试下来,文心一言无论 2.4.0 还是 4.0 表现的都很出色,GPT-4 联网后解释的也很全面,但是 Claude2 就没那么幸运了!

3、案例三

再来个更好玩的谐音笑话。 大家好, 我是一只螃蟹 我的钳子没了 我没钳了。

文心一言2.4.0:

image-20231024195107790

文心一言4.0

image-20231024195118536

GPT-4

image-20231024195137849

Claude2:

文心一言、GPT-4,针对这个谐音笑话理解的都很到位,但是Claude2很不稳定,在 Claude2上多次测试下来,经常 get 不到谐音的正确解释。

五、总结

本文重点介绍了文心一言4.0的抢先体验方式。并且基于推理能力、中文理解能力,结合不同的案例对比了文心一言、ChatGPT、Claude2的生成能力,非常有趣。

很高兴可以见证国内大模型的崛起,就像我最近经常说的一样,国内大模型在很多维度虽然看似落后国外一大截,但是潜力无限,国人的学习能力一点也不担心,只是时间问题而已。未来国内大量的核心业务能否走上快车道,全看这些国内大模型怎么发展,我相信不久的一天,我们可以追上国外的水平!

最后,关注我,AI学习之旅上,我与您一同成长!

相关文章:

百度文心一言4.0抢先体验教程!

&#x1f341; 展望&#xff1a;关注我, AI学习之旅上&#xff0c;我与您一同成长&#xff01; 一、 引言 想快速体验文心一言4.0&#xff0c;但又觉得技术难度太高&#xff1f;别担心&#xff0c;我来手把手教你&#xff01; &#x1f680; 10月17日&#xff0c;文心一言4.0…...

单目3D目标检测 方法综述——直接回归方法、基于深度信息方法、基于点云信息方法

本文综合整理单目3D目标检测的方法模型&#xff0c;包括&#xff1a;基于几何约束的直接回归方法&#xff0c;基于深度信息的方法&#xff0c;基于点云信息的方法。万字长文&#xff0c;慢慢阅读~ 直接回归方法 涉及到模型包括&#xff1a;MonoCon、MonoDLE、MonoFlex、CUPNet…...

oracle,CLOB转XML内存不足,ORA-27163: out of memory ORA-06512: at “SYS.XMLTYPE“,

通过kettle采集数据时&#xff0c;表输入的组件&#xff0c;查询报错。 ORA-27163: out of memory ORA-06512: at “SYS.XMLTYPE”, line 272 ORA-06512: at line 1 通过 ALTER SESSION SET EVENTS ‘31156 trace name context forever, level 0x400’; 修改会话配置 或直接修改…...

PHP与mysql数据库交互

PHP与mysql数据库交互 文章目录 PHP与mysql数据库交互方法速查建立与Mysql链接捕获连接错误SQL语句的执行SQL 错误SQL语句执行结果集对象方法速查 案例 方法速查 函数名 作用 mysqli_connect() 与MySQL 数据库建立连接。 mysqli_close() 关闭与MYSQL 数据库建…...

【广州华锐视点】VR飞行员驾驶模拟实训系统

VR飞行员驾驶模拟实训系统是一种基于虚拟现实技术的航空装备仿真测试技术&#xff0c;可以用于飞行员、乘务员和机务人员的训练。该系统可以模拟真实的飞行环境&#xff0c;包括天气、地形、飞机性能等&#xff0c;使被试者能够在虚拟环境中进行飞行操作&#xff0c;从而提高其…...

太烂的牌也要打完只为自己也不是为了其他什么原因。

day17_io02 1.上课代码敲一遍 2.读取一个文件&#xff0c;这个文件中有随机的一些数字字符&#xff0c;统计这些数字有几个偶数&#xff0c;几个奇数&#xff0c;并且追加写入到该文件末尾。 例如&#xff1a; a.txt文件&#xff1a; 3241256364789629090126581212515 奇数&…...

SDL窗口创建以及简单显示(1)

项目创建步骤 1. 使用Qt Creator创建一个C项目 2. 将SDL库文件放到源文件目录下 在项目pro文件中添加库文件 win32{INCLUDEPATH $$PWD/SDL2-2.0.10/includeLIBS $$PWD/SDL2-2.0.10/lib/x86/SDL2.lib } 使用SDL创建一个窗口 #include <stdio.h>#include <SDL.h>…...

【Html】交通灯问题

效果 实现方式 计时器&#xff1a;setTimeout或setInterval来计时。setInterval和 setTimeout 在某些情况下可能会出现计时不准确的情况。这通常是由于JavaScript的事件循环机制和其他代码执行所需的时间造成的。 问询&#xff1a;通过getCurrentLight将每个状态的持续时间设置…...

用IntelliJ远程打断点调试

前提当然是本地和远程部署的代码一样。 记录下步骤&#xff1a; 1&#xff0c;用token登录kuboard&#xff0c;找到目标容器的IP&#xff1a; 2, 用上一步找到的IP等信息创建Remote JVM Debug: 3&#xff0c;打断点&#xff0c;wkb说要把断点此属性改为线程。我试了下似乎…...

Spring-Bean的生命周期概述

Bean的生命周期概述 入门使用的Spring代码&#xff1a; ClassPathXmlApplicationContext context new ClassPathXmlApplicationContext("spring.xml"); UserService userService (UserService) context.getBean("userService"); userService.test(); …...

SENet 学习

ILSVRC 是一个比赛&#xff0c;全称是ImageNet Large-Scale Visual Recognition Challenge&#xff0c;平常说的ImageNet比赛指的是这个比赛。 使用的数据集是ImageNet数据集的一个子集&#xff0c;一般说的ImageNet&#xff08;数据集&#xff09;实际上指的是ImageNet的这个子…...

目前和未来的缓存构建

说起来可能有点反直觉&#xff0c;有时候不运行反而可以帮助我们加快速度&#xff0c;这正是网络浏览器运行的指导原则。不必在页面上加载所有内容&#xff0c;缓存的元素已经存在&#xff0c;不需要每次访问网站或网页时都重新加载。页面加载速度越快&#xff0c;浏览器的工作…...

aws亚马逊云免费账号代充值!!!什么是 AWS Lambda?

AWS Lambda 是一项计算服务&#xff0c;可使您无需预配置或管理服务器即可运行代码。 Lambda 在可用性高的计算基础设施上运行您的代码&#xff0c;执行计算资源的所有管理工作&#xff0c;其中包括服务器和操作系统维护、容量调配和弹性伸缩和记录。使用 Lambda&#xff0c;您…...

《从零开始大模型开发与微调 :基于PyTorch与ChatGLM》简介

内 容 简 介 大模型是深度学习自然语言处理皇冠上的一颗明珠&#xff0c;也是当前AI和NLP研究与产业中最重要的方向之一。本书使用PyTorch 2.0作为学习大模型的基本框架&#xff0c;以ChatGLM为例详细讲解大模型的基本理论、算法、程序实现、应用实战以及微调技术&#xff0c;…...

【LeetCode】102. 二叉树的层序遍历

题目链接 文章目录 Python3方法一&#xff1a; 广度优先搜索 (BFS) ⟮ O ( n ) ⟯ \lgroup O(n) \rgroup ⟮O(n)⟯方法二&#xff1a; 深度优先搜索 (DFS) ⟮ O ( n ) ⟯ \lgroup O(n) \rgroup ⟮O(n)⟯ C方法一&#xff1a; 广度优先搜索 (BFS) ⟮ O ( n ) ⟯ \lgroup O(n…...

golang连接池检查连接失败时如何重试

在Go中&#xff0c;可以通过使用database/sql包的DB类型的Ping方法来检查数据库连接的可用性。如果连接检查失败&#xff0c;可以选择进行重试。以下是一个简单的示例代码&#xff0c;演示了如何在连接检查失败时进行重试&#xff1a; import ("database/sql""…...

从JavaScript到Rust的三年时间小结

Rust 是一种注重安全性、速度和并发性的系统编程语言。它能编译成高效的本地代码&#xff0c;无需垃圾回收即可访问内存等底层资源&#xff0c;同时还能防止分隔故障。 作者讨论了他们几年来用 Rust 构建大型应用程序和库的经验。他们发现 Rust 的借用检查器和类型系统有助于减…...

【Python机器学习】零基础掌握VotingRegressor集成学习

如何更准确地预测房价? 想象一下,你是一名房地产分析师,你的任务是预测一个小区的未来房价。这看似简单,但实际上,房价受到多种因素的影响,如地理位置、房屋面积、周围设施等。你可能会使用线性回归模型来进行预测,但是你会发现,尽管模型的准确性还可以,但还是存在一…...

云计算模式的区域LIS系统源码,基于ASP.NET+JQuery、EasyUI+MVC技术架构开发

云计算模式的区域LIS系统源码 云LIS系统源码&#xff0c;自主版权 LIS系统是专为医院检验科的仪器设备能与计算机连接。可通过LIS系统向仪器发送指令&#xff0c;让仪器自动操作和接收仪器数据。并快速的将检验仪器中的数据导入到医生工作站中进行管理&#xff0c;且可将检验结…...

面向对象设计原则之接口隔离原则

目录 定义接口隔离原则与单一职责原则示例 定义 接口隔离原则&#xff0c;全称为 Interface Segregation Principle&#xff0c;缩写ISP。 原始定义&#xff1a;Clients should not be forced to depend upon interfaces that they don’t use。 翻译&#xff1a; 不应该强行…...

k8s从入门到放弃之Ingress七层负载

k8s从入门到放弃之Ingress七层负载 在Kubernetes&#xff08;简称K8s&#xff09;中&#xff0c;Ingress是一个API对象&#xff0c;它允许你定义如何从集群外部访问集群内部的服务。Ingress可以提供负载均衡、SSL终结和基于名称的虚拟主机等功能。通过Ingress&#xff0c;你可…...

工程地质软件市场:发展现状、趋势与策略建议

一、引言 在工程建设领域&#xff0c;准确把握地质条件是确保项目顺利推进和安全运营的关键。工程地质软件作为处理、分析、模拟和展示工程地质数据的重要工具&#xff0c;正发挥着日益重要的作用。它凭借强大的数据处理能力、三维建模功能、空间分析工具和可视化展示手段&…...

04-初识css

一、css样式引入 1.1.内部样式 <div style"width: 100px;"></div>1.2.外部样式 1.2.1.外部样式1 <style>.aa {width: 100px;} </style> <div class"aa"></div>1.2.2.外部样式2 <!-- rel内表面引入的是style样…...

高防服务器能够抵御哪些网络攻击呢?

高防服务器作为一种有着高度防御能力的服务器&#xff0c;可以帮助网站应对分布式拒绝服务攻击&#xff0c;有效识别和清理一些恶意的网络流量&#xff0c;为用户提供安全且稳定的网络环境&#xff0c;那么&#xff0c;高防服务器一般都可以抵御哪些网络攻击呢&#xff1f;下面…...

Python ROS2【机器人中间件框架】 简介

销量过万TEEIS德国护膝夏天用薄款 优惠券冠生园 百花蜂蜜428g 挤压瓶纯蜂蜜巨奇严选 鞋子除臭剂360ml 多芬身体磨砂膏280g健70%-75%酒精消毒棉片湿巾1418cm 80片/袋3袋大包清洁食品用消毒 优惠券AIMORNY52朵红玫瑰永生香皂花同城配送非鲜花七夕情人节生日礼物送女友 热卖妙洁棉…...

A2A JS SDK 完整教程:快速入门指南

目录 什么是 A2A JS SDK?A2A JS 安装与设置A2A JS 核心概念创建你的第一个 A2A JS 代理A2A JS 服务端开发A2A JS 客户端使用A2A JS 高级特性A2A JS 最佳实践A2A JS 故障排除 什么是 A2A JS SDK? A2A JS SDK 是一个专为 JavaScript/TypeScript 开发者设计的强大库&#xff…...

【SSH疑难排查】轻松解决新版OpenSSH连接旧服务器的“no matching...“系列算法协商失败问题

【SSH疑难排查】轻松解决新版OpenSSH连接旧服务器的"no matching..."系列算法协商失败问题 摘要&#xff1a; 近期&#xff0c;在使用较新版本的OpenSSH客户端连接老旧SSH服务器时&#xff0c;会遇到 "no matching key exchange method found"​, "n…...

Linux 中如何提取压缩文件 ?

Linux 是一种流行的开源操作系统&#xff0c;它提供了许多工具来管理、压缩和解压缩文件。压缩文件有助于节省存储空间&#xff0c;使数据传输更快。本指南将向您展示如何在 Linux 中提取不同类型的压缩文件。 1. Unpacking ZIP Files ZIP 文件是非常常见的&#xff0c;要在 …...

Kubernetes 网络模型深度解析:Pod IP 与 Service 的负载均衡机制,Service到底是什么?

Pod IP 的本质与特性 Pod IP 的定位 纯端点地址&#xff1a;Pod IP 是分配给 Pod 网络命名空间的真实 IP 地址&#xff08;如 10.244.1.2&#xff09;无特殊名称&#xff1a;在 Kubernetes 中&#xff0c;它通常被称为 “Pod IP” 或 “容器 IP”生命周期&#xff1a;与 Pod …...

热门Chrome扩展程序存在明文传输风险,用户隐私安全受威胁

赛门铁克威胁猎手团队最新报告披露&#xff0c;数款拥有数百万活跃用户的Chrome扩展程序正在通过未加密的HTTP连接静默泄露用户敏感数据&#xff0c;严重威胁用户隐私安全。 知名扩展程序存在明文传输风险 尽管宣称提供安全浏览、数据分析或便捷界面等功能&#xff0c;但SEMR…...