百度文心一言4.0抢先体验教程!
🍁 展望:关注我, AI学习之旅上,我与您一同成长!
一、 引言
想快速体验文心一言4.0,但又觉得技术难度太高?别担心,我来手把手教你! 🚀
10月17日,文心一言4.0震撼亮相,带着一系列闪亮的AI原生应用与服务。这包括了 百度新搜索、百度地图、百度新文库、百度网盘、百度新如流、百度输入法,甚至还有国内首创的生成式商业智能产品——百度GBI。
令人瞩目的是,百度宣布文心大模型4.0在理解、生成、逻辑及记忆四大领域都有了突破性进展,与GPT4的综合表现不相上下!
作为一个ChatGPT的忠实用户,我对此感到无比兴奋,并迫不及待想亲自试试。初次公开的只是API版本,对于不熟悉技术的朋友们来说,可能显得有些遥不可及。
但现在,文心一言4.0已全面开放!对于想快速上手体验的你,我写了一篇通俗易懂的教程,希望能助你一臂之力。
二、创建应用
登陆,进入链接 https://console.bce.baidu.com/qianfan/ais/console/applicationConsole/application
填写应用名称、应用描述,再点击确认。
三、在线测试
进入链接:https://console.bce.baidu.com/qianfan/ais/console/onlineTest
一)参数设置
- 选择服务:必填,ERNIE-Bot 4.0
- 选择应用:必填,<上一步创建的应用>
- 温度:可默认,较高的数值会使输出更加随机,而较低的数值会使其更加集中和确定。
- 多样性:可默认,影响输出文本的多样性,取值越大,生成文本的多样性越强。
- 重复惩罚:可默认,用通过对已生成的token增加惩罚,减少重复生成的现象。说明:值越大表示惩罚越大。
- 系统人设:可为空,设定角色。
二)Prompt模版
1、预置模版
文心一言提供了很多预置模版。可以方便用户快速使用。
1)切换到 Prompt模版。
2)点击 预置模版。
3)选择自己需要的模版进行对话。
2、自制模版
自定义一些个人使用的常规模版,方便后期直接引用。
1)点击 Prompt模版。
2)选择 自制模版。
3)点击 创建模版。
4)自动跳入该页面后,点击 创建模版。
5)输入模版的相关信息。
变量,可以再引用模版时进行输入,从而完善提示词内容。
6)创建成功。
7)引用模版。
8)使用效果。
四、实测结果对比
相对于目前4.0关于多模态的功能更新,我反而更加关心文心一言4.0的推理能力和中文理解能力,话不多说,我们来测试一下。
一)推理能力
文心大模型4.0说是重点升级了数学计算能力,那我们来看看下面两个案例的效果:
1、案例一
之前测试过一个问题 ,把4杯25度的水倒在一起是多少度, 我们看下不同模型之间的回答。
文心一言 2.4.0:
文心一言 4.0:
GTP-4:
Claude2:
针对这个问题,文心一言4.0的推理能力很不错了,相比于之前2.4.0是聪明不少了,并且相比于 GPT-4 和 Claude2,推理过程更加清晰。
2、案例二
我们再测试一个案例。在公园的长椅上坐了三人,他们之间有两个兄长,两个弟弟,这是怎么回事?
文心一言 2.4.0:
文心一言 4.0:
GPT-4:
Claude2:
文心一言2.4.0的答案是错的,文心一言4.0的推理结果也是比较清晰符,GPT-4像是在做算术题,答案的确是对的,就是看着有点费脑。
二)中文理解能力
理解能力,尤其是中文理解能力,一直是国外大模型的弱点。对于这次文心一言4.0的发布,我最大的期待其实就是中文理解能力,能拥有懂中文的大模型那是一件多么幸福的事情!
1、案例一
小偷偷偷偷东西,这句话是什么意思?
文心一言2.4.0:
文心一言4.0:
GPT-4:
Claude2:
4个模型的输出结果不分伯仲,都可以比较好的解释这句话的意思。但是,文心一言4.0可以识别出这句话是个口语,并不是规范表达,这是文心一言4.0的亮点。
2、案例二
文心一言2.4.0:
文心一言4.0:
GPT-4:
Claude2:
由于这个梗的事件发生在 2023年9月,而GPT-4的模型数据截止为 2022年1月,所以这里直接使用ChatGPT的联网模式来测试。整体测试下来,文心一言无论 2.4.0 还是 4.0 表现的都很出色,GPT-4 联网后解释的也很全面,但是 Claude2 就没那么幸运了!
3、案例三
再来个更好玩的谐音笑话。 大家好, 我是一只螃蟹 我的钳子没了 我没钳了。
文心一言2.4.0:
文心一言4.0:
GPT-4:
Claude2:
文心一言、GPT-4,针对这个谐音笑话理解的都很到位,但是Claude2很不稳定,在 Claude2上多次测试下来,经常 get 不到谐音的正确解释。
五、总结
本文重点介绍了文心一言4.0的抢先体验方式。并且基于推理能力、中文理解能力,结合不同的案例对比了文心一言、ChatGPT、Claude2的生成能力,非常有趣。
很高兴可以见证国内大模型的崛起,就像我最近经常说的一样,国内大模型在很多维度虽然看似落后国外一大截,但是潜力无限,国人的学习能力一点也不担心,只是时间问题而已。未来国内大量的核心业务能否走上快车道,全看这些国内大模型怎么发展,我相信不久的一天,我们可以追上国外的水平!
最后,关注我,AI学习之旅上,我与您一同成长!
相关文章:

百度文心一言4.0抢先体验教程!
🍁 展望:关注我, AI学习之旅上,我与您一同成长! 一、 引言 想快速体验文心一言4.0,但又觉得技术难度太高?别担心,我来手把手教你! 🚀 10月17日,文心一言4.0…...

单目3D目标检测 方法综述——直接回归方法、基于深度信息方法、基于点云信息方法
本文综合整理单目3D目标检测的方法模型,包括:基于几何约束的直接回归方法,基于深度信息的方法,基于点云信息的方法。万字长文,慢慢阅读~ 直接回归方法 涉及到模型包括:MonoCon、MonoDLE、MonoFlex、CUPNet…...

oracle,CLOB转XML内存不足,ORA-27163: out of memory ORA-06512: at “SYS.XMLTYPE“,
通过kettle采集数据时,表输入的组件,查询报错。 ORA-27163: out of memory ORA-06512: at “SYS.XMLTYPE”, line 272 ORA-06512: at line 1 通过 ALTER SESSION SET EVENTS ‘31156 trace name context forever, level 0x400’; 修改会话配置 或直接修改…...

PHP与mysql数据库交互
PHP与mysql数据库交互 文章目录 PHP与mysql数据库交互方法速查建立与Mysql链接捕获连接错误SQL语句的执行SQL 错误SQL语句执行结果集对象方法速查 案例 方法速查 函数名 作用 mysqli_connect() 与MySQL 数据库建立连接。 mysqli_close() 关闭与MYSQL 数据库建…...

【广州华锐视点】VR飞行员驾驶模拟实训系统
VR飞行员驾驶模拟实训系统是一种基于虚拟现实技术的航空装备仿真测试技术,可以用于飞行员、乘务员和机务人员的训练。该系统可以模拟真实的飞行环境,包括天气、地形、飞机性能等,使被试者能够在虚拟环境中进行飞行操作,从而提高其…...

太烂的牌也要打完只为自己也不是为了其他什么原因。
day17_io02 1.上课代码敲一遍 2.读取一个文件,这个文件中有随机的一些数字字符,统计这些数字有几个偶数,几个奇数,并且追加写入到该文件末尾。 例如: a.txt文件: 3241256364789629090126581212515 奇数&…...

SDL窗口创建以及简单显示(1)
项目创建步骤 1. 使用Qt Creator创建一个C项目 2. 将SDL库文件放到源文件目录下 在项目pro文件中添加库文件 win32{INCLUDEPATH $$PWD/SDL2-2.0.10/includeLIBS $$PWD/SDL2-2.0.10/lib/x86/SDL2.lib } 使用SDL创建一个窗口 #include <stdio.h>#include <SDL.h>…...

【Html】交通灯问题
效果 实现方式 计时器:setTimeout或setInterval来计时。setInterval和 setTimeout 在某些情况下可能会出现计时不准确的情况。这通常是由于JavaScript的事件循环机制和其他代码执行所需的时间造成的。 问询:通过getCurrentLight将每个状态的持续时间设置…...

用IntelliJ远程打断点调试
前提当然是本地和远程部署的代码一样。 记录下步骤: 1,用token登录kuboard,找到目标容器的IP: 2, 用上一步找到的IP等信息创建Remote JVM Debug: 3,打断点,wkb说要把断点此属性改为线程。我试了下似乎…...

Spring-Bean的生命周期概述
Bean的生命周期概述 入门使用的Spring代码: ClassPathXmlApplicationContext context new ClassPathXmlApplicationContext("spring.xml"); UserService userService (UserService) context.getBean("userService"); userService.test(); …...

SENet 学习
ILSVRC 是一个比赛,全称是ImageNet Large-Scale Visual Recognition Challenge,平常说的ImageNet比赛指的是这个比赛。 使用的数据集是ImageNet数据集的一个子集,一般说的ImageNet(数据集)实际上指的是ImageNet的这个子…...

目前和未来的缓存构建
说起来可能有点反直觉,有时候不运行反而可以帮助我们加快速度,这正是网络浏览器运行的指导原则。不必在页面上加载所有内容,缓存的元素已经存在,不需要每次访问网站或网页时都重新加载。页面加载速度越快,浏览器的工作…...

aws亚马逊云免费账号代充值!!!什么是 AWS Lambda?
AWS Lambda 是一项计算服务,可使您无需预配置或管理服务器即可运行代码。 Lambda 在可用性高的计算基础设施上运行您的代码,执行计算资源的所有管理工作,其中包括服务器和操作系统维护、容量调配和弹性伸缩和记录。使用 Lambda,您…...

《从零开始大模型开发与微调 :基于PyTorch与ChatGLM》简介
内 容 简 介 大模型是深度学习自然语言处理皇冠上的一颗明珠,也是当前AI和NLP研究与产业中最重要的方向之一。本书使用PyTorch 2.0作为学习大模型的基本框架,以ChatGLM为例详细讲解大模型的基本理论、算法、程序实现、应用实战以及微调技术,…...

【LeetCode】102. 二叉树的层序遍历
题目链接 文章目录 Python3方法一: 广度优先搜索 (BFS) ⟮ O ( n ) ⟯ \lgroup O(n) \rgroup ⟮O(n)⟯方法二: 深度优先搜索 (DFS) ⟮ O ( n ) ⟯ \lgroup O(n) \rgroup ⟮O(n)⟯ C方法一: 广度优先搜索 (BFS) ⟮ O ( n ) ⟯ \lgroup O(n…...

golang连接池检查连接失败时如何重试
在Go中,可以通过使用database/sql包的DB类型的Ping方法来检查数据库连接的可用性。如果连接检查失败,可以选择进行重试。以下是一个简单的示例代码,演示了如何在连接检查失败时进行重试: import ("database/sql""…...

从JavaScript到Rust的三年时间小结
Rust 是一种注重安全性、速度和并发性的系统编程语言。它能编译成高效的本地代码,无需垃圾回收即可访问内存等底层资源,同时还能防止分隔故障。 作者讨论了他们几年来用 Rust 构建大型应用程序和库的经验。他们发现 Rust 的借用检查器和类型系统有助于减…...

【Python机器学习】零基础掌握VotingRegressor集成学习
如何更准确地预测房价? 想象一下,你是一名房地产分析师,你的任务是预测一个小区的未来房价。这看似简单,但实际上,房价受到多种因素的影响,如地理位置、房屋面积、周围设施等。你可能会使用线性回归模型来进行预测,但是你会发现,尽管模型的准确性还可以,但还是存在一…...

云计算模式的区域LIS系统源码,基于ASP.NET+JQuery、EasyUI+MVC技术架构开发
云计算模式的区域LIS系统源码 云LIS系统源码,自主版权 LIS系统是专为医院检验科的仪器设备能与计算机连接。可通过LIS系统向仪器发送指令,让仪器自动操作和接收仪器数据。并快速的将检验仪器中的数据导入到医生工作站中进行管理,且可将检验结…...

面向对象设计原则之接口隔离原则
目录 定义接口隔离原则与单一职责原则示例 定义 接口隔离原则,全称为 Interface Segregation Principle,缩写ISP。 原始定义:Clients should not be forced to depend upon interfaces that they don’t use。 翻译: 不应该强行…...

haproxy 负载均衡
haproxy负载均衡 haproxy:基于C语言开发的开源软件 支持高性能的tcp和http负载均衡器,工作中用的版本1.5.9 haproxy功能:主要用于高并发的web站点,工作原理和nginx、lvs都一样 haproxy缺点: 单节点部署,单实例运行。代…...

在el-dialog中使用tinymce 点击工具栏下拉框被遮挡
在el-dialog中使用tinymce控件时,会出现点击工具栏下拉框出现在弹窗下一层,审查元素之后发现是tinymce的下拉框z-index优先级低于el-dialog的z-index导致的,所以需要增加tinymce的下拉框的z-index值。 通过审查元素得到,需要修改t…...

CloudQuery + StarRocks:打造高效、安全的数据库管控新模式
随着技术的迅速发展,各种多元化的数据库产品应运而生,它们不仅类型众多,而且形式各异,国产化数据库千余套,开源数据库百余套 OceanBase 、PolarDB 、StarRocks…还有一些像 Oracle、MySQL 这些传统数据库。这些数据库产…...

各类统计模型R语言的详细使用教程-R语言的线性回归使用教程
各类统计模型R语言的详细使用教程-R语言的线性回归使用教程 前言R语言的线性回归代码示例回归诊断误差项正态qq图内学生化残差外学生化残差线性关系异常值的发现、处理帽子矩阵的方法DFFITS 准则Cook统计量COVRATIO准则多重共线性summaryKlein判别法特征根法条件指数法方差膨胀…...

点云从入门到精通技术详解100篇-基于尺度统一的三维激光点云与高清影像配准
目录 前言 研究现状 三维激光点云与影像配准研究现状 点云配准研究现状...

<蓝桥杯软件赛>零基础备赛20周--第2周
报名明年4月蓝桥杯软件赛的同学们,如果你是大一零基础,目前懵懂中,不知该怎么办,可以看看本博客系列:备赛20周合集 20周的完整安排请点击:20周计划 每周发1个博客,共20周(读者可以按…...

CMake多文件构建初步
前面学习了cmake,不熟悉,只是记录了操作过程;下面再继续; 略有一点进步,增加一个代码文件,之前是1个代码文件; 如下图,prj是空文件夹, CMakeLists.txt如下;…...

游戏研发的解决方案有哪些?
游戏研发的解决方案可以根据不同的需求和情境而有所不同,以下是一些常见的游戏研发解决方案: 游戏引擎: 游戏引擎是游戏研发的基础,它提供了开发游戏所需的核心功能,如图形渲染、物理引擎、音效管理、动画等。一些流行…...

Bayes决策:身高与体重特征进行性别分类
代码与文件请从这里下载:Auorui/Pattern-recognition-programming: 模式识别编程 (github.com) 简述 分别依照身高、体重数据作为特征,在正态分布假设下利用最大似然法估计分布密度参数,建立最小错误率Bayes分类器,写出得到的决…...

【考研数学】数学“背诵”手册 | 需要记忆且容易遗忘的知识点
文章目录 引言一、高数常见泰勒展开 n n n 阶导数公式多元微分函数连续、可微、连续可偏导之间的关系多元函数极值无条件极值条件极值 三角函数的积分性质华里士公式( “点火”公式 )特殊性质 原函数与被积函数的奇偶性结论球坐标变换公式 二、写在最后 …...