当前位置: 首页 > news >正文

Claude3.5如何使用?

 Claude 3.5 Sonnet,性能直接吊打了 GPT-4o,甚至价格还更便宜。网友们纷纷展开实测,有人表示自己一半的工作已经可以由它替代了!而最让人惊喜的新功能,莫过于 Artifacts 了。

就在昨天,Anthropic 深夜发布了下一代旗舰大模型 Claude 3.5 Sonnet。

​据称,Claude 3.5 Sonnet 不仅在评估中胜过 GPT-4o,还保持了作为「中杯」的最优性价比,超过了自家的 Claude 3 Opus。

✅️AI体验入口:AiChat—智能办公助手

如今,Claude 3.5 Sonnet 已经面向全球开启使用了。

前 OpenAI 对齐团队负责人 Jan Leike 表示,我喜欢 Sonnet 新模型。我经常要求它向我解释 ML 论文。虽然不一定全对,但可能比我略读要好,而且速度也快得多。自动对齐研究越来越近了......

有网友同样表示,「我有一半的工作都可以由 Claude 3.5 Sonnet 来完成,我真是太兴奋了」。

Anthropic 的产品经理 Michael Gerstenhaber 将新模型称之为「世界上最智能的模型」。

他表示,「我们正处于这个行业寒武纪大爆发的开端」。

今年晚些时候,Claude 3.5 Haiku 和最强版 Claude 3.5 Opus 将会陆续推出。

模型厂商们是彻底卷起来了!

网友实测

Claude 3.5 Sonnet 发布之后,在全网掀起轩然大波,网友们纷纷上手开启一波测试。

10 倍编码速度惊人

先来看看 Claude 3.5 Sonnet 写代码的速度有多可怕。

网友仅在一次对话中,就用 threejs+cannonjs 创建出一个 3D 太阳系模型,包含了物体和碰撞效果。

另一个网友称,使用 Claude 3.5 Sonnet 进行编码比 GPT-4,或任何其他大型语言模型效率高 10 倍。全新的 Artifacts 功能,可以在聊天旁边生成和运行代码,简直令人惊叹。

没有什么比使用 Claude 3.5 Sonnet 一次性编写一个程序,来解密维吉尼亚密码更棒的事了。

许多网友纷纷夸赞 Claude 3.5 Sonnet 速度快到起飞。

2 分钟一个小游戏

一位开发者直接用了不到 2 分钟,做出了一个戴着太阳镜的小狗吃骨头的游戏。

另有人花了 3 分钟的时间,做出了马里奥克隆版,并且为角色提供了动画效果。

还有另一款「原创」游戏 Color Cascade。

用 2 分钟创建一个蛇梯棋游戏。

网友表示,「我可以通过新的 Artifacts 功能实时查看代码并玩游戏。使用 Claude 的编码体验比 GPT-4 和 Gemini 好 10 倍」。

这位网友用 Sonnet 做了一款乒乓球游戏。

不像 ChatGPT,它没有用到编码解释器。在这个过程中,我们可以制作文档、笔记和其他内容,其中一个选项的 html / jss。

神经网络可视化

有人还去做了可视化深度学习,不过因为消息限制,不得不暂停。

下面是用动画效果解释反向传播的工作原理。

重建 3D「模拟矩阵」

Claude 3.5 Sonnet 是第一个能在首次尝试中,重现电影《黑客》中「数据流」3D 场景的模型。

而且,在制作恐怖游戏上,Claude 3.5 Sonnet 设计的 3D 结构比 Opus 更好。

SVG 效果图

Claude 3.5 Sonnet 可以画出独角兽 SVG 图。

它甚至可以生成芯片制造工艺流程示意图。

「井字棋」游戏失败

OpenAI 研究科学家,德扑之父使用新模型之后表示,像 GPT-4o(现在还有 Claude 3.5 Sonnet)这样的前沿模型,在某些方面可能达到了「聪明的高中生」的水平,但它们在像「井字棋」这样的基本任务上无法完成。

人们曾希望原生的多模态训练能够有所帮助,但事实并非如此。

Artifacts 改变交互

从上文也可以看出,这次更新的一大亮点,就是 Claude 3.5 引入的超强实时交互功能 Artifacts 了。

这一功能,可以说是开启了交互式 AI 最有潜力的形式。

它标志着 Claude 从对话式 AI 向协作工作环境的转变。而在未来,Anthorpic 的设想是,整个组织都能在共享空间中集中知识、文档、工作,而 Claude 会随时提供服务。

在沃顿商学院教授 Ethan Mollick 看来,Artifacts 可以说是一个简化版的代码解释器。

他上手创建的,是这样一个螃蟹小游戏。

开始的版本是这样的,稍显平淡。

教授直接问,能不能让游戏恐怖一点?然后氛围感瞬间就上来了。

大家的直观感受是,使用 Claude 和 Artifacts,就像在 IDE 中工作一样。

这位日本网友介绍说,Artifacts 简单来说,就是一个显示代码预览的功能。它很容易直观地理解,可以用于多种目的。

-网站创建

-形状

-图形

-文档

-简单游戏

它可以帮忙创建简单的网站。

只要跟它说“制作一个计算器应用程序”,一个使用 React 的计算器应用程序预览就完成了。

通过 Artifacts,可以让 Sonnet 使用 HTML 创建简单的幻灯片材料。

这位网友发现,这个过程中可以向 Sonnet 展示设计图片,它们会把这些图片用作参考。

Claude 3.5 Sonnet 不仅编码效率比 GPT-4o 或任何其他 LLMs 都高 10 倍,而且因为 Artifacts 功能可以在聊天的旁边生成并运行代码,因而可以提供令人惊叹的用户体验。

比如让它用 React 生成一个贪吃蛇的游戏。

随后,我们还可以用自然语言对游戏进行修改,比如做一个美观的背景,或者让蛇有一个化身。

因为可以一边创建游戏,一边立刻在右侧窗口中玩这个游戏,Artifacts 功能可以说是彻底贯彻了从对话式人工智能转向协同工作环境的想法。

总的来说,Artifacts 似乎是 Claude 长远远景的一个信号。

长期以来,Anthropic 一直表示自己主要关注企业,并且计划将 Claude 变成一种工具,让企业「安全地」将他们的知识、文档和正在进行的工作集中在一个共享空间中。

听起来,这种概念更像是 Notion 或 Slack,而不是 ChatGPT。而在这种系统中,Anthropic 的模型将处于整个系统的中心。

吊打 GPT-4o,上一代 2 倍速

总的来说,Claude 3.5 Sonnet 在生成速度方面,实现了飞升,是上一代超大杯 Claude 3 Opus 的 2 倍。

而且,在视觉方面的表现,新模型全面超越了 GPT-4o。OpenAI 上个月刚发布的新模型,没想到这么快被取而代之。

以下是官方博客中,做的一些基准测试。

从图中可以看出,Claude 3.5 已经在多数基准中,领先 GPT-4o、Gemini 1.5,以及 Llama-400B 的模型。

在代码基准中,Claude 3.5 在零样本情况下,取得了 92% 的成绩。在数学上,零样本 + CoT 加持 Claude 3.5 还是有些落后于 GPT-4o。

在视觉基准上,Claude 3.5 Sonnet 在视觉问答 MMMU 基准上,略逊于 GPT-4o。

不过,视觉数学推理、科学表格、图表问答、文件问答上,都拿下了最高分。

Claude 不仅能准确识别、转录图像中的文字内容,还结合了强大的代码生成能力,将多个模态真正集成在一起。

与众不同的是,Claude 3.5 Sonnet 并不像 GPT-4o 那样集成了语音助手,或者能够生成图像,而且 Anthropic 暂时也没有这一打算。

Anthropic 联创兼总裁 Daniela Amodei 在接受彭博独家采访中提到,「我们的目标是使其成为所有企业业务的首选模型」。

她继续称,从研究的角度来看,我们能够生成图像输出,但绘制一只「滑雪的猫」图像并不是我们的企业客户所要求的,所以我们并不优先考虑这一点。

目前,制药巨头 Pfizer 已经利用 Claude 模型,帮助发现新药物。

未来,模型越智能,就越有能力支持这种非常高水平的智力工作。显然,Anthropic 正在努力为它想要瞄准的企业公司进一步差异化。

可以扩展 Claude 交互方式的新功能 Artifacts,便是一个新的尝试。

Anthropic 的改进速度,简直令人惊叹。

如今 Anthropic 的这一步,必将逼得其他竞争对手跟上。

要知道,Claude 不像 Gemini 或 ChatGPT 那样受到更多关注,但它在比赛中却非常受欢迎。

相关文章:

Claude3.5如何使用?

Claude 3.5 Sonnet,性能直接吊打了 GPT-4o,甚至价格还更便宜。网友们纷纷展开实测,有人表示自己一半的工作已经可以由它替代了!而最让人惊喜的新功能,莫过于 Artifacts 了。 就在昨天,Anthropic 深夜发布了…...

力扣刷题TOP101:14.BM16 删除有序链表中重复的元素-II

目录: 目的 思路 复杂度 记忆秘诀 python代码 目的 1→1→2→3→3 删除重复后变成2。 思路 这个任务是删除链表里重复的节点包含本身。可以看成是一个抽奖活动的系统升级。某人通过多种方式报名(节点不同),后台数据检测到这些…...

解决github网络慢的问题

前言 本文采用替换host的方式来加速github的git请求,主要我自己用来备份的懒人方式,不然每次都要手动修改hosts文件,skrskrskr… 一、获取到可用的ip 先到这个网站查询到低延迟的ip 站长工具:https://ping.chinaz.com/ 第2步&…...

docker及docker exec命令学习笔记

docker exec 是一个常用的 Docker 命令,允许你在已经运行的容器中执行命令或启动新的进程。以下是详细介绍和常见用法: 基本语法 docker exec [OPTIONS] CONTAINER COMMAND [ARG...]参数详解 1. CONTAINER指定目标容器的名字或容器 ID。可以通过以下命…...

linux环境宝塔服务部署安装及介绍

一、简介 宝塔面板是一款服务器管理软件,支持windows和linux系统,可以通过Web端轻松管理服务器,提升运维效率。例如:创建管理网站、FTP、数据库,拥有可视化文件管理器,可视化软件管理器,可视化C…...

充分统计量(Sufficient Statistic)概念与应用: 中英双语

充分统计量:概念与应用 在统计学中,充分统计量(Sufficient Statistic) 是一个核心概念。它是从样本中计算得出的函数,能够完整且无损地表征样本中与分布参数相关的信息。在参数估计中,充分统计量能够帮助我…...

基于Matlab计算机视觉的车道线识别与前车检测系统研究

随着自动驾驶技术的发展,车道线识别和前车检测成为智能驾驶系统中的核心技术之一。本实训报告围绕基于计算机视觉的车道线识别与前车检测系统展开,旨在通过处理交通视频数据,实时检测车辆所在车道及其与前车的相对位置,从而为车道…...

模糊测试中常见的10种变异mutation策略

1. 引入 基于变异策略的模糊测试,有两个重点: (1)seed:种子,初始的合法输入序列。 (2)mutation:对已经存在的输入序列,进行微调。 所以,mutatio…...

opencv-android编译遇到的相关问题处理

1、opencv-android sdk下载 下载地址:https://opencv.org/releases/ 下载安卓SDK即可 2、解压下载好的SDK 3、导入opencv的SDK到安卓项目中 导入步骤在/OpenCV-android-sdk/sdk/build.gradle文件的注释中写的非常详细,大家可安装官方给出的步骤导入。…...

把 py脚本生成windows 可执行的文件

1 确保生成的exe文件,不会立即退出 input("Please input any key to exit!")2 安装 PyInstaller 确保已经安装了 PyInstaller。可以使用 pip 来安装它: pip install pyinstaller3 执行命令 这里的 --onefile 选项表示将所有依赖项打包到一…...

云计算的发展历史与未来展望

云计算的起源与发展 云计算的概念最早可以追溯到20世纪60年代,当时的计算机科学家约翰麦卡锡(John McCarthy)提出了“按需提供计算能力”的构想。尽管这一理念在当时的技术条件下无法实现,但为云计算的未来发展奠定了理论基础。 …...

基于飞腾S2500处理器的全国产加固服务器

近日,西安康德航测电子科技有限公司凭借其深厚的行业底蕴和创新精神,正式推出了基于飞腾S2500处理器的全国产加固服务器。这一产品的问世,不仅标志着我国在信息技术领域的自立自强迈出了坚实的一步,更以其卓越的性能、坚固的设计和…...

gitlab-cicd部署安装与具体操作

一、安装 本例中是用安装包直接在ubuntu下安装的,也可以用docker镜像。 curl -LJO https://gitlab-runner-downloads.s3.amazonaws.com/latest/rpm/gitlab-runner_amd64.rpmrpm -i gitlab-runner_amd64.rpm 安装runner后,需要跟在runner所在服务器安装…...

2022高等代数上【南昌大学】

2022 高等代数 证明: p ( x ) p(x) p(x) 是不可约多项式的充要条件是对任意的多项式 f ( x ) , g ( x ) f(x), g(x) f(x),g(x),若 p ( x ) ∣ f ( x ) g ( x ) p(x) \mid f(x)g(x) p(x)∣f(x)g(x),则有 p ( x ) ∣ f ( x ) p(x) \mid f(x) p(x)∣f(x) 或 p ( x ) ∣ g (…...

文本生成类(机器翻译)系统评估

在机器翻译任务中常用评价指标:BLEU、ROGUE、METEOR、PPL。 这些指标的缺点:只能反应模型输出是否类似于测试文本。 BLUE(Bilingual Evaluation Understudy):是用于评估模型生成的句子(candidate)和实际句子(referen…...

11.7【miniob】【debug】

这里的vector是实际值,而relation是指针,所以要解引用,*$1,并在最后调用其析构函数 emplace_back 和 push_back 都是用于在容器(如 std::vector)的末尾添加元素的方法,但它们的工作方式有所不同…...

OSHI 介绍与使用

OSHI 介绍 OSHI(Operating System and Hardware Information)是一个开源的Java库,用于从操作系统和硬件层面获取系统资源的详细信息。它提供了对操作系统、硬件、CPU、内存、磁盘、网络接口等多种信息的访问,且不依赖于平台特定的…...

Hadoop生态圈框架部署(八)- Hadoop高可用(HA)集群部署

文章目录 前言一、部署规划二、Hadoop HA集群部署(手动部署)1. 下载hadoop2. 上传安装包2. 解压hadoop安装包3. 配置hadoop配置文件3.1 虚拟机hadoop1修改hadoop配置文件3.1.1 修改 hadoop-env.sh 配置文件3.3.2 修改 core-site.xml 配置文件3.3.3 修改 …...

【RocketMQ】Name Server 无状态特点及如何让 Broker Consumer Producer 感知新节点

文章目录 前言1. Name Server 无状态特点2. Name Server 地址服务3. Name Server 手动配置后记 前言 看了 《RocketMQ 消息中间件实战派(上册)》前面一点,书中代码太多容易陷入细节。 这里简单描述下 RocketMQ Name Server 无状态表现在什么…...

蓝牙定位的MATLAB程序,四个锚点、三维空间

这段代码通过RSSI信号强度实现了在三维空间中的蓝牙定位,展示了如何使用锚点位置和测量的信号强度来估计未知点的位置。代码涉及信号衰减模型、距离计算和最小二乘法估计等基本概念,并通过三维可视化展示了真实位置与估计位置的关系。 目录 程序描述 运…...

机器学习--绪论

开启这一系列文章的初衷,是希望搭建一座通向机器学习世界的桥梁,为有志于探索这一领域的读者提供系统性指引和实践经验分享。随着人工智能和大数据技术的迅猛发展,机器学习已成为推动技术创新和社会变革的重要驱动力。从智能推荐系统到自然语…...

Unity 设计模式-命令模式(Command Pattern)详解

命令模式(Command Pattern)是一种行为型设计模式,它将请求封装成对象,从而使得可以使用不同的请求、队列或日志请求,以及支持可撤销的操作。命令模式通常包含四个主要角色:命令(Command&#xf…...

线程信号量 Linux环境 C语言实现

既可以解决多个同类共享资源的互斥问题&#xff0c;也可以解决简易的同步问题 头文件&#xff1a;#include <semaphore.h> 类型&#xff1a;sem_t 初始化&#xff1a;int sem_init(sem_t *sem, int pshared, unsigned int value); //程序中第一次对指定信号量调用p、v操…...

karmada-descheduler

descheduler规则 karmada-descheduler 定期检测所有部署&#xff0c;通常是每2分钟一次&#xff0c;并确定目标调度集群中无法调度的副本数量。它通过调用 karmada-scheduler-estimator 来完成这个过程。如果发现无法调度的副本&#xff0c;它将通过减少 spec.clusters 的配…...

【热门主题】000075 探索嵌入式硬件设计的奥秘

前言&#xff1a;哈喽&#xff0c;大家好&#xff0c;今天给大家分享一篇文章&#xff01;并提供具体代码帮助大家深入理解&#xff0c;彻底掌握&#xff01;创作不易&#xff0c;如果能帮助到大家或者给大家一些灵感和启发&#xff0c;欢迎收藏关注哦 &#x1f495; 目录 【热…...

Android okhttp请求

下面是一个用 OkHttp 封装的 GET 请求方法&#xff0c;适用于 Android 项目。该方法包括基本的网络请求、错误处理&#xff0c;并支持通过回调返回结果。 封装 GET 请求的工具类 添加依赖 在你的 build.gradle 文件中&#xff0c;确保添加了 OkHttp 的依赖&#xff1a; imple…...

嵌入式蓝桥杯学习4 lcd移植

cubemx配置 复制前面配置过的文件 打开cubemx&#xff0c;将PB8,PB9配置为GPIO-Output。 点击GENERATE CODE. 文件移植 1.打开比赛提供的文件包&#xff0c;点击Inc文件夹 2.点击Inc文件夹。复制fonts.h和lcd.h&#xff0c;粘贴到我们自己的工程文件夹的bsp中&#xff08…...

电子应用设计方案-38:智能语音系统方案设计

智能语音系统方案设计 一、引言 智能语音系统作为一种便捷、自然的人机交互方式&#xff0c;正逐渐在各个领域得到广泛应用。本方案旨在设计一个高效、准确、功能丰富的智能语音系统。 二、系统概述 1. 系统目标 - 实现高准确率的语音识别和自然流畅的语音合成。 - 支持多种语…...

渗透测试:网络安全的深度探索

一、引言 在当今数字化时代&#xff0c;网络安全问题日益凸显。企业和组织面临着来自各种恶意攻击者的威胁&#xff0c;他们试图窃取敏感信息、破坏系统或进行其他恶意活动。渗透测试作为一种主动的安全评估方法&#xff0c;能够帮助企业发现潜在的安全漏洞&#xff0c;提高网…...

基于SpringBoot的“小区物业管理系统”的设计与实现(源码+数据库+文档+PPT)

基于SpringBoot的“小区物业管理系统”的设计与实现&#xff08;源码数据库文档PPT) 开发语言&#xff1a;Java 数据库&#xff1a;MySQL 技术&#xff1a;SpringBoot 工具&#xff1a;IDEA/Ecilpse、Navicat、Maven 系统展示 系统功能结构图 个人信息界面图 费用信息管理…...