2023 谷歌I/O发布会新AI,PALM 2模型要反超GPT-4,一雪前耻!
文章目录
- 1 前言
- 2 Google I/O 发布者大会
- 3 PaLM 2模型
- 3 Bard项目
- 4 其他AI工具
- 4.1 AI 图片编辑 Magic Editor
- 4.2 Duet AI 办公
- 4.3 Universal Translator 翻译工具
- 4.4 Google 沉浸式导航
- 4.5 Google 搜索引擎
- 5 讨论
1 前言
每年必看两大会,苹果发布会和谷歌发布会,除了英语听力磨耳朵,看看库克飞檐走壁,吃瓜掉链子外,关注前沿技术,更是为了感受科技改变生活,本篇文章仅围绕人工智能AI方面
进行描述:
谷歌其实一直都是AI的老牌公司,眼看这一年被ChatGPT力压火的一塌糊涂,抢尽风头。去年OpenAI的ChatGPT突然发布确实是波**“偷袭”,措不及防。谷歌在2月才匆匆发布第一代Bard“应付”**一下,但是首次亮相就自信的出错。当时示例是“我可以告诉我 9 岁的孩子关于詹姆斯·韦伯太空望远镜的哪些新发现?”查询读取。机器很快吐出三个想法,包括最后一个想法,“JWST 拍摄了我们太阳系外行星的第一张照片。但并非JWST拍摄的。2004 年,这一荣誉属于欧洲南方天文台的甚大望远镜 (VLT),美国宇航局证实了这一点。
有小伙伴就会问,**怎么这么扣细节?ChatGPT不也经常语无伦次吗?**非也,关于ChatGPT可以回看这篇文章,排除个别网友故意训练错误信息(即保证数据库纯净)外,需要正确的提问(引导)才能得到正确的回答:https://mp.weixin.qq.com/s/o4MeE_x0YwPVzSrybyoEVg
还有的小伙伴可能觉得AI这个话题年年谈,年年有,是不是要近饱和了?也不是,打个比喻,人们在冰海上远远的发现一块“浮冰”,有破冰船了接近一看发现是个冰山,等有条件下潜了才渐渐发现“真理面纱”。确实是越探索,知道的越多越觉得无知。
AI从未接近饱和,甚至可以说是刚开始,才刚摸到门槛。
2 Google I/O 发布者大会
北京时间5月11日凌晨,**「Google I/O 发布者大会」**亮相,全会围绕“Making AI more helpful for everyone”让人工智能对各个领域各尽所长。
目前还未恰到饭,侧重点在于PaLM 2模型、Bard和其他相关的AI工具。
3 PaLM 2模型
OpenAI的GPT-4模型现在公认一家独大,现谷歌宣布PaLM 2可以一战,下述内容基于谷歌发表的技术报告
其中提到三大亮点:
- 多语言性: PaLM 2 在多语言文本方面接受了更多的训练,涵盖 100 多种语言。这显着提高了它在多种语言中理解、生成和翻译细微差别文本(包括成语、诗歌和谜语)的能力,这是一个很难解决的问题。PaLM 2 还通过了“精通”级别的高级语言能力考试。
- 推理: PaLM 2 的广泛数据集包括科学论文和包含数学表达式的网页。因此,它展示了逻辑、常识推理和数学方面的改进能力。
- 编码: PaLM 2 在大量公开可用的源代码数据集上进行了预训练。这意味着它擅长 Python 和 JavaScript 等流行的编程语言,但也可以生成 Prolog、Fortran 和 Verilog 等语言的专用代码。
这里是对比于PaLM1代,也是在文件中提到放在第一位的就是语言能力。按照CEFR定义,每场写作考试都由三位专业的母语人士进行评分,PaLM 2的日语达到了A/特别A级,在法语方面达到了C1级。这个是很有用的,做科研的都知道,一定条件下机翻是永远替代不了原生语言,不然润色服务也不会这么盆满钵满了。
解释翻译的波斯谚语的含义,挺有意思的,能理解深意,还是着重在**“会思考”**,这是区别人工智能和人工机器的一大关键点。
这是各语言下1代和2代的一个ROC评分,可以理解为是准确性,越高越好
横向对比12
种编程语言评估,可以理解为与人工作的一个编码的准确性,也是越高越好
3 Bard项目
Bard是和ChatGPT一样是个语言模型,中文名字叫巴德,就是在今天凌晨,谷歌已经取消wait list
名单了,直接开放于180个国家和地区,和微软一样重磅,微软是在五一期间开放了New Bing
,但是每天只能问20个问题,笔者还在测试中,埋个伏笔。
Bard是搭载了PaLM2模型
的,按技术报告来看应该是挺牛的,据说编程能力更胜一筹,大家可以体验一下,不过暂不支持中文,Bard网址:https://bard.google.com/
有意思:
4 其他AI工具
4.1 AI 图片编辑 Magic Editor
这一张是调色,然后把长椅移到画面中间以保持空间填充,精神抖擞。不过还是小有瑕疵,观察一下长椅的阴影,但是笔者认为比起iPhone14Pro的高度锐化和三星的“创造月球照片”好多了:
Google 分享了几个 Magic Editor 的实际应用示例,它们都非常酷。在一张人在瀑布前的照片中,谷歌将人完全移到照片的一侧,抹去背景中的人,并使天空更蓝。
无法上传GIF,可移步到下方公众号查看原文
听说该工具会优先登陆于谷歌的Pixel手机。
4.2 Duet AI 办公
涵盖了一系列适用于 Google 生产力应用程序的生成式 AI 工具。正如我们今年早些时候详述的那样,这包括 Docs 和 Gmail 中的写作帮助、幻灯片的图像生成、Meet 的自动会议摘要等等。但在谷歌 I/O 上,唯一真正的新闻是写作辅助也将出现在移动版 Gmail 中,它将被标记为“帮我写”——Smart Compose 的升级版。
- 轻松生成专业化的岗位描述
- 在Gmail将会议记录转换成电子邮件
- 还有很多~~~~
但是使用仍需加入workspace的waitlist,只能等了
网址:https://workspace.google.com/labs-sign-up/
4.3 Universal Translator 翻译工具
该工具旨在将视频从一种语言翻译成另一种语言,同时保留整体基调和氛围。这意味着该实用程序不仅可以将音频从一种语言翻译成另一种语言,还可以模仿说话者的声音、语气和面部表情。输出的人说话视频会根据目标语言的发音同步嘴唇的动作。
如上图所示,Universal Translator 首先检测单词并进行翻译。然后,它会检查说话者的语气以及他们强调的内容。结合这两个方面后,它会生成目标语言的语音。最后,它会根据 AI 生成的语音的发音同步视频中说话者的嘴唇。
但是一向注重版权的歪果仁肯定会考虑到安全这点,所以会限制一般用户,需要授权通过才能使用。
4.4 Google 沉浸式导航
谷歌地图一直都很牛,不少人用过Google Earth
,好评连连吧。这一次升级体现在**“沉浸式”,新视图将填充 3D 建筑、植被,为用户提供更好的视角,在展示街道及其周围环境的同时提供更多细节。用户不仅可以实时查看所有这些信息,还可以调整时间以查看天气和交通在过去几个小时内可能发生的变化,实现真正的云游**。
这个功能在夏季推出,到 2023 年底将在 15 个城市推出。
4.5 Google 搜索引擎
这个功能放在最后,与 Microsoft 的Bing
体验类似,这个新面板中有一些东西,所有这些都是为了让你在输入更自然的搜索提示时一目了然的信息。
该体验即将登陆谷歌实验室,并将在未来几周内推出,还是要申请waitlist
。
5 讨论
人工智能的发展其实在第一波ChatGPT惊雷后是没有太大感觉差异的,因为后续的更新换代和接二连三的同台竞技产品(文心一言、阿里的AI、和鲸的AI等),即便是很多镜像的,“国产ChatGPT”,都是大语言模型
,一代又一代只是算法上的优化和扩大模型,在我们的基础使用体验上并没有太大差别。
笔者觉得人工智能现在掀起的波浪其实遍布各个方向,只不过我们大多数人都只关注于文本聊天模型,所以还没接触到真正的“AI改变生活”
,不过这个交给专业团队,交给工业界了,外行看热闹,内行看门道,作为不涉及研发,不涉及开发的我们,看着门道的热闹也是可以的
相关文章:

2023 谷歌I/O发布会新AI,PALM 2模型要反超GPT-4,一雪前耻!
文章目录 1 前言2 Google I/O 发布者大会3 PaLM 2模型3 Bard项目4 其他AI工具4.1 AI 图片编辑 Magic Editor4.2 Duet AI 办公4.3 Universal Translator 翻译工具4.4 Google 沉浸式导航4.5 Google 搜索引擎 5 讨论 1 前言 每年必看两大会,苹果发布会和谷歌发布会&am…...

MySQL和Redis如何保证数据一致性?
前言 由于缓存的高并发和高性能已经在各种项目中被广泛使用,在读取缓存这方面基本都是一致的,大概都是按照下图的流程进行操作: 但是在更新缓存方面,是更新完数据库再更新缓存还是直接删除缓存呢?又或者是先删除缓存再…...
Markdown使用(超详细)
(HBuilderX) 掌握md及HBuilderX对md的强大支持。如果没有点右键设置自动换行,可按Alt滚轮横向滚动查看。 很多人只把markdown用于网络文章发表,这糟蹋了markdown。 markdown不止是HTML的简化版,更重要的是txt的升级版…...
yolov5实现扑克牌识别的产品化过程
文章目录 介绍项目下载硬件准备软件环境素材获取自行获取素材网盘获取图片标注模型训练窗口截图窗口截图(HWND)桌面截图wgc方法最终采用的方式WGC使用方法如何保存灰度图片python 如何加载dll库图片推理扑克牌逻辑ui编写模型加密软件授权软件加密软件打包安装包制作...

第07讲:Java High Level Client,读写 ES 利器
SkyWalking OAP 后端可以使用多种存储对数据进行持久化,例如 MySQL、TiDB 等,默认使用 ElasticSearch 作为持久化存储,在后面的源码分析过程中也将以 ElasticSearch 作为主要存储进行分析。 ElasticSearch 基本概念 本课时将快速介绍一下 E…...
dockerfile暴力处理配置文件外提
前言: 一般来说,springboot打成的jar运行时,同目录/config目录下放application.yml文件会被进行加载,然后通过设置docker映射出宿主机即可做到配置文件外配的效果,但很多时候别的配置文件做不到这种效果,说…...
如何快速给出解释——正交矩阵子矩阵的特征值的模必然不大于1
Memory 首先快速回忆一下正交矩阵的定义: A为n阶实矩阵,且满足A‘AE或是说AA’E,那么A为正交矩阵。 (啊,多么简洁的定义) 其次快速想到它的性质: ① 实特征值必然 或 其他复数…...
c语言-位运算
位运算小结 位运算不管是在C语言中,或者其他语言,都是经常会用到的,所以本文也就不固定以某种语言来举例子了,原始点就从0、1开始。位运算主要包括按位与(&)、按位或(|)、按位异或(^)、取反(~)、左移(<<)、右移(>…...

【Android学习专题】安卓样式学习(学习内容记录)
学习记录内容来自《Android编程权威指南(第三版)》 样式调整和添加 调整颜色资源(res/values/colors.xml) 格式: 添加样式(res/values/styles.xml),(创建BeatBox项目时…...
普罗米修斯统计信息上报结构设计
为了实现高效的监控和警报,普罗米修斯提供了一个强大的统计信息上报机制。通过这个机制,可以将应用程序的各种统计信息发送到普罗米修斯,普罗米修斯会对这些信息进行处理,然后提供丰富的监控和警报功能。下面是基本的统计信息上报…...
两个系统之间的传值
在两个系统之间传值可以采用以下几种方式: 使用 URL 参数:可以将数据作为 URL 参数传递给另一个系统,另一个系统可以解析 URL 参数并获取数据。例如:Example Domain 使用 Cookie:可以在一个系统中设置 Cookie…...

PostgreSQL(五)JDBC连接串常用参数
目录 1.单机 PostgreSQL 连接串2.集群PostgreSQL 连接串 PostgreSQL JDBC 官方驱动下载地址: https://jdbc.postgresql.org/download/ PostgreSQL JDBC 官方参数说明文档: https://jdbc.postgresql.org/documentation/use/ 驱动类: driver-…...
如何修改浏览器中导航栏的背景色和字体
在日常使用电脑时,我们总会使用浏览器来浏览网页。而浏览器中的导航栏是用户进行网页浏览的主要界面之一,其背景色和字体的选择对用户的体验有着重要的影响。因此,为了让导航栏更加美观和易于使用,我们需要对其背景色和字体进行修…...

如何选择合适的智能氮气柜?
随着电子产品的普及,IC、半导体、精密元件、检测仪器之类的物品对湿度要求越来越高,潮湿、霉菌和金属氧化所造成的损害,随时在发生。人们对于物品的存放环境要求逐渐提高,利用防潮设备如智能氮气柜、电子防潮柜来存储产品也越来越…...

双向链表(数据结构)(C语言)
目录 概念 带头双向循环链表的实现 前情提示 双向链表的结构体定义 双向链表的初始化 关于无头单向非循环链表无需初始化函数,顺序表、带头双向循环链表需要的思考 双向链表在pos位置之前插入x 双向链表的打印 双链表删除pos位置的结点 双向链表的尾插 关…...

离线安装Percona
前言 安装还是比较简单,这边简单进行记录一下。 版本差异 一、离线安装Percona 下载percona官网 去下载你需要对应的版本 jemalloc-3.6.0-1.el7.x86_64.rpm 需要单独下载 安装Percona 进入RPM安装文件目录,执行下面的脚本 yum localinstall *.rpm修改…...

界面控件Telerik UI for WinForms使用指南 - 数据绑定 填充(二)
Telerik UI for WinForms拥有适用Windows Forms的110多个令人惊叹的UI控件,所有的UI for WinForms控件都具有完整的主题支持,可以轻松地帮助开发人员在桌面和平板电脑应用程序提供一致美观的下一代用户体验。 Telerik UI for WinForms组件为可视化任何类…...

通过栈/队列/优先级队列/了解容器适配器,仿函数和反向迭代器
文章目录 一.stack二.queue三.deque(双端队列)四.优先级队列优先级队列中的仿函数手搓优先级队列 五.反向迭代器手搓反向迭代器 vector和list我们称为容器,而stack和queue却被称为容器适配器。 这和它们第二个模板参数有关系,可以…...
leetcode 704. 二分查找
题目描述解题思路执行结果 leetcode 704. 二分查找 题目描述 二分查找 给定一个 n 个元素有序的(升序)整型数组 nums 和一个目标值 target ,写一个函数搜索 nums 中的 target,如果目标值存在返回下标,否则返回 -1。 示…...

蓝牙耳机什么牌子好?500内好用的蓝牙耳机推荐
随着蓝牙耳机的受欢迎程度越来越高,近几年来,无蓝牙耳机市场呈爆发式增长,蓝牙耳机品牌也越来越多。那么蓝牙耳机什么牌子好?接下来,我来给大家推荐几款500内好用的蓝牙耳机,一起来看看吧。 一、南卡小音舱…...

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明
LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造,完美适配AGV和无人叉车。同时,集成以太网与语音合成技术,为各类高级系统(如MES、调度系统、库位管理、立库等)提供高效便捷的语音交互体验。 L…...

Chapter03-Authentication vulnerabilities
文章目录 1. 身份验证简介1.1 What is authentication1.2 difference between authentication and authorization1.3 身份验证机制失效的原因1.4 身份验证机制失效的影响 2. 基于登录功能的漏洞2.1 密码爆破2.2 用户名枚举2.3 有缺陷的暴力破解防护2.3.1 如果用户登录尝试失败次…...

JavaSec-RCE
简介 RCE(Remote Code Execution),可以分为:命令注入(Command Injection)、代码注入(Code Injection) 代码注入 1.漏洞场景:Groovy代码注入 Groovy是一种基于JVM的动态语言,语法简洁,支持闭包、动态类型和Java互操作性,…...

Flask RESTful 示例
目录 1. 环境准备2. 安装依赖3. 修改main.py4. 运行应用5. API使用示例获取所有任务获取单个任务创建新任务更新任务删除任务 中文乱码问题: 下面创建一个简单的Flask RESTful API示例。首先,我们需要创建环境,安装必要的依赖,然后…...
Java 8 Stream API 入门到实践详解
一、告别 for 循环! 传统痛点: Java 8 之前,集合操作离不开冗长的 for 循环和匿名类。例如,过滤列表中的偶数: List<Integer> list Arrays.asList(1, 2, 3, 4, 5); List<Integer> evens new ArrayList…...

智慧工地云平台源码,基于微服务架构+Java+Spring Cloud +UniApp +MySql
智慧工地管理云平台系统,智慧工地全套源码,java版智慧工地源码,支持PC端、大屏端、移动端。 智慧工地聚焦建筑行业的市场需求,提供“平台网络终端”的整体解决方案,提供劳务管理、视频管理、智能监测、绿色施工、安全管…...

大数据零基础学习day1之环境准备和大数据初步理解
学习大数据会使用到多台Linux服务器。 一、环境准备 1、VMware 基于VMware构建Linux虚拟机 是大数据从业者或者IT从业者的必备技能之一也是成本低廉的方案 所以VMware虚拟机方案是必须要学习的。 (1)设置网关 打开VMware虚拟机,点击编辑…...
鱼香ros docker配置镜像报错:https://registry-1.docker.io/v2/
使用鱼香ros一件安装docker时的https://registry-1.docker.io/v2/问题 一键安装指令 wget http://fishros.com/install -O fishros && . fishros出现问题:docker pull 失败 网络不同,需要使用镜像源 按照如下步骤操作 sudo vi /etc/docker/dae…...
全面解析各类VPN技术:GRE、IPsec、L2TP、SSL与MPLS VPN对比
目录 引言 VPN技术概述 GRE VPN 3.1 GRE封装结构 3.2 GRE的应用场景 GRE over IPsec 4.1 GRE over IPsec封装结构 4.2 为什么使用GRE over IPsec? IPsec VPN 5.1 IPsec传输模式(Transport Mode) 5.2 IPsec隧道模式(Tunne…...
Spring AI与Spring Modulith核心技术解析
Spring AI核心架构解析 Spring AI(https://spring.io/projects/spring-ai)作为Spring生态中的AI集成框架,其核心设计理念是通过模块化架构降低AI应用的开发复杂度。与Python生态中的LangChain/LlamaIndex等工具类似,但特别为多语…...