当前位置: 首页 > news >正文

Google I/O 2024 干货全解读:Gemini AI 横空出世,智能未来触手可及!

Google I/O 2024 干货全解读:Gemini AI 横空出世,智能未来触手可及!

博主猫头虎的技术世界

🌟 欢迎来到猫头虎的博客 — 探索技术的无限可能!

专栏链接

🔗 精选专栏

  • 《面试题大全》 — 面试准备的宝典!
  • 《IDEA开发秘籍》 — 提升你的IDEA技能!
  • 《100天精通鸿蒙》 — 从Web/安卓到鸿蒙大师!
  • 《100天精通Golang(基础入门篇)》 — 踏入Go语言世界的第一步!
  • 《100天精通Go语言(精品VIP版)》 — 踏入Go语言世界的第二步!
  • 《21天精通IPV4 To IPV6》 — 踏入新IP时代的大门!

领域矩阵

🌐 猫头虎技术领域矩阵
深入探索各技术领域,发现知识的交汇点。了解更多,请访问:

  • 猫头虎技术矩阵
  • 新矩阵备用链接

在这里插入图片描述

文章目录

  • Google I/O 2024 干货全解读:Gemini AI 横空出世,智能未来触手可及!
    • 关于 Gemini
      • 1. Gmail 中的 Gemini
      • 2. Gemini 1.5 Pro & Flash
      • 3. Gemini Live
      • 4. Gemini Nano
      • 5. Android 上的 Gemini
    • 新模型&项目
      • 1. Imagen3
      • 2. Veo 视频生成模型
      • 3. LearnLM 模型
      • 4. Project IDX
    • 应用&工具更新
      • 1. AI 在搜索中的应用
      • 2. 圈选搜索
      • 3. 在通话过程中检测诈骗
      • 4. 询问照片
      • 5. Firebase Genkit
      • 6. Google Play

Hello, 大家好!我是猫头虎,今天凌晨,Google I/O 开发者大会如期而至,持续了整整两个小时。相信很多朋友没有熬夜看发布会,所以我在这里为大家整理了一下重要内容,希望大家喜欢!

关于 Gemini

1. Gmail 中的 Gemini

Gmail 用户有福了,Gemini AI 将帮助大家更智能地搜索、总结和起草邮件。不仅如此,它还能处理复杂任务,例如搜索收件箱、查找收据和填写在线表格,非常适合处理电商退货等事务。

图片

2. Gemini 1.5 Pro & Flash

Gemini 1.5 Pro 新版本可以处理多达 200 万 token,比以前的容量翻倍。而针对要求较低的应用,Google 还推出了 Gemini 1.5 Flash,这是个“精炼”版本,适合高频生成 AI 工作负载,依然可以处理 200 万个 token 上下文窗口。

图片

3. Gemini Live

Google 还预览了 Gemini Live,让用户可以在智能手机上与 Gemini 进行“深入”的语音聊天。你可以在聊天中打断 Gemini,提出澄清问题,它会实时适应你的语音模式。还可以通过智能手机摄像头拍摄的照片或视频来让 Gemini 了解周围环境并做出反应。

图片

4. Gemini Nano

Gemini Nano 是最小的 AI 模型,将直接集成到 Chrome 桌面客户端中,让开发者可以在设备上使用模型来支持自己的 AI 功能。Google 计划利用这一新功能来增强 Gmail 中的“帮助我写作”工具。

图片

5. Android 上的 Gemini

Android 设备上的 Gemini 将成为 Google Assistant 的 AI 替代品。用户可以将 AI 生成的图像直接拖放到 Gmail、Google Messages 和其他应用程序中,还能从 YouTube 视频中查找特定信息。

图片

新模型&项目

1. Imagen3

谷歌推出了 Imagen 3 模型,相比前身 Imagen 2,它能更准确地理解文本提示并生成更创意和细致的图像。为防止深度伪造,Imagen 3 将使用 SynthID 技术应用不可见的加密水印。

图片

2. Veo 视频生成模型

Veo 是一个 AI 模型,可以根据文本提示创建大约一分钟长的 1080p 视频剪辑,能够捕捉不同的视觉和电影风格。谷歌计划探索故事板和生成更长场景的功能,以了解 Veo 的潜力。

图片

3. LearnLM 模型

谷歌推出了 LearnLM,一个针对学习进行“微调”的新生成 AI 模型系列,旨在“对话式”辅导学生一系列科目,已经在 Google 的多个平台上使用,正在通过 Google Classroom 的试点项目进行试用。

图片

4. Project IDX

Project IDX 是谷歌的下一代、以 AI 为中心、基于浏览器的开发环境,现已进入公开测试阶段。它是一种多平台开发体验,可以快速构建应用程序,集成了 Google Maps Platform、Chrome 开发工具和 Lighthouse,并支持 Cloud Run 的部署。

图片

应用&工具更新

1. AI 在搜索中的应用

谷歌为搜索构建了定制的 Gemini 模型,将实时信息、谷歌排名、长上下文和多模态特征结合在一起。这个 AI 驱动的搜索概述功能已经在美国向“数亿用户”推出,目标是在今年年底前向超过 10 亿人提供服务。

图片

2. 圈选搜索

由 AI 驱动的“圈选搜索”功能允许 Android 用户通过圈选、突出显示等手势立即获得答案,现在能解决更复杂的心理学和数学应用题。

图片

3. 在通话过程中检测诈骗

Google 将在未来的 Android 版本中内置一个功能,利用 Gemini Nano 实时检测诈骗对话模式,并提醒用户注意潜在的诈骗。

图片

4. 询问照片

Google Photos 推出了一项新功能“Ask Photos”,允许用户使用自然语言查询来搜索照片集,利用 AI 对照片内容和元数据的理解,让搜索更直观。

图片

5. Firebase Genkit

Firebase 平台新增了一个名为 Firebase Genkit 的功能,旨在让开发人员更轻松地使用 JavaScript/TypeScript 构建 AI 驱动的应用,并即将支持 Go 语言。

图片

6. Google Play

Google Play 增强了应用发现功能、用户获取方式,并推出了 Play Points 更新和开发者工具(如 Google Play SDK Console 和 Play Integrity API),为开发者提供更多支持。

图片


这次 Google I/O 发布的内容真是干货满满啊!Gemini 系列不仅覆盖了邮件、搜索、浏览器等多个场景,还推出了多种新模型和工具,期待未来这些功能能给我们的生活和工作带来更多便利。

我是猫头虎,感谢大家的阅读,我们下期再见!

在这里插入图片描述

👉 更多信息:有任何疑问或者需要进一步探讨的内容,欢迎点击下方文末名片获取更多信息。我是猫头虎博主,期待与您的交流! 🦉💬

🚀 技术栈推荐
GoLang, Git, Docker, Kubernetes, CI/CD, Testing, SQL/NoSQL, gRPC, Cloud, Prometheus, ELK Stack

💡 联系与版权声明

📩 联系方式

  • 微信: Libin9iOak
  • 公众号: 猫头虎技术团队

⚠️ 版权声明
本文为原创文章,版权归作者所有。未经许可,禁止转载。更多内容请访问猫头虎的博客首页。

点击下方名片,加入猫头虎领域社群矩阵。一起探索科技的未来,共同成长。

🔗 猫头虎社群 | 🔗 Go语言VIP专栏| 🔗 GitHub 代码仓库 | 🔗 Go生态洞察专栏

相关文章:

Google I/O 2024 干货全解读:Gemini AI 横空出世,智能未来触手可及!

Google I/O 2024 干货全解读:Gemini AI 横空出世,智能未来触手可及! 博主猫头虎的技术世界 🌟 欢迎来到猫头虎的博客 — 探索技术的无限可能! 专栏链接: 🔗 精选专栏: 《面试题大全》…...

深入理解JVM:介绍JVM的工作原理,包括类加载机制,内存模型,垃圾回收机制等

类加载机制: JVM的类加载机制主要包括加载、连接(验证、准备和解析)、初始化、使用和卸载五个阶段。第一个阶段是加载需求的.class文件到内存中。第二个阶段是完成对字节码的验证,为类变量分配内存并初始化为对应类型默认值。第三…...

Springboot+Vue项目-基于Java+MySQL的民族婚纱预定系统(附源码+演示视频+LW)

大家好!我是程序猿老A,感谢您阅读本文,欢迎一键三连哦。 💞当前专栏:Java毕业设计 精彩专栏推荐👇🏻👇🏻👇🏻 🎀 Python毕业设计 &…...

Java面经学习2

来源 https://www.nowcoder.com/discuss/619573767051800576 1.一面内容 RocketMQ延时消息(项目用到了)底层怎么实现的(不会) 消息量太大导致读消息延迟时间很长怎么办 redis为什么快(说了内存、数据结构优化、单线…...

Java bin目录中的文件如何执行?

在 Java 项目中,bin 目录通常用于存放编译后的 .class 文件。如果你将编译后的 .class 文件放在 bin 目录中,需要确保在运行 Java 程序时指定正确的类路径。下面是一个简单的例子说明如何执行 bin 目录中的文件。 假设你的项目结构如下: pr…...

Kafka和Spark Streaming的组合使用学习笔记(Spark 3.5.1)

一、安装Kafka 1.执行以下命令完成Kafka的安装: cd ~ //默认压缩包放在根目录 sudo tar -zxf kafka_2.12-2.6.0.tgz -C /usr/local cd /usr/local sudo mv kafka_2.12-2.6.0 kafka-2.6.0 sudo chown -R qiangzi ./kafka-2.6.0 二、启动Kafaka 1.首先需要启动K…...

5.9网络协议

由网卡发送数据通过网线进行发送,当网卡接收到信号以后将数据传给内核数据区,然后由操作系统交给相应的进程。 将数据进行发送的时候需要借助于网线实现,这个时候会出现当传输的数据比较远的时候就借助于中继器将信号进行再生扩大&#xff0…...

QT客户端开发的注意事项

QT客户端开发是一个涉及图形用户界面(GUI)设计、网络编程、数据库交互等多个方面的复杂过程。以下是在进行QT客户端开发时应注意的一些关键事项,通过关注这些事项,可以提高QT客户端应用的质量和开发效率。北京木奇移动技术有限公司…...

k8s源码编译失败:Makefile:1: *** 缺失分隔符。 停止。

目录 问题解决 更换Arch或系统 问题解决 编译k8s源码的kubelet时执行make失败:Makefile:1: *** 缺失分隔符。 停止。 首先,查看文件内容 # cat Makefile build/root/Makefile 修改Makefile,给第一行前增加include,如下&…...

服务器数据恢复—拯救raid5阵列数据行动,raid5数据恢复案例分享

Raid5数据恢复算法原理: 分布式奇偶校验的独立磁盘结构(被称之为raid5)的数据恢复有一个“奇偶校验”的概念。可以简单的理解为二进制运算中的“异或运算”,通常使用的标识是xor。运算规则:若二者值相同则结果为0&…...

旅游集市数仓建设

旅游集市数仓建设 小白如何从0到1成为大数据工程师 目录 旅游集市数仓建设 1.上传数据 2.可能用到的UDF函数 3.创建所需数据库及表 1)ODS层 ①ods_oidd ②ods_wcdr ③ods_ddr ④ods_dpi 2)DWD层 ①dwd_res_regn_mergelocation_msk_d ②dwm_s…...

vue实现点击高亮效果

<view class"tabs"><textv-for"(item, index) in subTypes":key"item.id"class"text":class"{ active: index activeIndex }"//动态绑定高亮类&#xff1a;判断下标是否等于当前下标tap"activeIndex index&…...

uniapp 配置请求代理+请求封装

uniapp官网提供了三种方式&#xff1a;什么是跨域 | uni-app官网 1. 通过uniapp自带浏览器 打开项目是不存在跨域的 第二种方式&#xff1a; "h5" : {"template" : "static/index.html","devServer": {"proxy": {&quo…...

代码随想录算法训练营第二十八天|​216.组合总和III​、17.电话号码的字母组合

216.组合总和III 文档讲解:代码随想录 题目链接&#xff1a;. - 力扣&#xff08;LeetCode&#xff09; 这一题与昨天的组合差不多&#xff0c;区别就在只有和是目标值的时候才会加入到result数组中&#xff0c;并且在回溯时&#xff0c;会处理sum的值 class Solution:def __i…...

大模型prompt实例:知识库信息质量校验模块

大模型相关目录 大模型&#xff0c;包括部署微调prompt/Agent应用开发、知识库增强、数据库增强、知识图谱增强、自然语言处理、多模态等大模型应用开发内容 从0起步&#xff0c;扬帆起航。 大模型应用向开发路径&#xff1a;AI代理工作流大模型应用开发实用开源项目汇总大模…...

正则表达式和lambda表达式

正则表达式&#xff08;Regular Expressions&#xff09;和Lambda表达式虽然都包含“表达式”一词&#xff0c;但它们在编程中的作用和用法是完全不同的。让我们详细比较一下它们的定义、用途和应用场景&#xff1a; 正则表达式 定义&#xff1a;正则表达式是一种用于匹配文本…...

pyenv 之 python 多版本管理(win11)

1. 背景 常常会用到Python的多个版本&#xff0c;因此可以使用Pyenv来对Python版本进行管理。 2. win11下载 pyenv 在终端执行下载语句&#xff1a; pip install pyenv-win --target D:\software\pyenv 其中 D:\software\pyenv 为你想要下载到的文件目录&#xff0c;建议在 …...

nodemon运行ts文件

https://juejin.cn/post/7035637086451400734 nodemon经常用来调试js文件&#xff0c;大家都是知道的&#xff0c;但是用nodemon来调试ts文件&#xff0c;大家试过吗&#xff1f; 如果直接运行nodemon index.ts是会报错的。 ts 复制代码 //index.ts console.log(1) 需要全局…...

内网渗透瑞士军刀-impacket工具解析(二)

impacket工具解析之Kerberos认证协议 上一期我们介绍了impacket中ntlm协议的实现&#xff0c;在Windows认证中除了使用ntlm认证&#xff0c;还支持Kerberos认证协议&#xff0c;Kerberos认证也是Windows 活动目录中占比最高的认证方式。 什么是Kerberos协议&#xff1f; Kerb…...

huggingface 笔记:pipeline

1 介绍 pipeline() 是使用预训练模型进行推理的最简单和最快速的方式。可以针对不同模态的许多任务直接使用 pipeline() 2 举例&#xff1a;情感分析 2.1 创建pipeline实例 from transformers import pipelineclassifier pipeline("sentiment-analysis") #首先创…...

告别VS Code!用CLion 2024.3 + CUDA 12.1搭建高效GPU开发环境(附CMake配置避坑指南)

CLion 2024.3 CUDA 12.1&#xff1a;打造专业级GPU开发环境的终极指南 在GPU加速计算领域&#xff0c;开发者长期面临一个两难选择&#xff1a;是使用功能全面但笨重的Visual Studio&#xff0c;还是选择轻量灵活但功能有限的VS Code&#xff1f;JetBrains CLion 2024.3的出现…...

OpenClaw 环境搭建|可视化操作零门槛

&#x1f4cc; OpenClaw 一键安装包&#xff5c;一键部署&#xff0c;告别复杂环境配置 适配系统&#xff1a;Windows10/11 64 位当前版本&#xff1a;v2.7.5&#xff08;虾壳云版&#xff09; ⭐ 核心优势 全程可视化操作&#xff0c;无需命令行、无需手动配置 Python/Node…...

集成测试实战

软件测试理论&#xff1a;https://blog.csdn.net/2402_88266590/article/details/160966638?spm1011.2415.3001.5331 单元测试实战&#xff1a;https://blog.csdn.net/2402_88266590/article/details/161017518?spm1001.2014.3001.5502 下面就开始进入集成测试的学习吧&…...

别再混着用了!C++里malloc、new和vector到底该怎么选?一个真实项目踩坑复盘

别再混着用了&#xff01;C里malloc、new和vector到底该怎么选&#xff1f;一个真实项目踩坑复盘 在开发一个高性能数据缓存管理器时&#xff0c;团队新成员提交的代码引发了持续三天的内存泄漏排查。同一个功能模块中竟同时出现了malloc、new和vector三种内存管理方式&#xf…...

3分钟掌握MPC Video Renderer:免费开启Windows高清视频播放新体验

3分钟掌握MPC Video Renderer&#xff1a;免费开启Windows高清视频播放新体验 【免费下载链接】VideoRenderer Внешний видео-рендерер 项目地址: https://gitcode.com/gh_mirrors/vi/VideoRenderer 你是否厌倦了Windows系统上平淡无奇的视频播放效…...

避开FPGA设计里的“定时炸弹”:用Vivado Report Clock Interaction排查跨时钟域隐患(附常见约束误区)

避开FPGA设计里的"定时炸弹"&#xff1a;用Vivado Report Clock Interaction排查跨时钟域隐患&#xff08;附常见约束误区&#xff09; 在FPGA系统级设计中&#xff0c;时钟域交叉(CDC)问题就像一颗隐藏的定时炸弹&#xff0c;随时可能在产品量产或现场运行时引爆。据…...

别再手动配环境了!用VMware一键导入bee-box镜像,5分钟搞定bWAPP靶场

5分钟极速部署bWAPP靶场&#xff1a;VMware镜像导入全指南 对于刚踏入Web安全领域的新手来说&#xff0c;最令人头疼的往往不是漏洞原理本身&#xff0c;而是那些看似简单却暗藏玄机的环境配置。PHP版本不兼容、MySQL服务启动失败、Apache模块缺失...这些"拦路虎"消…...

PCB半孔工艺的‘暗坑’全揭秘:从锣刀转速到孔铜结合力,资深CAM工程师的避雷手册

PCB半孔工艺的‘暗坑’全揭秘&#xff1a;从锣刀转速到孔铜结合力&#xff0c;资深CAM工程师的避雷手册 在高速通信模块和微型化硬件设计中&#xff0c;半孔工艺正成为PCB制造领域的关键技术节点。这种将金属化孔沿轴线剖开形成半圆形导电结构的工艺&#xff0c;虽能节省空间并…...

Linux玩转硬件调试:用CH347芯片一站式搞定JTAG、SWD、SPI Flash和EEPROM(含中断检测实战)

Linux玩转硬件调试&#xff1a;用CH347芯片一站式搞定JTAG、SWD、SPI Flash和EEPROM&#xff08;含中断检测实战&#xff09; 在嵌入式开发和硬件逆向工程领域&#xff0c;调试工具的选择往往决定了工作效率的上限。传统方案需要购置价格高昂的专用调试器&#xff0c;而CH347芯…...

AnyVisLoc:专为低空多视角无人机定位打造的全球首个统一评测基准

一、论文背景与开创性意义 AnyVisLoc 是专为低空多视角条件下的无人机绝对视觉定位&#xff08;Absolute Visual Localization&#xff0c;简称 AVL&#xff09;设计的全球首个统一评测基准与大尺度数据集&#xff0c;论文题为 《Exploring the best way for UAV visual local…...