当前位置：首页 > news >正文

通过Colab部署Google最新发布的Gemma模型

news 2026/2/9 20:00:16

Gemma的简单介绍

Gemma 是一系列轻量级、最先进的开放式模型，采用与创建 Gemini 模型相同的研究和技术而构建。 Gemma 由 Google DeepMind 和 Google 的其他团队开发，其灵感来自 Gemini，其名称反映了拉丁语 gemma，意思是“宝石”。除了模型权重之外，Google还发布了工具来支持开发人员创新、促进协作并指导负责任地使用 Gemma 模型。

以下是关键细节：

发布了两种尺寸的模型配重：Gemma 2B 和 Gemma 7B。每个尺寸都发布了经过预训练和指令调整的变体。
Responsible Generative AI 工具包为使用 Gemma 创建更安全的 AI 应用程序提供了指导和基本工具。
通过原生 Keras 3.0 提供跨所有主要框架的推理和监督微调 (SFT) 工具链：JAX、PyTorch 和 TensorFlow。
即用型 Colab 和 Kaggle 笔记本，以及与 Hugging Face、MaxText、NVIDIA NeMo 和 TensorRT-LLM 等流行工具的集成，让您可以轻松开始使用 Gemma。
预先训练和指令调整的 Gemma 模型可以在您的笔记本电脑、工作站或 Google Cloud 上运行，并可轻松部署在 Vertex AI 和 Google Kubernetes Engine (GKE) 上。
跨多个 AI 硬件平台的优化可确保行业领先的性能，包括 NVIDIA GPU 和 Google Cloud TPU

基于Colab的搭建过程

注册Colab账号，全称Colaboratory，谷歌推出的笔记本应用，可以在线运行Python程序，是Google运行的Jupyter Notebooks，提供免费的CPU和GPU运算。
登录下方网址，进入Kaggle，找到Gemma模型，kaggle是一个被谷歌收购的科学竞赛社区，上面会发布各种模型和资料。Gemma | Kagglehttps://www.kaggle.com/models/google/gemma
注册Kaggle账号，然后进入Settings，设置API并下载打开Kaggle.json文件，记住里面的账号名和密码，然后添加到Colab的环境变量中，名称分别为KAGGLE_KEY和KAGGLE_USERNAME.

填写Gemma模型的使用条款，如图所示的绿色图标位置

进入Colab笔记本，配置环境，设置连接的服务器，选择更改运行时的类型，选择T4，然后会看到这个图标显示。

安装keras-nlp和keras，安装完可能会提示重启Session，按提示来

!pip install -U keras-nlp
!pip install -U keras

然后我们import一下库，先把用户信息变量设置好

import os
from google.colab import userdataos.environ["KAGGLE_USERNAME"] = userdata.get('KAGGLE_USERNAME')
os.environ["KAGGLE_KEY"] = userdata.get('KAGGLE_KEY')

然后配置环境，导入模型

import keras
import keras_nlp
import numpy as npos.environ["KERAS_BACKEND"] = "jax"  # Or "tensorflow" or "torch".gemma_lm = keras_nlp.models.GemmaCausalLM.from_preset("gemma_2b_en")

输入下面命令查看是否运行成功，成功的话会和下面图片显示一致

gemma_lm.summary()

使用方法的话，就是直接写代码加提示词

gemma_lm.generate(["Keras is a", "I want to say"], max_length=30)

通过Colab部署Google最新发布的Gemma模型

Gemma的简单介绍 Gemma 是一系列轻量级、最先进的开放式模型，采用与创建 Gemini 模型相同的研究和技术而构建。 Gemma 由 Google DeepMind 和 Google 的其他团队开发，其灵感来自 Gemini，其名称反映了拉丁语 gemma，意思是“宝石”…...

编程日记 2024/2/25 19:44:48

spring中@validate注解使用

在 Java 中，我们可以使用注解和 validate 实现对实体类中字段的校验。其中，注解用来定义字段的约束条件，而 validate 则用来进行实际的校验操作。常用的校验注解包括 NotNull、NotEmpty、Size、Min、Max 等，它们可以帮助我们规定…...

编程日记 2024/2/25 19:38:43

停车场管理（C语言）

【题目描述】停车场管理。设有一个可以停放n辆汽车的狭长停车场，它只有一个大门可以供车辆进出。车辆按到达停车场时间的先后次序依次从停车场最里面向大门口处停放 (即最先到达的第一辆车停放在停车场的最里面) 。如果停车场已放满n辆车，则以后到达的车…...

编程日记 2024/2/25 19:36:41

探索无限：Sora与AI视频模型的技术革命 - 开创未来视觉艺术的新篇章

✨✨ 欢迎大家来访Srlua的博文（づ￣3￣）づ╭❤～✨✨ 🌟🌟 欢迎各位亲爱的读者，感谢你们抽出宝贵的时间来阅读我的文章。我是Srlua，在这里我会分享我的知识和经验。&#x…...

编程日记 2024/2/25 19:32:37

375FPS! 谷歌提出MaskConver“重校正用于全景分割的纯卷积模型

https://arxiv.org/2312.06052 近年来，基于Transformer的模型由于其强大的建模能力以及对语义类和实例类的统一表示为全局二值掩码，在全景分割中占据主导地位。在本文中，我们回顾了纯粹的卷积模型，并提出了一种新的结构MaskConve…...

编程日记 2024/2/25 19:27:33

leetcode初级算法（python）- 数组

文章目录 1.从排序数组中删除重复项2.买卖股票最佳时机23.旋转数组运行颠倒列表法整体移动元素块法4.存在重复运行包含判断法排序比较判断法运行集合判断法5.只出现一次的数字6.两个数组的交集27.移动零8.两数之和9.旋转图像这篇博客中的代码都是数组计算。 1.从排序数组中删除…...

编程日记 2024/2/25 19:25:31

重新定义音乐创作：ChatGPT与未来音乐产业的融合

### 重新定义音乐创作：ChatGPT与未来音乐产业的融合随着人工智能技术的飞速发展，ChatGPT不仅在文字创作领域大放异彩，也正逐步渗透并重塑音乐产业的未来。这种先进的语言模型，如今已成为音乐家、作曲家和制作人们手中的一把利剑…...

编程日记 2024/2/25 19:24:30

人工智能绘画的时代下到底是谁在主导,是人类的想象力,还是AI的创造力?

#ai作画目录一.AI绘画的概念 1. 数据集准备： 2. 模型训练： 3. 生成绘画： 二.AI绘画的应用领域三.AI绘画的发展四.AI绘画背后的技术剖析 1.AI绘画的底层原理 2.主流模型的发展趋势 2.1VAE — 伊始之门 2.2GAN 2.2.1GAN相较于…...

编程日记 2024/2/25 19:20:25

[HTML]Web前端开发技术29（HTML5、CSS3、JavaScript ）JavaScript基础——喵喵画网页

希望你开心，希望你健康，希望你幸福，希望你点赞！最后的最后，关注喵，关注喵，关注喵，佬佬会看到更多有趣的博客哦！！！喵喵喵，你对我真的很重要！目录前言上一节的课后练习...

编程日记 2024/2/25 19:19:24

文本编辑器markdown语法

markdown语法 1.介绍 Markdown是一种使用一定的语法将普通的文本转换成HTML标签文本的编辑语言，它的特点是可以使用普通的文本编辑器来编写，只需要按照特定的语法标记就可以得到丰富多样的HTML格式的文本。 2.标题分级 "# " -> 一级标题 &…...

编程日记 2024/2/25 19:18:23

【C++】类和对象之拷贝构造函数篇

个人主页 ： zxctscl 文章封面来自：艺术家–贤海林如有转载请先通知文章目录 1. 前言2. 传值传参和传引用传参3. 概念4. 特征 1. 前言在前面学习了6个默认成员函数中的构造函数和析构函数【C】构造函数和析构函数详解，接下来继续往后看拷…...

编程日记 2024/2/25 19:16:22

Mybatisplus 传参参数为自定义sql，使用条件构造器作为参数

1 pom依赖 <dependency><groupId>com.baomidou</groupId><artifactId>mybatis-plus-boot-starter</artifactId><version>3.5.3.1</version> </dependency> 2 mapper 接口文件 List<TBookOrder> searchDiy(Param(Const…...

编程日记 2024/2/25 19:12:18

C#与VisionPro联合开发——TCP/IP通信

TCP/IP（传输控制协议/互联网协议）是一组用于在网络上进行通信的通信协议。它是互联网和许多局域网的基础，为计算机之间的数据传输提供了可靠性、有序性和错误检测。在软件开发中，TCP/IP 通信通常用于实现网络应用程序之间的数据交…...

编程日记 2024/2/25 19:11:17

spring Boot快速入门

快速入门为主主要届介绍java web接口API的编写 java编辑器首选IntelliJ IDEA 官方链接：https://www.jetbrains.com/idea/ IEDA 前言实例项目主要是web端API接口的使用，项目使用mysql数据库，把从数据库中的数据的查询出来后通过接口json数…...

编程日记 2024/2/25 19:08:12

FPGA SERDESE2 (SDR收发仿真)

高速 Serdes 环路测试高速串行通信优势非常巨大，只需要很少的IO引脚就可以实现高速通信，这也是当今FPGA高速接口的核心技术。比如XILINX的7代FPGA，GTX可以达到10.3125Gbps,ultrascale FPGA的GTH可以达到16Gbps。目前国产FPGA还难以达到这么高的接口速度。高速串行通信经…...

编程日记 2024/2/25 19:04:08

Java异常体系结构核心解析-Throwable

资料不在于多，而在于精。好资料、好书，我们站在巨人的肩膀上前行，可以少走很多弯路。通过搜索引擎找到自己需要的最好最权威信息，是一种很重要的能力。 Java源代码和官方资料Java™ Tutorials Java异常体系结构，是一种…...

编程日记 2024/2/25 19:02:05

Android MediaRecorder 相关

Android MediaRecorder 相关本篇文章主要介绍下MediaRecorder类. 1:创建对象 MediaRecorder mediaRecordernew MediaRecorder();MediaRecorder可以直接通过无参构造直接创建对象. 2: 音频源通过调用setAudioSource(int audio_source)来设置音频源,可以是麦克风.音频文件…...

编程日记 2024/2/25 19:01:04

Spring中关于事务的一些方方面面

事务隔离级别： 先了解一些事务隔离级别有哪些： 未提交读(Read Uncommitted)： 允许脏读，也就是可能读取到其他会话中未提交事务修改的数据提交读(Read Committed)： 只能读取到已经提交的数据。Oracle等多数数据库默…...

编程日记 2024/2/25 19:00:03

LiveQing视频点播流媒体RTMP推流服务功能-支持配置开启 HTTPS 服务什么时候需要开启HTTPS服务

LiveQing视频点播流媒体RTMP推流服务功能支持配置开启 HTTPS 服务什么时候需要开启HTTPS服务 1、配置开启HTTPS1.1、准备https证书1.1.1、选择Nginx类型证书下载 1.2、配置开启 HTTPS1.2.1 web页面配置1.2.2 配置文件配置 2、验证HTTPS服务3、为什么要开启HTTPS3.1、安全性要求…...

编程日记 2024/2/25 18:55:59

LabVIEW串口通信的激光器模块智能控制

LabVIEW串口通信的激光器模块智能控制介绍了通过于LabVIEW的VISA串口通信技术在激光器模块控制中的应用。通过研究VISA串口通信的方法和流程，实现了对激光器模块的有效控制，解决了数据发送格式的匹配问题，为激光器模块的智能控制提供了一种…...

编程日记 2024/2/25 18:54:58

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…...

编程新知 2026/2/7 23:18:39

HTML 语义化

目录 HTML 语义化HTML5 新特性HTML 语义化的好处语义化标签的使用场景最佳实践 HTML 语义化 HTML5 新特性标准答案： 语义化标签： <header>：页头<nav>：导航<main>：主要内容<article>&#x…...

编程新知 2026/1/15 21:24:41

基于ASP.NET+ SQL Server实现（Web）医院信息管理系统

医院信息管理系统 1. 课程设计内容在 visual studio 2017 平台上，开发一个“医院信息管理系统”Web 程序。 2. 课程设计目的综合运用 c#.net 知识，在 vs 2017 平台上，进行 ASP.NET 应用程序和简易网站的开发；初步熟悉开发一…...

编程新知 2026/1/23 12:16:56

Java - Mysql数据类型对应

Mysql数据类型java数据类型备注整型INT/INTEGERint / java.lang.Integer–BIGINTlong/java.lang.Long–––浮点型FLOATfloat/java.lang.FloatDOUBLEdouble/java.lang.Double–DECIMAL/NUMERICjava.math.BigDecimal字符串型CHARjava.lang.String固定长度字符串VARCHARjava.lang…...

编程新知 2025/12/14 11:45:25

聊一聊接口测试的意义有哪些？

目录一、隔离性 & 早期测试二、保障系统集成质量三、验证业务逻辑的核心层四、提升测试效率与覆盖度五、系统稳定性的守护者六、驱动团队协作与契约管理七、性能与扩展性的前置评估八、持续交付的核心支撑接口测试的意义可以从四个维度展开，首…...

编程新知 2025/10/14 6:46:13

2023赣州旅游投资集团

单选题 1.“不登高山，不知天之高也；不临深溪，不知地之厚也。”这句话说明_____。 A、人的意识具有创造性 B、人的认识是独立于实践之外的 C、实践在认识过程中具有决定作用 D、人的一切知识都是从直接经验中获得的参考答案: C 本题解…...

编程新知 2025/11/8 16:42:13

SiFli 52把Imagie图片，Font字体资源放在指定位置，编译成指定img.bin和font.bin的问题

分区配置 (ptab.json) img 属性介绍： img 属性指定分区存放的 image 名称，指定的 image 名称必须是当前工程生成的 binary 。如果 binary 有多个文件，则以 proj_name:binary_name 格式指定文件名， proj_name 为工程名&…...

编程新知 2026/1/23 10:51:19

iOS性能调优实战：借助克魔(KeyMob)与常用工具深度洞察App瓶颈

在日常iOS开发过程中，性能问题往往是最令人头疼的一类Bug。尤其是在App上线前的压测阶段或是处理用户反馈的高发期，开发者往往需要面对卡顿、崩溃、能耗异常、日志混乱等一系列问题。这些问题表面上看似偶发，但背后往往隐藏着系统资源调度不当…...

编程新知 2025/9/24 12:50:07

日常一水C

多态言简意赅：就是一个对象面对同一事件时做出的不同反应而之前的继承中说过，当子类和父类的函数名相同时，会隐藏父类的同名函数转而调用子类的同名函数，如果要调用父类的同名函数，那么就需要对父类进行引用&#…...

编程新知 2025/9/30 22:37:58

6️⃣Go 语言中的哈希、加密与序列化：通往区块链世界的钥匙

Go 语言中的哈希、加密与序列化：通往区块链世界的钥匙一、前言：离区块链还有多远？区块链听起来可能遥不可及，似乎是只有密码学专家和资深工程师才能涉足的领域。但事实上，构建一个区块链的核心并不复杂，尤其当你已经掌握了一门系统编程语言，比如 Go。要真正理解区…...

编程新知 2025/10/12 1:37:40

Gemma的简单介绍

基于Colab的搭建过程

相关文章：