当前位置：首页 > news >正文

更小、更安全、更透明：Google发布的Gemma推动负责任AI的进步

news 2026/2/9 13:53:35

每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/

在六月，Google推出了全新的Gemma 2，这款顶级的开源模型拥有270亿（27B）和90亿（9B）参数。自发布以来，27B模型迅速成为LMSYS Chatbot Arena排行榜上的高分选手，甚至在真实对话中超越了许多比它大两倍的流行模型。

但Gemma不仅仅是为了性能。它的基础是负责任的AI，优先考虑安全性和可访问性。为了支持这一承诺，Google隆重宣布三个新的Gemma 2系列成员：

Gemma 2 2B (https://huggingface.co/collections/google/gemma-2-2b-release-66a20f3796a2ff2a7c76f98f)——全新的2亿参数（2B）版本，内置安全改进，兼具强大的性能和高效性。
ShieldGemma (https://huggingface.co/collections/google/shieldgemma-release-66a20efe3c10ef2bd5808c79)——一组基于Gemma 2的安全内容分类模型，用于过滤AI模型的输入和输出，保护用户安全。
Gemma Scope (https://huggingface.co/collections/google/gemma-scope-release-66a4271f6f0b4d4a9d5e04e2)——一个新的模型可解释性工具，提供对模型内部工作原理的无与伦比的洞察。

有了这些新增功能，研究人员和开发人员现在可以创建更安全的客户体验，深入了解模型，并自信地在设备上负责任地部署强大的AI，开启创新的新可能性。

Gemma 2 2B: 下一代性能体验，现已上线

Google很高兴介绍备受期待的Gemma 2家族新成员——Gemma 2 2B模型。这个轻量级模型通过从更大模型中学习，产生了出色的效果。实际上，Gemma 2 2B在Chatbot Arena上超越了所有GPT-3.5模型，展示了其卓越的对话AI能力。

图表：LMSYS Chatbot Arena排行榜得分
LMSYS Chatbot Arena排行榜得分捕捉于2024年7月30日。Gemma 2 2B得分正负10。

Gemma 2 2B提供了：

卓越性能：在其尺寸范围内提供顶级性能，超过同类其他开源模型。
灵活且具成本效益的部署：能够在各种硬件上高效运行——从边缘设备和笔记本电脑到使用Vertex AI和Google Kubernetes Engine（GKE）的强大云部署。为了进一步提高速度，它通过NVIDIA TensorRT-LLM库进行了优化，并作为NVIDIA NIM提供。这种优化针对数据中心、云、本地工作站、PC和边缘设备的各种部署，使用NVIDIA RTX、NVIDIA GeForce RTX GPU或NVIDIA Jetson模块进行边缘AI。此外，Gemma 2 2B与Keras、JAX、Hugging Face、NVIDIA NeMo、Ollama、Gemma.cpp以及即将推出的MediaPipe无缝集成，简化了开发过程。
开放且可访问：根据对研究和商业应用友好的Gemma条款提供。其体积小到足以在Google Colab的免费T4 GPU层上运行，使实验和开发变得前所未有的容易。

从今天起，可以从Kaggle、Hugging Face、Vertex AI Model Garden下载Gemma 2的模型权重，也可以在Google AI Studio中体验其功能。

ShieldGemma：用最先进的安全分类器保护用户

为了确保开放模型能够负责任地部署，确保AI输出具有吸引力、安全和包容性，开发者和研究人员需要付出大量努力。为了帮助开发者实现这一目标，Google推出了ShieldGemma，这是一系列最先进的安全分类器，旨在检测和减轻AI模型输入和输出中的有害内容。ShieldGemma特别针对四个关键领域的危害：

仇恨言论
骚扰
性露骨内容
危险内容

这些开放分类器补充了现有的负责任AI工具包中的安全分类器套件，其中包括使用有限数据点构建特定政策分类器的方法，以及通过API提供的现有Google Cloud现成分类器。

ShieldGemma能够帮助开发更安全、更优质的AI应用：

SOTA性能：基于Gemma 2构建，ShieldGemma是业界领先的安全分类器。
灵活尺寸：ShieldGemma提供各种模型尺寸以满足不同需求。2B模型适合在线分类任务，而9B和27B版本则为离线应用提供更高性能，适用于对延迟要求不高的场景。所有尺寸都利用NVIDIA的速度优化，在各种硬件上实现高效性能。
开放和协作：ShieldGemma的开放性质鼓励透明度和AI社区的协作，有助于未来的机器学习行业安全标准。

“随着AI的不断成熟，整个行业将需要投资于开发高性能的安全评估器。很高兴看到Google做出了这一投资，并期待他们继续参与我们的AI安全工作组。”~ ML Commons执行董事Rebecca Weiss

Gemma Scope：用开放稀疏自编码器揭示AI决策

Gemma Scope为研究人员和开发人员提供了前所未有的透明度，让他们能够深入了解Gemma 2模型的决策过程。像一个强大的显微镜，Gemma Scope使用稀疏自编码器（SAEs）放大模型内的特定点，使其内部工作原理更加可解释。

这些SAEs是专门的神经网络，帮助解读Gemma 2处理的密集复杂信息，将其扩展为更易于分析和理解的形式。通过研究这些扩展视图，研究人员可以获得宝贵的见解，了解Gemma 2如何识别模式、处理信息并最终做出预测。通过Gemma Scope，Google旨在帮助AI研究社区发现如何构建更可理解、负责和可靠的AI系统。

Gemma Scope的突破性特点：

开放SAEs：400多个免费提供的SAEs，覆盖Gemma 2 2B和9B的所有层。
互动演示：无需编写代码即可在Neuronpedia上探索SAE功能并分析模型行为。
易于使用的资源库：提供与SAEs和Gemma 2接口的代码和示例。

了解更多关于Gemma Scope的信息，请访问Google DeepMind博客、技术报告和开发者文档。

构建在负责任AI基础上的未来

这些发布代表了Google持续为AI社区提供开发安全和有益AI所需的工具和资源的承诺。相信开放访问、透明度和协作是开发安全和有益AI的关键。

立即开始体验：

下载Gemma 2 2B或在NVIDIA NIM或Google AI Studio中试用其功能。https://www.kaggle.com/models/google/gemma-2
探索ShieldGemma并构建更安全的AI应用。 https://ai.google.dev/gemma/docs/shieldgemma
在Neuronpedia上试用Gemma Scope，揭示Gemma 2的内部工作原理。 https://www.neuronpedia.org/gemma-scope

更小、更安全、更透明：Google发布的Gemma推动负责任AI的进步

Gemma 2 2B: 下一代性能体验，现已上线

ShieldGemma：用最先进的安全分类器保护用户

Gemma Scope：用开放稀疏自编码器揭示AI决策

构建在负责任AI基础上的未来

相关文章：

更小、更安全、更透明：Google发布的Gemma推动负责任AI的进步

基于Django框架的医疗耗材管理系统的设计实现-计算机毕设定制-附项目源码（可白嫖）48999

物联网协议篇（1）：modbus tcp和modbusRTU的区别是什么?

JVM系列 | 对象的消亡——HotSpot的设计细节

vue 运行或打包过程报错 JavaScript heap out of memory（内存溢出）

git分支提交方法

从微架构到向量化--CPU性能优化指北

声声入耳，事事如意爱可声「如意」助听器即将上市！

生物实验室设备文件采集如何才能质量和效率双管齐下？

Framework源码整编、单编、烧录过程

TypeScript类型断言

Mallet：一款针对任意协议的安全拦截代理工具

【IEEE出版】第五届大数据、人工智能与软件工程国际研讨会（ICBASE 2024，9月20-22）

自修室预约小程序的设计

用于跟踪个人图书馆的BookLogr

深入解析JVM垃圾回收机制：Full GC、Minor GC与Major GC

Windows10点击文件夹右键卡死的解决办法

C# 设计模式之单例模式

【组合数学】【Python】【小练习】一、斯特灵近似式求阶乘

【IEEE Fellow特邀报告，JPCS独立出版】第四届电子通信与计算机科学技术国际学术会议（ECCST 2024，9月20-22）

PPT|230页| 制造集团企业供应链端到端的数字化解决方案：从需求到结算的全链路业务闭环构建

UE5 学习系列（三）创建和移动物体

《用户共鸣指数（E）驱动品牌大模型种草：如何抢占大模型搜索结果情感高地》

AspectJ 在 Android 中的完整使用指南

C++.OpenGL （14/64）多光源（Multiple Lights）

LangChain知识库管理后端接口：数据库操作详解—— 构建本地知识库系统的基础《二》

站群服务器的应用场景都有哪些？

上位机开发过程中的设计模式体会(1)：工厂方法模式、单例模式和生成器模式

FFmpeg avformat_open_input函数分析

webpack面试题