当前位置：首页 > news >正文

【深度学习 | Transformer】Transformers 教程：pipeline一键预测

news 2026/2/9 9:48:21

文章目录

一、前言
二、Computer vision
- 2.1 Image classification
- 2.2 Object detection
- 2.3 Image segmentation
- 2.4 Depth estimation
三、NLP
- 3.1 Text classification
- 3.2 Token classification
- 3.3 Question answering
- 3.4 Summarization
- 3.5 Translation
- 3.6 Language modeling
- - 3.6.1 预测序列中的下一个单词
  - 3.6.2 预测一个序列中的一个被屏蔽的token

一、前言

Transformers 是用于自然语言处理 (NLP)、计算机视觉以及音频和语音处理任务的预训练最先进模型库。该库不仅包含 Transformer 模型，还包含非 Transformer 模型，例如用于计算机视觉任务的现代卷积网络。

pipeline()可以加载多个模型让进行推理变得简单，即使没有使用特定模态的经验或不熟悉模型背后的底层代码，仍然可以使用它们通过pipeline()进行推理。

二、Computer vision

2.1 Image classification

从一组预定义的类中标记图像。

from transformers import pipeline
classifier = pipeline(task="image-classification")
preds = classifier("https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/pipeline-cat-chonk.jpeg"
)preds = [{"score": round(pred["score"], 4), "label": pred["label"]} for pred in preds]

输出结果为：

{'score': 0.4335, 'label': 'lynx, catamount'}
{'score': 0.0348, 'label': 'cougar, puma, catamount, mountain lion, painter, panther, Felis concolor'}
{'score': 0.0324, 'label': 'snow leopard, ounce, Panthera uncia'}
{'score': 0.0239, 'label': 'Egyptian cat'}
{'score': 0.0229, 'label': 'tiger cat'}

2.2 Object detection

目标检测识别图像对象以及对象在图像中的位置。

from transformers import pipeline
detector = pipeline(task="object-detection")
preds = detector("https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/pipeline-cat-chonk.jpeg"
)preds = [{"score": round(pred["score"], 4), "label": pred["label"], "box": pred["box"]} for pred in preds]

输出结果为：

[{'score': 0.9865,'label': 'cat','box': {'xmin': 178, 'ymin': 154, 'xmax': 882, 'ymax': 598}}]

2.3 Image segmentation

图像分割是一项像素级任务，它将图像中的每个像素分配给一个类别。

from transformers import pipeline
segmenter = pipeline(task="image-segmentation")
preds = segmenter("https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/pipeline-cat-chonk.jpeg"
)preds = [{"score": round(pred["score"], 4), "label": pred["label"]} for pred in preds]

输出结果为：

{'score': 0.9879, 'label': 'LABEL_184'}
{'score': 0.9973, 'label': 'snow'}
{'score': 0.9972, 'label': 'cat'}

2.4 Depth estimation

预测图像中每个像素与相机的距离。

from transformers import pipeline
depth_estimator = pipeline(task="depth-estimation")
preds = depth_estimator("https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/pipeline-cat-chonk.jpeg"
)

三、NLP

3.1 Text classification

从一组预定义的类中标记一系列文本。

from transformers import pipeline
classifier = pipeline(task="sentiment-analysis")
preds = classifier("Hugging Face is the best thing since sliced bread!")

3.2 Token classification

为每个token分配定义类别中的标签。

from transformers import pipeline
classifier = pipeline(task="ner")
preds = classifier("Hugging Face is a French company based in New York City.")

3.3 Question answering

返回问题的答案，有时有上下文（开放域），有时没有上下文（封闭域）。

from transformers import pipeline
question_answerer = pipeline(task="question-answering")
preds = question_answerer(question="What is the name of the repository?",context="The name of the repository is huggingface/transformers",
)

3.4 Summarization

从较长的文本创建较短的版本，同时试图保留原始文档的大部分含义。

from transformers import pipeline
summarizer = pipeline(task="summarization")
summarizer("In this work, we presented the Transformer, the first sequence transduction model based entirely on attention, replacing the recurrent layers most commonly used in encoder-decoder architectures with multi-headed self-attention. For translation tasks, the Transformer can be trained significantly faster than architectures based on recurrent or convolutional layers. On both WMT 2014 English-to-German and WMT 2014 English-to-French translation tasks, we achieve a new state of the art. In the former task our best model outperforms even all previously reported ensembles."
)

3.5 Translation

将一种语言的转换为另一种语言。

from transformers import pipeline
text = "translate English to French: Hugging Face is a community-based open-source platform for machine learning."
translator = pipeline(task="translation", model="t5-small")

3.6 Language modeling

3.6.1 预测序列中的下一个单词

from transformers import pipeline
prompt = "Hugging Face is a community-based open-source platform for machine learning."
generator = pipeline(task="text-generation")

3.6.2 预测一个序列中的一个被屏蔽的token

text = "Hugging Face is a community-based open-source <mask> for machine learning."
fill_mask = pipeline(task="fill-mask")

【深度学习 | Transformer】Transformers 教程：pipeline一键预测

文章目录一、前言二、Computer vision2.1 Image classification2.2 Object detection2.3 Image segmentation2.4 Depth estimation 三、NLP3.1 Text classification3.2 Token classification3.3 Question answering3.4 Summarization3.5 Translation3.6 Language modeling3.6.…...

编程日记 2023/5/9 17:33:33

HTMLCSS

1、HTML 1.1 介绍 HTML 是一门语言，所有的网页都是用HTML 这门语言编写出来的，也就是HTML是用来写网页的，像京东，12306等网站有很多网页。这些都是网页展示出来的效果。而HTML也有专业的解释 HTML(HyperText Markup Language)…...

编程日记 2023/5/31 16:37:11

【安装Nginx】

Linux上安装Nginx 文章目录 Linux上安装NginxUbuntuCentOS查看已安装的软件 Ubuntu 在 Ubuntu 上安装 Nginx 非常简单。只需按照以下步骤操作： 打开终端，更新软件包索引： sudo apt update安装 Nginx： sudo apt install nginx安…...

编程日记 2023/6/1 1:45:12

VSCode作业1：猜数字游戏和简单计数器(包含完整代码)

目录猜数字游戏一、使用‘random’函数获取随机数二、分情况讨论输入值大小情况三、HTML代码四、CSS样式及运行效果简单计数器（计时器） 一、使用‘setInterval’函数实现计数效果二、使用’clearInterval‘函数实现暂停计数和重新计数效果 …...

编程日记 2023/5/9 17:18:30

NANK OE骨传导开放式蓝牙耳机发布，极致体验拉满！

近日，中国专业音频品牌NANK南卡发布了全新一代——骨传导开放式蓝牙耳机NANK OE，耳机采用了传统真无线和骨传导的结合方式，带来更加舒适的佩戴体验和音质升级，同时还支持单双耳自由切换，全新的设计收获了市场的喜爱和认…...

编程日记 2023/5/9 17:13:29

看完这篇文章你就彻底懂啦｛保姆级讲解｝-----（I.MX6U驱动GPIO中断《包括时钟讲解》） 2023.5.9

目录前言整体文件结构源码分析（保姆级讲解）中断初始化部分初始化GIC控制器初始化中断向量表设置中断向量表偏移系统时钟初始化部分使能所有的时钟部分led初始化部分beep初始化部分key初始化部分按键中断初始化部分按键中断服务函数部分 while循环部分 …...

编程日记 2023/5/9 17:08:28

MySql -- 事务

目录 1.概念 2.事务的运用场景 3.事务的四大特点 4.执行事务带来的问题 4.1 脏读 4.2 不可重复度 4.3 幻读 5. MySQL中事务的隔离级别 1.概念事务就是把若干个独立操作打包成一个整体而诞生的一种功能. 2.事务的运用场景比如：A——>B 转账500 A的余额-500…...

编程日记 2023/5/9 17:03:26

关于大模型对未来影响的一点看法

人们总是高估了未来一到两年的变化，低估了未来十年的变革。 ---比尔盖茨近来OpenAI的GPT技术可以说在全球都带来了巨大的影响，也让大家看到了什么叫大力出奇迹。chatGPT和GPT4的能力给了大家很大的震撼，其流畅自如、逻辑清晰、出众的能力&am…...

编程日记 2023/5/9 16:58:25

Android - 约束布局 ConstraintLayout

一、概念解决布局嵌套过多的问题，采用方向约束的方式对控件进行定位。二、位置约束 2.1 位置至少要保证水平和垂直方向都至少有一个约束才能确定控件的位置。 layout_constraintLeft_toLeftOf我的左边，与XXX左边对齐。layout_constraintLeft_toRight…...

编程日记 2023/5/9 16:53:24

Addictive Multiplicative in NN

特征交叉是特征工程中的重要环节，在以表格型（或结构化）数据为输入的建模中起到了很关键的作用。特征交互的作用，一是尽可能挖掘对目标有效的模式、特征，二是具有较好的可解释性，三是能够将对数据的洞见引…...

编程日记 2023/6/1 1:46:44

LeetCode 1206. 实现跳表

不使用任何库函数，设计一个跳表。跳表是在 O(log(n)) 时间内完成增加、删除、搜索操作的数据结构。跳表相比于树堆与红黑树，其功能与性能相当，并且跳表的代码长度相较下更短，其设计思想与链表相似。例如，一个跳表包…...

编程日记 2023/5/9 16:43:21

离散数学_九章：关系（2）

9.2 n元关系及其应用 1、n元关系，关系的域，关系的阶2、数据库和关系 1. 数据库 2. 主键 3. 复合主键 3、n元关系的运算 1. 选择运算 (Select) 2. 投影运算 (Project) 3. 连接运算 (Join) n元关系：两个以上集合的元素间的关系 1、n元关系…...

编程日记 2023/5/9 16:38:20

[ubuntu][原创]通过apt方式去安装libnccl库

ubuntu18.04版本安装流程： wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-ubuntu1804.pin sudo mv cuda-ubuntu1804.pin /etc/apt/preferences.d/cuda-repository-pin-600 sudo apt-key adv --fetch-keys https://develo…...

编程日记 2023/5/9 16:33:18

YonLinker连接集成平台构建新一代产业互联根基

近日，由用友公司主办的“2023用友BIP技术大会“在用友产业园（北京）盛大召开，用友介绍了更懂企业业务的用友BIP-iuap平台，并发布了全面数智化能力体系，助力企业升级数智化底座，加强加速数智化推进…...

编程日记 2023/5/9 16:28:17

泛型的详解

泛型的理解和好处首先我们先来看看泛型的好处 1)编译时，检查添加元素的类型，提高了安全性 2)减少了类型转换的次数，提高效率[说明] 不使用泛型 Dog -> Object -> Dog//放入到ArrayList 会先转成Object，在取出时&#x…...

编程日记 2023/5/9 16:23:16

用科技创造未来！流辰信息技术助您实现高效办公

随着社会的迅猛发展，科技的力量无处不见。它正在悄悄地改变整个社会，让人类变得进步和文明，让生活变得便捷和高效。在办公自动化强劲发展的今天，流辰信息技术让通信业、电网、汽车、物流等领域的企业实现了高效办公，数…...

编程日记 2023/5/9 16:18:15

基于R语言APSIM模型

随着数字农业和智慧农业的发展，基于过程的农业生产系统模型在模拟作物对气候变化的响应与适应、农田管理优化、作物品种和株型筛选、农田固碳和温室气体排放等领域扮演着越来越重要的作用。 APSIM (Agricultural Production Systems sIMulator)模型是世界知名的作物…...

编程日记 2023/5/9 16:13:14

块状链表实现BigString大字符串操作（golang）

前言块状链表是介于链表和数组之间的数据结构，能够在 O ( n ) O(\sqrt{n}) O(n )时间内完成插入、删除、访问操作。数据结构如图所示。假设最大容量为 n n n, 则它有一个长度为 s n s\sqrt{n} sn 的链表。链表中每个结点是一个长度为 2 n 2 \times \sqrt{…...

编程日记 2023/5/9 16:08:12

项目问题记录（持续更新）

1.在 yarn install的时候报 error achrinza/node-ipc9.2.2: The engine "node" is incompatible with this module. Expected version "8 || 10 || 12 || 14 || 16 || 17". Got "20.1.0" error Found incompatible module.需要执行 yarn config…...

编程日记 2023/5/9 16:03:06

Linux的进程

目录一、进程占用的内存资源二、进程的系统环境三、进程一直在切换四、父进程和子进程五、进程状态六、查看进程 1.ps -ef 列出所有进程 2.ps -lax 列出所有进程 3.ps aux列出所有进程 4.树形列出所有进程七、作业（用来查看管理进程） …...

编程日记 2023/5/9 15:58:05

铭豹扩展坞 USB转网口突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别，但在其他电脑上正常工作时，问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤，帮助你快速找到故障原因：背景：一个M-pard（铭豹）扩展坞的网卡突然无法识别了，扩展出来的三个USB接口正常。…...

编程新知 2026/2/8 4:37:22

C++初阶-list的底层

目录 1.std::list实现的所有代码 2.list的简单介绍 2.1实现list的类 2.2_list_iterator的实现 2.2.1_list_iterator实现的原因和好处 2.2.2_list_iterator实现 2.3_list_node的实现 2.3.1. 避免递归的模板依赖 2.3.2. 内存布局一致性 2.3.3. 类型安全的替代方案 2.3.…...

编程新知 2026/2/8 20:42:41

python打卡day49

知识点回顾： 通道注意力模块复习空间注意力模块CBAM的定义作业：尝试对今天的模型检查参数数目，并用tensorboard查看训练过程 import torch import torch.nn as nn# 定义通道注意力 class ChannelAttention(nn.Module):def __init__(self,…...

编程新知 2026/2/7 5:37:17

脑机新手指南（八）：OpenBCI_GUI：从环境搭建到数据可视化（下）

一、数据处理与分析实战 （一）实时滤波与参数调整基础滤波操作 60Hz 工频滤波：勾选界面右侧 “60Hz” 复选框，可有效抑制电网干扰（适用于北美地区，欧洲用户可调整为 50Hz）。平滑处理&…...

编程新知 2025/11/19 22:56:53

Cilium动手实验室: 精通之旅---20.Isovalent Enterprise for Cilium: Zero Trust Visibility

Cilium动手实验室: 精通之旅---20.Isovalent Enterprise for Cilium: Zero Trust Visibility 1. 实验室环境1.1 实验室环境1.2 小测试 2. The Endor System2.1 部署应用2.2 检查现有策略 3. Cilium 策略实体3.1 创建 allow-all 网络策略3.2 在 Hubble CLI 中验证网络策略源3.3 …...

编程新知 2026/1/26 21:57:45

【git】把本地更改提交远程新分支feature_g

创建并切换新分支 git checkout -b feature_g 添加并提交更改 git add . git commit -m “实现图片上传功能” 推送到远程 git push -u origin feature_g...

编程新知 2025/12/13 4:20:30

ardupilot 开发环境eclipse 中import 缺少C++

目录文章目录目录摘要1.修复过程摘要本节主要解决ardupilot 开发环境eclipse 中import 缺少C++，无法导入ardupilot代码，会引起查看不方便的问题。如下图所示 1.修复过程 0.安装ubuntu 软件中自带的eclipse 1.打开eclipse—Help—install new software 2.在 Work with中…...

编程新知 2026/1/31 5:06:34

DeepSeek 技术赋能无人农场协同作业：用 AI 重构农田管理 “神经网”

目录一、引言二、DeepSeek 技术大揭秘2.1 核心架构解析2.2 关键技术剖析三、智能农业无人农场协同作业现状3.1 发展现状概述3.2 协同作业模式介绍四、DeepSeek 的 “农场奇妙游”4.1 数据处理与分析4.2 作物生长监测与预测4.3 病虫害防治4.4 农机协同作业调度五、实际案例大…...

编程新知 2025/9/24 13:35:36

Redis的发布订阅模式与专业的 MQ（如 Kafka, RabbitMQ）相比，优缺点是什么？适用于哪些场景？

Redis 的发布订阅（Pub/Sub）模式与专业的 MQ（Message Queue）如 Kafka、RabbitMQ 进行比较，核心的权衡点在于：简单与速度 vs. 可靠与功能。下面我们详细展开对比。 Redis Pub/Sub 的核心特点它是一个发后…...

编程新知 2025/12/4 2:32:37

pikachu靶场通关笔记19 SQL注入02-字符型注入(GET)

目录一、SQL注入二、字符型SQL注入三、字符型注入与数字型注入四、源码分析五、渗透实战 1、渗透准备 2、SQL注入探测 （1）输入单引号 （2）万能注入语句 3、获取回显列orderby 4、获取数据库名database 5、获取表名…...

编程新知 2026/2/5 5:47:53

文章目录

一、前言

二、Computer vision

2.1 Image classification

2.2 Object detection

2.3 Image segmentation

2.4 Depth estimation

三、NLP

3.1 Text classification

3.2 Token classification

3.3 Question answering

3.4 Summarization

3.5 Translation

3.6 Language modeling

3.6.1 预测序列中的下一个单词

3.6.2 预测一个序列中的一个被屏蔽的token

相关文章：