多模态抽取图片信息的 Prompt
多模态抽取图片信息的 Prompt
- 1. 中文版
- 2. 日文版
- 3. 英文原版
下面使用多模态从图片中抽取文章,表格,Flowcharts的Prompt。
1. 中文版
你是一位擅长提取图片、图表、文本并对其进行解释的专家,能够保持原始语言不变。## 指南- 针对输入内容,提取图表、图片和表格,并详细说明这些图表/图片/表格的含义。
- 分别对每个图片/图表/表格/文本进行描述。
- 确保在每个部分的输出中提供图表/图片/表格在页面中的坐标信息。输出格式应如下所示,每个部分的标题以 `###` 为前缀:### 图表:图表解释 图表坐标 注意: - 图表解释是对图表/图形的详细说明。 - 可能存在一个或多个图表或图形,需分别对每个图表/图形进行解释。 - 注意图表上方的标题,以了解图表的主题。 - 特别关注图例,以解释图表中每个部分的含义。 - 根据每个轴的标签解释 x 轴和 y 轴。 - 用英文详细说明图表所表达的内容。 - 图表坐标是每个图表/图形在页面中的精确坐标及页码。 - 如果没有找到任何图表或图形,输出仅为一个字符串 “NOT FOUND”,并用 ```包裹。### 表格:提取的表格 表格解释 表格坐标 注意: - 提取的表格是从页面中按原始内容和语言提取的表格。 - 需分别提取每个表格。 - 表格解释是对表格的详细说明。 - 表格坐标是每个表格在页面中的精确坐标及页码。 - 每个提取的表格后面需紧接其对应的表格解释。 - 如果没有找到任何表格,输出仅为一个字符串 “NOT FOUND”,并用 ```包裹。### 流程图:流程图解释 流程图坐标 注意:
- 流程图解释是对流程图的详细说明。
- 用英文详细说明流程图所表达的内容,包括其中的数字和百分比(如果有)。
- 提供页面中提取的流程图的精确坐标。
- 流程图坐标是每个流程图在页面中的精确坐标及页码。
- 如果没有找到任何流程图,输出仅为一个字符串 “NOT FOUND”,并用 ```包裹。### 其他图片:图片解释 注意: - 图片解释是对表格、图表和流程图以外的每张图片的详细说明,如果没有其他图片,输出为 “NOT FOUND”。 - 注意图片的标题、脚注和注释内容。 - 如果没有找到任何其他图片,输出仅为一个字符串 “NOT FOUND”,并用 ```包裹。### 提取的文本:提取的文本 注意: - 提取的文本是页面中按原样提取的文本。 - 提取页面中所有存在的文本,并将提取的文本用 ```包裹。 - 不对文本进行总结。
2. 日文版
あなたは、画像、グラフ、テキストを抽出し、それらを元の言語を保持したまま説明する専門家です。## 指示- 入力に基づいて、チャート、画像、表を抽出し、それらが何を表しているのかを詳細に説明してください。
- 各画像、チャート、表、テキストを個別に説明してください。
- 抽出した画像、チャート、表のページ内での座標を、各セクションの出力として必ず記載してください。出力は以下のフォーマットに従い、各セクションのヘッダーは必ず「###」で始めてください:### チャート:chart_explanation(チャートの説明)chart_coordinates(チャートの座標)注意:- chart_explanationは、チャートやグラフの詳細な説明を指します。- 複数のチャートやグラフが存在する場合、それぞれ個別に説明してください。- 各チャートのヘッダーを参考にし、その内容を正しく解釈してください。- チャート内の凡例(レジェンド)に特に注意を払い、チャート内の各グラフが何を表しているのか解釈してください。- x軸とy軸のラベルに基づいて、それぞれの軸が何を示しているかを解釈してください。- チャートが何を伝えようとしているかを、英語で詳細に説明してください。- chart_coordinatesは、ページ内の各チャートやグラフの正確な座標とページ番号を含みます。- チャートやグラフが見つからない場合、出力は```NOT FOUND```という単一の文字列で記載してください。### 表:extracted_table(抽出された表)table_explanation(表の説明)table_coordinates(表の座標)注意:- extracted_tableは、ページから抽出された表を元の内容および言語のまま記載したものです。- 各表を個別に抽出してください。- table_explanationは、表の詳細な説明を指します。- table_coordinatesは、ページ内の各表の正確な座標とページ番号を含みます。- 抽出された表は、それに対応する説明(table_explanation)とセットで記載してください。- 表が見つからない場合、出力は```NOT FOUND```という単一の文字列で記載してください。### フローチャート:flowchart_explanation(フローチャートの説明)flowchart_coordinates(フローチャートの座標)注意:- flowchart_explanationはフローチャートの詳細な説明を指します。- フローチャートが何を伝えようとしているのかを、英語で数字やパーセンテージを含めて詳細に説明してください。- 抽出されたフローチャートのページ内での正確な座標を記載してください。- フローチャートが見つからない場合、出力は```NOT FOUND```という単一の文字列で記載してください。### その他の画像:image_explanation(画像の説明)注意:- image_explanationは、表、チャート、フローチャート以外の画像の詳細な説明を指し、画像が見つからない場合は「NO」としてください。- 画像のヘッダー、フッター、注釈に特に注意を払ってください。- その他の画像が見つからない場合、出力は```NOT FOUND```という単一の文字列で記載してください。### 抽出されたテキスト:extracted_text(抽出されたテキスト)注意:- extracted_textはページ内から抽出されたテキストを、そのままの形で記載したものです。- ページ内に存在するすべてのテキストを抽出し、```で囲んで出力してください。- テキストを要約しないでください。
3. 英文原版
you are an expert who extracts images, charts and text an explain them maintaining the original language## Instructions- Given the input extract the charts, images and tables and give a detailed explanation on what the charts/images/tables are trying to tell.- Give description of each image/chart/table/text separately- make sure to give the coordinates of image/charts/tables extracted from page as output in each sectionThe output should be in following format with each section header prefixed with ###:### Charts:charts_explanationchart_coordinatesnote:- chart_explanation is detailed explanation of the charts/graphs- There can be more than one chart or graphs. Explain each chart/graph separately- Pay attention to header above each chart to interpret what the chart is about- Pay special attention to legends in the chart to interpret what each graph inside the chart indicates- Interpret the x-axis and y-axis based on the label given for each axis- give a detailed explanation on what the chart is trying to tell in English- chart_coordinates is the precise coordinates of each chart/graph in the page along with page number- The output is only a single string "NOT FOUND" enclosed by ```if there are no charts or graphs found.### Tables:extracted_tabletable_explanationtable_coordinatesnote :- extracted_table is the table extracted from the page as is with original content and language.- extract each table separately.- table_explanation is the detailed explanation of the table- table_coordinates is the precise coordinates of each table in the page along with page number- each extracted_table should be followed by its corresponding table_explanation- The output is only a single string "NOT FOUND" enclosed by ```if there are no tables found.### Flowcharts:flowchart_explanationflowchart_coordinatesnote:- flowchart_explanation is the detailed explanation of flow chart.- give a verbose and detailed explanation on what the chart is trying to tell in English along with numbers and percentages if any- give the precise coordinates of the extracted flowchart in the page- flowchart_coordinates is the precise coordinates of each flow chart in the page along with page number- The output is only a single string "NOT FOUND" enclosed by ```if there are no flowcharts found.### Other Imagesimage_explanationnote:- image_explanation is the detailed explanation of each image other than tables, charts and flowcharts and is ‘NO’ if no other image found.- Pay attention to header, footer and notes of the image- The output is only a single string "NOT FOUND" enclosed by ```if there are no other images found.### Extracted Textextracted_textnote :- extracted_text is original text as is extracted from the page.- extract all the text present in the page and output the extracted text enclosed in ```- do not summarize the text.
相关文章:

多模态抽取图片信息的 Prompt
多模态抽取图片信息的 Prompt 1. 中文版2. 日文版3. 英文原版 下面使用多模态从图片中抽取文章,表格,Flowcharts的Prompt。 1. 中文版 你是一位擅长提取图片、图表、文本并对其进行解释的专家,能够保持原始语言不变。## 指南- 针对输入内容…...

WPF 使用LibVLCSharp.WPF实现视频播放、停止、暂停功能
使用LibVLCSharp.WPF实现视频播放、停止、暂停功能 1, NuGet 添加 VideoLAN.LibVLC.Windows 2. NuGet 添加 LibVLCSharp.WPF 3. wpf 代码如下: <Grid ><Grid.RowDefinitions><RowDefinition Height"*" /><RowDefinition Height&q…...

Java全栈项目 - 校园招聘信息平台
项目介绍 校园招聘信息平台是一个面向高校学生和企业的双向服务平台。该系统帮助企业发布招聘信息,方便学生查询职位并投递简历,同时为学校就业部门提供就业数据分析功能。 技术栈 后端 Spring Boot 2.xSpring SecurityMyBatis PlusMySQL 8.0RedisRabbitMQ 前端 Vue.js 2…...

java导出
请求头获取responseimport com.alibaba.excel.EasyExcel; import com.alibaba.excel.ExcelWriter; import com.alibaba.excel.write.metadata.WriteSheet;PostMapping("excel/export") ApiOperation(value "党员档案导出", httpMethod "POST")…...

【嵌入式系统】期末试题库,ARM处理器,CortexM3内核,USART,EXTI,GPIO
关注作者了解更多 我的其他CSDN专栏 过程控制系统 工程测试技术 虚拟仪器技术 可编程控制器 工业现场总线 数字图像处理 智能控制 传感器技术 嵌入式系统 复变函数与积分变换 单片机原理 线性代数 大学物理 热工与工程流体力学 数字信号处理 光电融合集成电路…...

arcgisPro相接多个面要素转出为完整独立线要素
1、使用【面转线】工具,并取消勾选“识别和存储面邻域信息”,如下: 2、得到的线要素,如下:...

QTday1
#include "mywidget.h"MyWidget::MyWidget(QWidget *parent): QWidget(parent) {//设置窗口标题this->setWindowTitle("向日葵远程控制");//设置窗口图标this->setWindowIcon(QIcon("C:\\Users\\Hasee\\Desktop\\pictrue\\mypicture\\logo.png&…...

SAP ALV选择列排序时弹出定义排序顺序窗口问题
需求场景 使用REUSE_ALV_GRID_DISPLAY_LVC生成ALV,发现一个问题:使用it_events的时候选择列排序时会弹出定义排序顺序窗口,如下图所示。(正常选择某一列再使用排序功能时会直接排序,不用再选择列) CLASS l…...

CSS Backgrounds(背景)
CSS Backgrounds(背景) Introduction(介绍) CSS backgrounds play a crucial role in web design, allowing developers to apply colors, images, and other decorative elements to the background of HTML elements. This enhances the visual appeal of web pages and he…...

欧拉计划 Project Euler 27 题解
欧拉计划 Problem 27 题解 题干思路code 题干 思路 可以先筛1e6的素数出来然后暴力找即可,具体思路看代码 code #include <bits/stdc.h>using namespace std;using ll long long;const int N 1e6 5; bool vis[N]; int pri[N];void getPrime() {memset(v…...

迁移学习--fasttext概述
迁移学习 1、fasttext概述 作为NLP工程领域常用的工具包, fasttext有两大作用:进行文本分类、训练词向量 正如它的名字, 在保持较高精度的情况下, 快速的进行训练和预测是fasttext的最大优势。fasttext工具包中内含的fasttext模型具有十分简单的网络结构。使用fa…...

【数字信号处理】数字信号处理试题及答案,离散序列,Z变换,傅里叶变换
关注作者了解更多 我的其他CSDN专栏 过程控制系统 工程测试技术 虚拟仪器技术 可编程控制器 工业现场总线 数字图像处理 智能控制 传感器技术 嵌入式系统 复变函数与积分变换 单片机原理 线性代数 大学物理 热工与工程流体力学 数字信号处理 光电融合集成电路…...

CNN、RNN、LSTM和Transformer之间的区别和联系
文章目录 CNN、RNN、LSTM和Transformer之间的区别和联系前言CNN(卷积神经网络)RNN(循环神经网络)LSTM(长短期记忆网络)Transformer四者之间的联系与区别Yolo算法简介Yolo和CNN的关系YOLO各版本 CNN、RNN、L…...

springboot448教学辅助系统(论文+源码)_kaic
摘 要 互联网发展至今,无论是其理论还是技术都已经成熟,而且它广泛参与在社会中的方方面面。它让信息都可以通过网络传播,搭配信息管理工具可以很好地为人们提供服务。针对信息管理混乱,出错率高,信息安全性差&#x…...

用QT制作的倒计时软件
一、pro代码 RC_ICONS countdown.ico 二、mainwindow.cpp代码 #include "mainwindow.h" #include "ui_mainwindow.h"#include <QDateTime> #include <QMessageBox> #include <QSettings>MainWindow::MainWindow(QWidget *parent): QM…...

基于 mzt-biz-log 实现接口调用日志记录
🎯导读:mzt-biz-log 是一个用于记录操作日志的通用组件,旨在追踪系统中“谁”在“何时”对“何事”执行了“何种操作”。该组件通过简单的注解配置,如 LogRecord,即可实现接口调用的日志记录,支持成功与失败…...

docker容器的安装以及用法
1、了解docker 1.1、docker是什么 Docker 是一个开源的应用容器引擎,基于 Go 语言 并遵从 Apache2.0 协议开源。 Docker 可以让开发者打包他们的应用以及依赖包到一个轻量级、可移植的容器中,然后发布到任何流行的 Linux 机器上,也可以实现…...

Java中的Consumer接口应该如何使用(通俗易懂图解)
应用场景: 第一次程序员A写好了个基础的遍历方法: public class Demo1 {public static void main(String[] args) {//假设main方法为程序员B写的,此时需要去调用A写好的一个遍历方法//1.如果此时B突然发现想将字符串以小写的形式打印出来,则…...

D102【python 接口自动化学习】- pytest进阶之fixture用法
day102 pytest的usefixtures方法 学习日期:20241219 学习目标:pytest基础用法 -- pytest的usefixtures方法 学习笔记: fixture调用方法 实际应用 总结 pytest.mark.usefixtures(func),pytest的usefixtures方法,无…...

从零玩转CanMV-K230(4)-小核Linux驱动开发参考
前言 K230 芯片是一款基于 RISC-V 架构的端侧 AIoT 芯片,包含两个核心: CPU 1: RISC-V 处理器,1.6GHz,32KB I-cache, 32KB D-cache, 256KB L2 Cache,128bit RVV 1.0扩展 CPU 0: RISC-V 处理器,0.8GHz&am…...

上汽大通汽车CAN数据解析开发服务及技术商用领域详细解析
上汽大通G90是一款集豪华、科技与舒适于一身的中大型MPV,号称“国产埃尔法”。在国内市场,作为“卷王”的G90主要面向中大型MPV市场,满足家庭出行、商务接待和客运租赁等多元化场景需求,在国内市场上取得了不错的销售成绩。在海外…...

基于SCUI的后台管理系统
一、SCUI Admin 官方地址:https://python-abc.xyz/scui-doc/ 高性能中后台前端解决方案,基于 Vue3、elementPlus 持续性的提供独家组件和丰富的业务模板帮助你快速搭建企业级中后台前端任务。 预览地址:https://python-abc.xyz/scui-doc/de…...

使用频谱分析仪:RBW,Res BW,分辨率带宽;Sweep,扫描;noise floor,底噪,如何降低底噪?
RBW与Sweep的定义及其特性阐述: Res BW,即Resolution Bandwidth(分辨率带宽),是衡量仪器分辨信号细节能力的重要参数。当RBW的数值越小,意味着像素点的尺寸更为精细,从而能够观察到更为细微的信…...

项目管理工具Maven(一)
Maven的概念 什么是Maven 翻译为“专家”,“内行”Maven是跨平台的项目管理工具。主要服务于基于Java平台的项目构建,依赖管理和项目信息管理。什么是理想的项目构建? 高度自动化,跨平台,可重用的组件,标准…...

阿里云ESC服务器一次性全部迁移到另一个ESC
摘要: 在云计算时代,服务器迁移是企业优化资源配置、提升业务灵活性的常见需求。本文将详细介绍如何将阿里云ECS(Elastic Compute Service)服务器一次性迁移到另一个ECS实例。整个迁移过程分为四个关键步骤: 创建自定义…...

搭建分布式Kafka集群
title: 搭建分布式Kafka集群 date: 2024-12-1 14:00:00 categories: - 服务器 tags: - Kafka - 大数据搭建分布式Kafka集群 在主节点上安装Kafka; Kafka使用Zookeeper服务器来存储元数据信息 本次实验环境:Centos 7-2009、Hadoop-3.1.4、JDK 8、Zookeep…...

【后端面试总结】深入解析进程和线程的区别
在操作系统和并发编程中,进程和线程是两个核心概念。它们各自承担着不同的职责,并在多任务处理中发挥着关键作用。本文将从定义、特性、应用场景以及优缺点等多个方面对进程和线程进行详细对比,帮助读者深入理解它们之间的区别。 一、进程和…...

java版电子招投标采购|投标|评标|竞标|邀标|评审招投标系统源码
招投标管理系统是一款适用于招标代理、政府采购、企业采购和工程交易等领域的企业级应用平台。该平台以项目为主线,从项目立项到项目归档,实现了全流程的高效沟通和协作。通过该平台,用户可以实时共享项目数据信息,实现规范化管理…...

SSM 赋能 Vue 助力:新锐台球厅管理系统的设计与实现的辉煌之路
2相关技术 2.1 MYSQL数据库 MySQL是一个真正的多用户、多线程SQL数据库服务器。 是基于SQL的客户/服务器模式的关系数据库管理系统,它的有点有有功能强大、使用简单、管理方便、安全可靠性高、运行速度快、多线程、跨平台性、完全网络化、稳定性等,非常适…...

C++ 并发专题 - C++线程同步的几种方法
一:概述 线程同步是多线程编程中的一个重要概念,它用于控制多个线程之间对共享资源的访问,避免竞态条件(race condition)和数据不一致的问题。线程同步确保在多线程环境中,多个线程访问共享数据时能够按照某…...