当前位置：首页 > news >正文

【大模型】ChatGPT 高效处理图片技巧使用详解

news 2026/6/4 13:26:16

一、前言

二、ChatGPT 4 图片处理介绍

2.1 ChatGPT 4 图片处理概述

2.1.1 图像识别与分类

2.1.2 图像搜索

2.1.3 图像生成

2.1.4 多模态理解

2.1.5 细粒度图像识别

2.1.6 生成式图像任务处理

2.1.7 图像与文本互动

2.2 ChatGPT 4 图片处理应用场景

三、文生图操作实践

3.1 前置准备

3.1.1 文生图操作入口

3.1.2 DALL.E 简单简介

DALL.E 主要特点

3.2 文生图提示词使用技巧

3.3 文图案例演示一

3.3.1 生成营销海报

3.3.2 多轮对话对图片精修

3.3.3 在线精修图片

3.4 文图案例演示二

四、图生图

4.1 图生图

4.1.1 使用GPT图生图功能

4.1.2 使用DALL.E 图生图功能

4.2 图片解析

4.2.1 DALL.E 解析图片内容并总结

4.2.2 GPT 解析图片内容并总结

4.2.3 图片数据提取与分析

4.3 图生文

4.3.1 DALL.E生成直播文案

4.3.2 GPT生成直播文案

五、写在文末

一、前言

ChatGPT 4推出之后，一大波强大而且实用的功能也出现在大家的视野中，比如可以实现定制化AI助手的GPTs，文本、数据分析，视觉输入输出等功能，尤其对于图像的处理上，不仅自身的大模型有了不错的支持，而且集成了不少第三方图像处理工具，比如 DALL·E ，midjourney等，利用GPT4，可以快速帮我们初步完成各类图像从生成到处理的事项，接下来进行详细的介绍。

二、ChatGPT 4 图片处理介绍

GPT4首次引入了图像输入功能，用户可以通过上传图片或直接在聊天窗口中粘贴图片来与机器进行交互。这一功能可以更好地满足用户的多样化需求，比如在描述复杂操作步骤或物品时，通过图像的直观展示可以大大提高沟通效率。

2.1 ChatGPT 4 图片处理概述

ChatGPT 4在图片处理方面具有多种功能，包括图像识别、图像搜索、图像生成、多模态理解、细粒度图像识别、生成式图像任务处理以及图像与文本互动等。

2.1.1 图像识别与分类

GPT 4可以通过深度学习算法对输入的图像进行识别和分类，识别出图像中物体的种类、数量、颜色等信息，并在对话中进行回复

2.1.2 图像搜索

GPT 4可以根据用户提供的关键词或描述，搜索到相关的图像，并在对话中展示给用户

2.1.3 图像生成

GPT 4可以通过生成模型，根据用户提供的关键词或场景描述，生成相关的图像，并在对话中展示给用户

2.1.4 多模态理解

GPT 4引入了多模态理解功能，意味着它能够同时处理和理解文本和图像信息。该模型使用深度学习算法对图像和文本输入进行联合分析，提升了理解复杂内容的能力

2.1.5 细粒度图像识别

GPT 4具备细粒度图像识别能力，能够更准确地识别图片中的复杂细节与对象，提供更加精确的图像内容解释

2.1.6 生成式图像任务处理

GPT 4能够在处理生成式图像任务时展示其创造性和灵活性，不仅能根据文本描述创建和编辑图像内容，还能对现有图像进行编辑和改进

2.1.7 图像与文本互动

GPT 4通过图像与文本的深度互动，能够更好地处理图像相关的问答和搜索任务，根据图像内容回答问题或生成相关描述

2.2 ChatGPT 4 图片处理应用场景

GPT 4 图片处理应用场景如下：

内容创作
- ChatGPT 4可以根据用户提供的文本描述，生成与之匹配的图像内容，这在广告设计、产品展示等领域有广泛应用
教育领域
- 在教育领域，ChatGPT 4可以帮助教师和学生进行图像识别和解释，提升教学互动效果
问答系统
- 在问答系统中，ChatGPT 4可以分析图像内容，结合上下文生成准确的描述或答案，提升问答系统的准确性和用户体验
数据分析
- 在数据分析中，ChatGPT 4可以通过图像识别技术提取数据图表中的关键信息，辅助数据分析工作

三、文生图操作实践

接下来演示如何基于GPT4完成常用的文生图操作。

3.1 前置准备

3.1.1 文生图操作入口

GPT在今年的某个时间段之后直接在对话框中输入指令进行文生图，会出现错误，也叫”降智“，官方对外宣称是算力问题，后续会重新开放，不过基于这个情况也有解决办法，第一个是首先上传一张图片，然后继续输入指令，以对话的方式进行文生图操作，或者采用GPTs中内置的DALL-E进行使用，效果是一模一样的。GPTs的操作入口如下：

点击DALL-E图标，看到下面的对话窗口即可开始使用

3.1.2 DALL.E 简单简介

DALL·E 是由人工智能研究实验室 OpenAI 开发的一个生成模型，它能够根据文本描述创建图像。该模型的名字来源于将 WALL·E（皮克斯动画电影中的机器人角色）与 Salvador Dalí（著名的超现实主义艺术家）结合在一起。DALL·E 的独特之处在于它能够理解自然语言的复杂性，并以此为基础生成从简单对象到复杂场景的各种图像。

DALL.E 主要特点

文本到图像生成：用户可以输入一段描述性的文本，DALL·E 将尝试生成一个或多个符合该描述的图像。
多样化输出：DALL·E 可以生成不同风格、视角和构图的图像，包括但不限于写实、卡通、抽象等风格。
高分辨率图像：虽然早期版本生成的图像是低分辨率的，但更新后的版本如 DALL·E 2 能够生成更高质量、更高分辨率的图像。
编辑能力：除了创造新图像外，DALL·E 还支持对现有图像进行修改，例如添加或删除特定元素。
跨领域知识：它可以理解并反映广泛的知识领域，比如艺术、科学和技术，以及它们之间的交叉点。

3.2 文生图提示词使用技巧

对大模型来说，优秀的提示词（Prompt）是基础，不管是使用AI大模型生成各类文案、对话、作品还是你需要得到的答案，文生图也是同样的道理，优秀的提示词可以提升最终生成出来的图片的质量，从而缩短创作时间提升效率。下面是一些常用的有关文生图提示词编写技巧。

明确描述
- 具体化：尽可能详细地描述你想要的图像内容。包括对象、颜色、风格、背景等细节。
- 结构清晰：用简单明了的语言表达你的需求，避免过于复杂的句子结构。
- 示例
  - 不好的描述：“画一个房子”
  - 好的描述：“画一座位于海边的白色两层小楼，周围有椰树和沙滩，天空中有夕阳。”
使用限定词
- 添加形容词：利用形容词来增强图像的具体性和独特性，比如“古老的”、“现代的”、“卡通风格的”等。
- 指定风格：可以提及某种艺术风格或艺术家的名字，如“梵高风格”、“赛博朋克风格”。
- 示例：“一幅赛博朋克风格的城市夜景图，高楼林立，霓虹灯闪烁。”
分步骤引导
- 如果你有一个复杂的想法，可以尝试分多次输入逐步细化。第一次给出大体框架，之后再补充更多细节。
- 示例
  - 第一步：“一个充满未来感的室内设计场景。”
  - 第二步：“在刚才的基础上加入透明材质的家具和浮动屏幕。”
尝试不同的表达方式
- 如果初次生成的结果不理想，试着改变描述的方式或者用词，可能会得到意想不到的好结果。
利用对比度
- 描述中加入对比元素可以使图像更加生动有趣，例如“明亮的灯光照亮黑暗的街道”。
控制图像的比例和尺寸
- 某些情况下，你可以通过特别说明希望得到的图片比例（如正方形、宽屏）或尺寸来影响输出格式。
- 示例
  - “请生成一张适合手机壁纸的纵向图片，内容是…” 或者 “生成一张适合桌面背景的宽屏图片…”

3.3 文图案例演示一

3.3.1 生成营销海报

尽可能清楚的描述你的需求，在刚刚接触AI大模型的时候，首先要学习的就是提示词，而首先要注意的就是提示词尽可能清楚表达你的意图。提示词如下：

生成一张蓝牙耳机的推广海报，图片内容简约大气，富有科技感和立体感，背景元素不要太复杂，面向的用户群体主要是18~30之间的年轻人，并给出图片的介绍

将提示词输入文本框，默认生成了2张效果还不错富有科技感的图片，同时附上了产品的简单介绍

3.3.2 多轮对话对图片精修

如果对于生成出来的图片效果不是很满意怎么办，就像之前学习Prompt技巧时那样，第一种方式可以通过多轮对话不断逼近，另一种方式就是优化和完善自己的提示词，但是在GPT的文生图中，还提供了另一种方式，即在线对图片进行精修，然后实时生成新的图片，下面通过操作分别演示说明。

1）多轮对话

重新调整色调

2）重新调整背景

3）重去掉不需要的元素

3.3.3 在线精修图片

除了上述多轮对话的方式，DALL.E也提供了在线编辑图片和精修的功能，有点类似于PS的功能，如下，我们首先生成一张”猫编程“的图片

如果对第一次生成的图片不满意，直接点击其中一张图片，点击进去之后就到了下面的工作区，左侧是选中的图片，右侧是一个小的对话框，左侧可以理解是图片编辑的工作区，右侧是根据工作区笔刷选中待调整的内容进行指令重新输入的地方

点击选择按钮，可以用笔刷对图片局部不满意的或者需要调整的位置勾选，比如下面这里，我们希望图片中的键盘更换为机械键盘

再比如我希望调整一下猫的侧身方向

总的来说，在线对图片精修只需要两个操作，第一使用选择的笔刷勾选你要调整的区域，勾选完成，再在对话框里面输入你的需求描述，最后等待图片的重新生成即可

3.4 文图案例演示二

有时候一开始你只是有一个简单的创意，或者是一个轮廓，并没有对最后要生成的图片长什么样有很明确的描述，此时就可以采用”分步引导“的方式来完成。这种方式其实也是很多领域的创作者在真实的创作场景中的一种使用模式。一开始只是一个灵感的闪现，然后通过工具先绘制出一个轮廓，而后不断调整，调整的过程中才能对作品进行丰富和完善，最后形成一个比较完美的作品呈现。

比如，我们的需求是生成一张儿童插画。首先输入下面的提示词。

第一次随机生成的图片我们觉得背景不太符合要求，于是补充自己想要添加的元素

接下来，还希望图片中局部的元素或动作按照自己的预期再调整一下从而更完美

最后再调整一下背景的色调，这样一幅相对符合自己期望的儿童插画就完成了

总结：

从上面这个生成插画的过程不难看出，整个流程中，我们就像是面对面一个画家，以聊天对话的方式对每一次生成的图片进行微调和细调，直至生成效果满意的图片为止。

四、图生图

利用GPT等AI大模型工具强大的图片处理能力，我们还可以利用GPT解析图片内容，从而分析图片内容并生成我们需要的文案，或者生成新的图片，从而达到图片处理的效果，下面看具体的操作案例。

4.1 图生图

顾名思义，即GPT根据你上传的图片进行推理解析，然后按照你的要求生成一张新的图片

4.1.1 使用GPT图生图功能

首先上传一张图片

看看GPT生成的新图片效果，当然，如果你觉得生成的图片效果不够理想，还可以像上面那样通过对话的方式进行修正微调，直至满意为止

4.1.2 使用DALL.E 图生图功能

下面再来看看DALL.E的生成效果

总结与对比：

相对来说，DALL.E比起GPT似乎更胜一筹，毕竟是专业做这个的。

4.2 图片解析

图片解析是指使用GPT或其他大模型工具对上传的图片内容进行推理或分析，按照用户的要求提取、分析图片内容，或者进行其他的动作，接下来看看两个简单的操作示例。

4.2.1 DALL.E 解析图片内容并总结

仍然以上面这张图片为例，让大模型解析和总结图片内容

不难看出，DALL.E对于图片的理解、推理分析以及最后的总结还是很全面的。

4.2.2 GPT 解析图片内容并总结

接下来再使用GPT看看处理的效果如何

对比来说，GPT给出的结论更加简洁一点，DALL.E似乎更全面一些

4.2.3 图片数据提取与分析

还记得GPT问世之前，如果需要识别一张图片中的关键内容，比如识别图片中的人物、或提取图片中的数据时，还需要借助第三方付费平台提供的API能力去完成，现在有了GPT等AI工具之后，就可以直接在对话中完成对图片中的关键信息进行提取+分析的过程，比如在下面我们上传一张图片，让GPT提取图片中的excel数据

4.3 图生文

图生文主要是大模型根据上传的图片进行内容的分析推理，然后根据用户的需求描述，生成文案，用户可以根据拿到的文案，辅助进行二次或后续的多次创作，典型的场景就是解析产品海报，然后生成新的产品文案，或宣传文案，或直播文案，或视频脚本等等。参考下面的案例。

4.3.1 DALL.E生成直播文案

上传一张带有带货产品的图片，然后生成带货的文案

4.3.2 GPT生成直播文案

再看看GPT的生成效果

五、写在文末

本文通过案例与操作演示详细介绍了使用ChatGPT等AI大模型工具处理图片的各类使用场景，图片可以说在当下的各类互联网应用场景下成为不可或缺的元素，有了AI大模型等工具的加持，可以让更不懂设计的普通人都能参与到图片的设计中来，可以说应用前景是非常光明的，希望对看到的同学有用，本篇到此结束，感谢观看。

【大模型】ChatGPT 高效处理图片技巧使用详解

目录一、前言二、ChatGPT 4 图片处理介绍 2.1 ChatGPT 4 图片处理概述 2.1.1 图像识别与分类 2.1.2 图像搜索 2.1.3 图像生成 2.1.4 多模态理解 2.1.5 细粒度图像识别 2.1.6 生成式图像任务处理 2.1.7 图像与文本互动 2.2 ChatGPT 4 图片处理应用场景三、文生图操…...

编程日记 2025/1/21 19:40:14

OceanBase 社区年度之星专访：北控水务纪晓东，社区铁杆开发者

编者按：作为开源数据库，社区的发展和持续进步，来自于每一位贡献者的智慧与支持。2024年度，OceanBase社区特别设立了“年度之星”奖，以表彰和感谢在过去一年中，为社区发展作出突出贡献的朋友。今日&#x…...

编程日记 2025/1/21 19:35:07

Docker 实现MySQL 主从复制

一、拉取镜像 docker pull mysql:5.7相关命令： 查看镜像：docker images 二、启动镜像启动mysql01、02容器： docker run -d -p 3310:3306 -v /root/mysql/node-1/config:/etc/mysql/ -v /root/mysql/node-1/data:/var/lib/mysql -e MYS…...

编程日记 2025/1/21 19:34:05

农业农村大数据应用场景｜珈和科技“数字乡村一张图”解决方案

近年来，珈和科技持续深耕农业领域，聚焦时空数据服务智慧农业。珈和利用遥感大数据、云计算、移动互联网、物联网、人工智能等先进技术，搭建“天空地一体化”监测体系，并创新建设了150的全球领先算法模型，广泛应用于高…...

编程日记 2025/1/21 19:30:01

doris 2.1 Queries Acceleration-Hints 学习笔记

1 Hint Classification 1.1 Leading Hint：Specifies the join order according to the order provided in the leading hint. 1.2 Ordered Hint：A specific type of leading hint that specifies the join order as the original text sequence. 1.3 Distribute Hint：Speci…...

编程日记 2025/1/21 19:20:49

STM32 FreeRTOS 任务挂起和恢复---实验

实验目标学会vTaskSuspend( )、vTaskResume( ) 任务挂起与恢复相关API函数使用： start_task:用来创建其他的三个任务。 task1：实现LED1每500ms闪烁一次。 task2：实现LED2每500ms闪烁一次。 task3：判断按键按下逻辑，KE…...

编程日记 2025/1/21 19:07:34

Ubuntu 24.04 LTS 通过 docker desktop 安装 seafile 搭建个人网盘

准备 Ubuntu 24.04 LTSUbuntu 空闲硬盘挂载Ubuntu 安装 Docker Desktop [我的Ubuntu服务器折腾集](https://blog.csdn.net/jh1513/article/details/145222679。安装 seafile 参考资料 Docker安装 Seafile OnlyOffice 并配置OnlyOffice到Seafile，实现在线编辑…...

编程日记 2025/1/21 19:06:32

Open3D 最小二乘拟合平面（直接求解法）【2025最新版】

目录一、算法原理二、代码实现三、结果展示本文由CSDN点云侠原创，原文链接。如果你不是在点云侠的博客中看到该文章，那么此处便是不要脸的爬虫与GPT。博客长期更新，本文最近更新时间为：2025年1月18日。一、算法原理平面方程的一般表达式为：...

编程日记 2025/1/21 19:05:30

【CC2640R2F】香瓜CC2640R2F之SPI读写W25Q80

本文最后修改时间：2022年01月08日 10:45 一、本节简介本节以simple_peripheral工程为例，介绍如何使用SPI读写W25Q80（外部flash）。二、实验平台 1）CC2640R2F平台 ①协议栈版本：CC2640R2 SDK v1.40.00.4…...

编程日记 2025/1/21 19:04:30

探秘Shortest与Stagehand：开启高效测试与自动化新篇

探秘Shortest与Stagehand：开启高效测试与自动化新篇在数字化浪潮的推动下，网页自动化工具如同繁星般涌现，为众多行业带来了效率的变革。在这些工具中，Shortest和Stagehand凭借其出色的表现，成为了众多开发者、测试人…...

编程日记 2025/1/21 19:03:28

llama 3 笔记

0.简介 llama 3 是在 15 万亿个 Token 上预训练的语言模型，具有 8B 和 70B 两种参数规模，可以支持广泛的用户场景，在各种行业基准上取得了最先进的性能，并提供了一些新功能，包括改进的推理能力。 1.改进亮点参数规模与模型架构：Llama 3提供了8B和70B两种参数规模的模…...

编程日记 2025/1/21 18:59:21

写作利器：如何用 PicGo + GitHub 图床提高创作效率

你好呀，欢迎来到 Dong雨的技术小栈 🌱 在这里，我们一同探索代码的奥秘，感受技术的魅力 ✨。 👉 我的小世界：Dong雨 📌 分享我的学习旅程 🛠️ 提供贴心的实用工具 💡 记…...

编程日记 2025/1/21 18:58:20

【文件篇】11.磁盘文件系统

上一篇博客中我们介绍到如果我们要访问文件首先需要打开这个文件，而文件是在磁盘上存储的，也就是说需要在磁盘上找到这个文件的路径。但是磁盘上有很多文件，这些文件都有自己的路径的，这些文件还有内容和属性，它们都是…...

编程日记 2025/1/21 18:56:14

嵌入式产品级-超小尺寸热成像相机（从0到1 硬件-软件-外壳）

Thermal_Imaging_Camera This is a small thermal imaging camera that includes everything from hardware and software. 小尺寸热成像相机-Pico-LVGL-RTOS 基于RP2040 Pico主控与RTOS，榨干双核性能实现LVGL和成图任务并行。ST7789驱动240280屏，CST8…...

编程日记 2025/1/21 18:51:59

三维扫描赋能文化：蔡司3D扫描仪让木质文化遗产焕发新生-沪敖3D

挪威文化历史博物馆在其修复工作中融入现代3D扫描技术，让数百年的历史焕发新生。文化历史博物馆的工作文化历史博物馆是奥斯陆大学的一个院系。凭借其在文化历史管理、研究和传播方面的丰富专业知识，该博物馆被誉为挪威博物馆研究领域的领先机构。馆…...

编程日记 2025/1/21 18:50:50

《自动驾驶与机器人中的SLAM技术》ch8：基于预积分和图优化的紧耦合 LIO 系统

目录 1 预积分 LIO 系统的经验 2 预积分图优化的顶点 3 预积分图优化的边 3.1 NDT 残差边（观测值维度为 3 维的单元边） 4 基于预积分和图优化 LIO 系统的实现 4.1 IMU 静止初始化 4.2 使用预积分预测 4.3 使用 IMU 预测位姿进行运动补偿 4.4 位姿配准部…...

编程日记 2025/1/21 18:48:46

Linux下PostgreSQL-12.0安装部署详细步骤

一、安装环境 postgresql-12.0 CentOS-7.6 注意：确认linux系统可以正常连接网络，因为在后面需要添加依赖包。二、pg数据库安装包下载下载地址：PostgreSQL: File Browser 选择要安装的版本进行下载： 三、安装依赖包在要安…...

编程日记 2025/1/21 18:46:39

STL—stack与queue

目录 Stack stack的使用 stack的模拟实现 queue queue的使用 queue的模拟实现 priority_queue priority_queue的用法 priority_queue的模拟实现容器适配器种类 Stack http://www.cplusplus.com/reference/stack/stack/?kwstack stack是栈，后入先出 stack的…...

编程日记 2025/1/21 18:41:31

docker 使用远程镜像启动一个容器

使用前提： 首先你得安装docker,其次你得拥有一个远程镜像 docker run --name io_11281009 --rm -it -p 2233:22 -v .:/root/py -e ed25519_rootAAAAC3NzaC1lZDI1********Oy7zR7l7aUniR2rul ghcr.lizzie.fun/fj0r/io srv对上述命令解释： 1.docker run:…...

编程日记 2025/1/21 18:39:25

简述mysql 主从复制原理及其工作过程，配置一主两从并验证

第一种基于binlog的主从同步首先对主库进行配置： [rootopenEuler-1 ~]# vim /etc/my.cnf 启动服务 [rootopenEuler-1 ~]# systemctl enable --now mysqld 主库的配置从库的配置第一个从库 [rootopenEuler-1 ~]# vim /etc/my.cnf [rootopenEuler-1 ~]# sys…...

编程日记 2025/1/21 18:38:22

Godot PCK解包原理与专业逆向实践指南

1. 这不是“解压软件”，而是Godot游戏逆向工程的第一把手术刀你刚下载了一款用Godot引擎开发的独立游戏，想研究它的UI动效逻辑，或者复刻一段粒子特效，又或者只是单纯好奇——那个让你反复通关三次的像素风过场动画，图层…...

编程新知 2026/5/26 5:04:27

DeepSeek基准测试避坑手册：92%开发者忽略的4大陷阱——硬件配置偏差、tokenizer不一致、batch size幻觉、温度值污染

更多请点击： https://codechina.net 第一章：DeepSeek基准测试避坑手册：92%开发者忽略的4大陷阱——硬件配置偏差、tokenizer不一致、batch size幻觉、温度值污染硬件配置偏差：GPU显存与计算精度的隐性干扰在A100（8…...

编程新知 2026/5/26 1:53:13

终极鼠标连点器使用指南：3分钟掌握高效自动化技巧

终极鼠标连点器使用指南：3分钟掌握高效自动化技巧【免费下载链接】MouseClick 🖱️ MouseClick 🖱️ 是一款功能强大的鼠标连点器和管理工具，采用 QT Widget 开发 ，具备跨平台兼容性。软件界面美观 ，操作…...

编程新知 2026/5/26 1:06:50

从CTF题看RSA安全：为什么你的密钥不能‘共享素数’？

从CTF实战看RSA密钥安全：那些年我们踩过的坑在网络安全竞赛和实际渗透测试中，RSA算法的错误实现方式往往成为突破的关键点。本文将通过典型CTF赛题案例，揭示五种常见RSA实现漏洞背后的数学原理和安全启示，帮助开发者在实际项目中…...

编程新知 2026/5/26 0:20:12

艾尔登法环存档迁移终极指南：3分钟解决角色转移难题

艾尔登法环存档迁移终极指南：3分钟解决角色转移难题【免费下载链接】EldenRingSaveCopier 项目地址: https://gitcode.com/gh_mirrors/el/EldenRingSaveCopier 还在为《艾尔登法环》存档版本不兼容而烦恼吗？EldenRingSaveCopier 是你的终极解决…...

编程新知 2026/5/25 21:21:36

为什么你的DeepSeek微调loss震荡不止？（Meta/DeepSeek联合团队未公开的梯度裁剪+LoRA初始化双校准协议）

更多请点击： https://codechina.net 第一章：DeepSeek微调loss震荡的根本归因剖析 DeepSeek系列模型在微调过程中频繁出现loss剧烈震荡现象，其本质并非单一因素所致，而是数据、优化器、梯度动态与模型结构四者耦合失稳的系统性表现…...

编程新知 2026/5/25 21:05:30

ModernWMS核心功能详解：从ASN入库到Dispatch出库的完整工作流

ModernWMS核心功能详解：从ASN入库到Dispatch出库的完整工作流【免费下载链接】ModernWMS The open source simple and complete warehouse management system is derived from our many years of experience in implementing erp projects. We stripped the origin…...

编程新知 2026/5/25 18:03:50

DLA功耗优化验证：tegrastats实战指南

重磅预告：本专栏将独家连载系列丛书《智能体视觉技术与应用》部分精华内容，该书是世界首套系统阐述“因式智能体”视觉理论与实践的专著，特邀美国 TypeOne 公司首席科学家、斯坦福大学博士 Bohan 担任技术顾问。Bohan先生师从美国三院院士、“…...

编程新知 2026/5/25 17:48:30

理想二极管控制器：用MOSFET实现毫伏级压降的电源管理方案

1. 理想二极管控制器：告别传统二极管的压降损耗在电源设计、电池保护、太阳能板并联这些领域里，二极管是个再常见不过的元件。我们用它来防反接、做整流、实现“或”逻辑供电，几乎不假思索。但如果你设计过一个需要处理大电流、低电压的系统…...

编程新知 2026/5/25 17:17:22

三步破解百度网盘限速：免费获取真实下载链接的终极指南

三步破解百度网盘限速：免费获取真实下载链接的终极指南【免费下载链接】baidu-wangpan-parse 获取百度网盘分享文件的下载地址项目地址: https://gitcode.com/gh_mirrors/ba/baidu-wangpan-parse 还在为百度网盘几十KB的龟速下载而苦恼吗？想要彻…...

编程新知 2026/5/25 16:57:07

一、前言

二、ChatGPT 4 图片处理介绍

2.1 ChatGPT 4 图片处理概述

2.1.1 图像识别与分类

2.1.2 图像搜索

2.1.3 图像生成

2.1.4 多模态理解

2.1.5 细粒度图像识别

2.1.6 生成式图像任务处理

2.1.7 图像与文本互动

2.2 ChatGPT 4 图片处理应用场景

三、文生图操作实践

3.1 前置准备

3.1.1 文生图操作入口

3.1.2 DALL.E 简单简介

DALL.E 主要特点

3.2 文生图提示词使用技巧

3.3 文图案例演示一

3.3.1 生成营销海报

3.3.2 多轮对话对图片精修

3.3.3 在线精修图片

3.4 文图案例演示二

四、图生图

4.1 图生图

4.1.1 使用GPT图生图功能

4.1.2 使用DALL.E 图生图功能

4.2 图片解析

4.2.1 DALL.E 解析图片内容并总结

4.2.2 GPT 解析图片内容并总结

4.2.3 图片数据提取与分析

4.3 图生文

4.3.1 DALL.E生成直播文案

4.3.2 GPT生成直播文案

五、写在文末

相关文章：