DeepSeek R1生成图片总结2(虽然本身是不能直接生成图片,但是可以想办法利用别的工具一起实现)
DeepSeek官网
目前阶段,DeepSeek R1是不能直接生成图片的,但可以通过优化文本后转换为SVG或HTML代码,再保存为图片。另外,Janus-Pro是DeepSeek的多模态模型,支持文生图,但需要本地部署或者使用第三方工具。还有第三方AI工具结合DeepSeek生成的提示词来生成图片。
DeepSeek 虽然本身并非多模态模型(如 R1 系列),但通过多种方法仍可实现文字生成图片或处理图片的需求。以下是我综合目前多个来源总结的具体方法及步骤:
一、直接生成 SVG 图片
DeepSeek R1 支持直接生成 SVG 格式的矢量图代码,用户可将其保存为 .svg 文件并通过浏览器查看。具体步骤:
优化文本内容:使用“背景颜色+页面元素需求+约束条件”模板或模仿特定风格优化原始文本。
- 示例提问:“帮我生成图片:生成一个高端一点的,纯色,渐变的背景图,不要有其他元素,图片风格为清新,尺寸为16:9,主色调:科技蓝(#007BFF)或环保绿(#28A745),渐变过渡,体现科技感和环保主题”
-
转换为 SVG:要求 DeepSeek 将优化后的文本转为 SVG 代码,并指定配色、布局等要求。


- 示例指令:“将上述内容转为 SVG 图片,要求配色简约,布局清晰。”
- 这样生成的代码可直接保存为
.svg文件,或通过在线工具调整样式。
- 如果觉得生成的样式是满意的样式,则复制整块内容,创建一个新文件,修改后缀名为 svg,再将内容贴进去就行了。
- 如果你觉得样式还需要调整,则根据 DeepSeek 提示的配色方案,布局结构等继续调整,直至满意为止。
二、利用html代码完成布局,生成 PNG/JPG 效果图片
-
若需生成常见格式(如 PNG、JPG),可通过以下两种方式:
-
生成 HTML 代码并转换:
要求 DeepSeek 输出包含文本内容的 HTML 文件,并嵌入下载按钮(生成图片时隐藏按钮)。例如:先生成一篇
“将回答以攻略卡片风格展示为 HTML,每块文本对应一个卡片,配色简约。”
运行 HTML 后,通过浏览器截图或使用工具(如 Puppeteer)导出为图片。 -
结合 Python 库:
利用 DeepSeek 生成调用 Pillow 或 Matplotlib 的代码脚本,自动将文本转换为图片。
三、生成 Mermaid 图表
-
DeepSeek 支持 Mermaid 语法生成流程图、思维导图等图表。步骤:
-
要求生成特定主题的 Mermaid 代码(如书籍思维导图)。
-
示例指令:
“生成《悲惨世界》的思维导图,使用 Mermaid 格式。” -

-
-
将Mermaid数据粘贴至 Mermaid Live 编辑器 渲染并导出为 PNG/SVG
-

四、结合第三方 AI 工具
DeepSeek 非常擅长生成提示词。所以可以通过 DeepSeek 先生成高质量的提示词,再借助专业文生图工具完成创作:
生成提示词:
-
要求 DeepSeek 输出英文提示词(效果优于中文),例如:
“生成一段英文提示词,描述‘鲸鱼跃出海面喷水’的场景,包含细节和艺术风格。” -
使用工具生成图片:
推荐工具包括 Midjourney(速度快、质量高)、Stable Diffusion(开源可定制)、即梦 AI(支持中文)、Bing Image Creator(基于 DALL·E 3)等。
五、使用多模态模型 Janus-Pro
-
部署步骤:
- 从 GitHub 克隆仓库,安装依赖并运行脚本(需 CUDA 支持)。
- 修改配置加载 7B 模型(需 8GB 以上显存)。
-
生成图片:
输入文本指令(如“生成现代风格的城市天际线”),模型会输出图片。实测显示其生成速度较慢,但指令跟随能力优于 Stable Diffusion。
六、图片处理与代码生成
-
示例:
“生成 HTML 代码,将上传的图片转为像素圆点风格。”
需多次调试代码并配合工具(如 Photoshop 脚本)实现效果。
总结与建议
-
优先场景:直接生成 SVG 或 Mermaid 图表适合快速可视化;复杂图片建议结合第三方工具。
-
性能考量:Janus-Pro 适合本地部署用户,但对硬件要求较高;普通用户推荐即梦 AI 或 Midjourney。
-
提示词优化:通过 DeepSeek 优化提示词可显著提升生成质量,尤其是英文提示词
相关文章:
DeepSeek R1生成图片总结2(虽然本身是不能直接生成图片,但是可以想办法利用别的工具一起实现)
DeepSeek官网 目前阶段,DeepSeek R1是不能直接生成图片的,但可以通过优化文本后转换为SVG或HTML代码,再保存为图片。另外,Janus-Pro是DeepSeek的多模态模型,支持文生图,但需要本地部署或者使用第三方工具。…...
x86平台基于Qt+opengl优化ffmpeg软解码1080P视频渲染效率
一般的在arm嵌入式平台,大多数板子都要硬解码硬件渲染的框架,使用即可。 在x86下比较麻烦了。 优化的思路一共有以下几个方面, 1. 软解码变成硬解码 2. 将YUV转QImage的操作转移到GPU 3. QWidget渲染QImage变成opengGL渲染AVFrame 这三点…...
机器学习入门-读书摘要
先看了《深度学习入门:基于python的理论和实践》这本电子书,早上因为入迷还坐过站了。。 因为里面的反向传播和链式法则特别难懂,又网上搜了相关内容进行进一步理解,参考的以下文章(个人认为都讲的都非常好࿰…...
前端【技术方案】重构项目
1. 明确重构目标 优化性能 减少页面加载时间降低资源占用 提升代码可维护性 更规范的代码风格更清晰的代码结构更明确的模块设计 扩展功能 为项目添加新功能改进现有功能 2. 评估项目现状 审查代码 全面检查现有代码,找出代码中的问题,如代码冗余、耦合…...
大语言模型简史:从Transformer(2017)到DeepSeek-R1(2025)的进化之路
2025年初,中国推出了具有开创性且高性价比的「大型语言模型」(Large Language Model — LLM)DeepSeek-R1,引发了AI的巨大变革。本文回顾了LLM的发展历程,起点是2017年革命性的Transformer架构,该架构通过「…...
RabbitMQ服务异步通信
消息队列在使用过程中,面临着很多实际问题需要思考: 1. 消息可靠性 消息从发送,到消费者接收,会经理多个过程: 其中的每一步都可能导致消息丢失,常见的丢失原因包括: 发送时丢失: 生…...
Python常见面试题的详解7
1. 内置的数据结构有哪几种 Python 中有多种内置的数据结构,主要分为以下几种: 1.1 数值类型 整数(int):用于表示整数,没有大小限制。例如:1, -5, 100。浮点数(float)…...
Django REST Framework (DRF) 中用于构建 API 视图类解析
Django REST Framework (DRF) 提供了丰富的视图类,用于构建 API 视图。这些视图类可以分为以下几类: 1. 基础视图类 这些是 DRF 中最基础的视图类,通常用于实现自定义逻辑。 常用类 APIView: 最基本的视图类,所有其…...
Huatuo热更新--安装HybridCLR
1.自行安装unity编辑器 支持2019.4.x、2020.3.x、2021.3.x、2022.3.x 中任一版本。推荐安装2019.4.40、2020.3.26、2021.3.x、2022.3.x版本。 根据你打包的目标平台,安装过程中选择必要模块。如果打包Android或iOS,直接选择相应模块即可。如果你想打包…...
读书笔记 - 修改代码的艺术
读书笔记 - 修改代码的艺术 第 1 章 修改软件第 2 章 带着反馈工作系统变更方式反馈方式遗留代码修改方法 第 3 章 感知和分离伪协作程序模拟对象 第 4 章 接缝模型接缝 第 5 章 工具自动化重构工具单元测试用具 第 6 章 时间紧迫,但必须修改新生方法(Sp…...
【Go并发编程】Goroutine 调度器揭秘:从 GMP 模型到 Work Stealing 算法
每天一篇Go语言干货,从核心到百万并发实战,快来关注魔法小匠,一起探索Go语言的无限可能! 在 Go 语言中,Goroutine 是一种轻量级的并发执行单元,它使得并发编程变得简单高效。而 Goroutine 的高效调度机制是…...
c# -01新属性-模式匹配、弃元、析构元组和其他类型
文章目录 **学习摘抄分享**模式匹配概述Null 检查类型测试比较离散值关系模型多个输入ObServation列表模式弃元元组和对象析构利用switch的模式进行匹配对于out的方法调用独立弃元析构元组和其他类型元组方法一方法二方法三方法四使用弃元元组的元素使用弃元的用户定义类型解构…...
同步异步日志系统-日志落地模块的实现
功能:将格式化完成后的日志消息字符串,输出到指定的位置 扩展:支持同时将日志落地到不同的位置 位置分类: 1.标准输出 2.指定文件(时候进行日志分析) 3.滚动文件(文件按照时间/大小进行滚动…...
LabVIEW 天然气水合物电声联合探测
天然气水合物被认为是潜在的清洁能源,其储量丰富,预计将在未来能源格局中扮演重要角色。由于其独特的物理化学特性,天然气水合物的探测面临诸多挑战,涉及温度、压力、电学信号、声学信号等多个参数。传统的人工操作方式不仅效率低…...
类型通配符上限
主函数 package typeWildcardTop;import java.util.ArrayList;public class typeWildcardTopTest {/**/public static void main(String[] args) { // test1();test2();}/*测试showList接收ArrayList类型 ArrayList接收各种类型参数创建animals cats mincats集合 传入s…...
嵌入式音视频开发(二)ffmpeg音视频同步
系列文章目录 嵌入式音视频开发(零)移植ffmpeg及推流测试 嵌入式音视频开发(一)ffmpeg框架及内核解析 嵌入式音视频开发(二)ffmpeg音视频同步 嵌入式音视频开发(三)直播协议及编码器…...
Mongodb数据管理
Mongodb数据管理 1.登录数据库,查看默认的库 [rootdb51~]# mongo> show databases; admin 0.000GB config 0.000GB local 0.000GB> use admin switched to db admin > show tables system.version > admin库:admin 是 MongoDB 的管理…...
Django 创建表 choices的妙用:get_<field_name>_display()
1.定义choices 我在创建表时,对于性别这个字段,定义了choices 选项,1代表男,2代表女 mysql中表的数据如下,里面存储的是1或2 如果我们在网页上展示的时候,想展示“男”或“女”,而不是数字1或2…...
Spring Boot 集成 Kettle
Kettle 简介 Kettle 最初由 Matt Casters 开发,是 Pentaho 数据集成平台的一部分。它提供了一个用户友好的界面和丰富的功能集,使用户能够轻松地设计、执行和监控 ETL 任务。Kettle 通过其强大的功能和灵活性,帮助企业高效地处理大规模数据集…...
自学Java-面向对象高级(final、单例类、枚举类、抽象类、接口)
自学Java-面向对象高级(final、单例类、枚举类、抽象类、接口) 一、final关键字1、认识final关键字2、final修饰变量的注意3、常量 二、单例类(设计模式)1、设计模式的概念2、单例设计模式3、单例类有很多形式4、懒汉式单例类5、小…...
Scroll Reverser深度解析:macOS设备专属滚动方向终极指南
Scroll Reverser深度解析:macOS设备专属滚动方向终极指南 【免费下载链接】Scroll-Reverser Per-device scrolling prefs on macOS. 项目地址: https://gitcode.com/gh_mirrors/sc/Scroll-Reverser 在macOS生态系统中,一个长期存在的用户体验痛点…...
UE5实战:用FArchive手搓一个简易存档系统(附完整源码)
UE5实战:用FArchive构建高兼容性游戏存档系统 在开发一款RPG游戏时,最让玩家抓狂的莫过于辛辛苦苦打了三小时的Boss战,结果游戏崩溃后进度全失。上周我的团队就收到了这样一条玩家反馈:"你们的游戏很棒,但这个存档…...
测试乌托邦:当理想主义遭遇行业现实的深度解构
乌托邦幻象的诞生在软件测试领域,“乌托邦”常被赋予这样的图景:一套完美的自动化工具链覆盖所有用例,AI精准预测所有缺陷,测试人员只需轻点按钮即可交付无瑕产品。这一幻象源于技术狂热与行业焦虑的交织——然而当我们撕开理想的…...
【2025必学核心能力】:PHP 8.9 Error Handling精准管控——ZEND引擎级错误分流技术首次公开
更多请点击: https://intelliparadigm.com 第一章:PHP 8.9错误处理范式革命:从全局捕获到ZEND级精准分流 PHP 8.9 引入了全新的 zend_error_dispatcher 机制,允许开发者在 Zend Engine 层直接注册错误分流回调,绕过传…...
Windows 11系统瘦身终极指南:用免费工具Win11Debloat提升51%性能
Windows 11系统瘦身终极指南:用免费工具Win11Debloat提升51%性能 【免费下载链接】Win11Debloat A simple, lightweight PowerShell script that allows you to remove pre-installed apps, disable telemetry, as well as perform various other changes to declut…...
拆解 DeepSeek-R1 的“大脑重塑”术(GRPO与CoT的极致共舞)
大模型圈子里有一个心照不宣的秘密:传统的 LLM 其实都是“快思考”的奴隶。无论你问 GPT-4 还是 Claude 一个复杂的数学题,它们本质上都是在做一件事——凭借庞大的参数记忆,“脱口而出”下一个概率最大的 Token。这就像让一个没有草稿纸的学…...
微信聊天记录永久保存指南:用WeChatMsg打造你的数字记忆银行
微信聊天记录永久保存指南:用WeChatMsg打造你的数字记忆银行 【免费下载链接】WeChatMsg 提取微信聊天记录,将其导出成HTML、Word、CSV文档永久保存,对聊天记录进行分析生成年度聊天报告 项目地址: https://gitcode.com/GitHub_Trending/we…...
WarcraftHelper:魔兽争霸III兼容性增强插件完全指南
WarcraftHelper:魔兽争霸III兼容性增强插件完全指南 【免费下载链接】WarcraftHelper Warcraft III Helper , support 1.20e, 1.24e, 1.26a, 1.27a, 1.27b 项目地址: https://gitcode.com/gh_mirrors/wa/WarcraftHelper WarcraftHelper是一款专为《魔兽争霸I…...
GetQzonehistory:3步永久备份QQ空间青春记忆的终极Python工具
GetQzonehistory:3步永久备份QQ空间青春记忆的终极Python工具 【免费下载链接】GetQzonehistory 获取QQ空间发布的历史说说 项目地址: https://gitcode.com/GitHub_Trending/ge/GetQzonehistory 你是否担心QQ空间里那些珍贵的青春记忆会随着时间流逝而消失&a…...
Unity Shader 半透明物体为什么不能写入深度缓冲?
从 Depth Buffer 原理到 URP Shader 实战,彻底搞懂半透明渲染的每一个环节Chapter 01半透明物体为什么不能写入深度缓冲?要理解这个问题,我们需要先回到 Depth Buffer(深度缓冲,也叫 Z-Buffer)的基本工作原…...

