当前位置: 首页 > news >正文

扩散模型DDPM代码实践

安装diffusers

pip install diffusers

按照diffusers官方代码

from diffusers import DDPMPipelinepipe = DDPMPipeline.from_pretrained("google/ddpm-cat-256")image = pipe().images[0]image.save("/data/zhz/projects/diffusion/output/ddpm_generated_image.png")

准备 google/ddpm-cat-256/

因为服务器连不了外网所以只能手动下载:

https://huggingface.co/google/ddpm-cat-256/tree/main

文件结构:

同时代码也要修改为:

from diffusers import DDPMPipeline# pipe = DDPMPipeline.from_pretrained("google/ddpm-cat-256")
pipe = DDPMPipeline.from_pretrained("/data/zhz/projects/diffusion/ddpm-cat-256")image = pipe().images[0]image.save("/data/zhz/projects/diffusion/output/ddpm_generated_image.png")

运行

python /data/zhz/projects/diffusion/test_20240929.py

等待进度条

如果是换成gpu的话:

from diffusers import DDPMPipeline# pipe = DDPMPipeline.from_pretrained("google/ddpm-cat-256")
pipe = DDPMPipeline.from_pretrained("/data/zhz/projects/diffusion/ddpm-cat-256").to("cuda")image = pipe().images[0]image.save("/data/zhz/projects/diffusion/output/ddpm_generated_image.png")

显存开销3G左右:

最后生成图片:

相关文章:

扩散模型DDPM代码实践

安装diffusers pip install diffusers 按照diffusers官方代码 from diffusers import DDPMPipelinepipe DDPMPipeline.from_pretrained("google/ddpm-cat-256")image pipe().images[0]image.save("/data/zhz/projects/diffusion/output/ddpm_generated_imag…...

关于GPIO输入模式的配置选择

GPIO(通用输入输出)口是嵌入式系统中的重要组成部分,输入模式使得微控制器能够与外部世界进行交互。本文将探讨GPIO输入模式中的浮空输入、上拉输入和下拉输入的配置、使用场景及注意事项,并提供一些决策指导,帮助读者…...

【Kubernetes】日志平台EFK+Logstash+Kafka【实战】

一,环境准备 (1)下载镜像包(共3个): elasticsearch-7-12-1.tar.gz fluentd-containerd.tar.gz kibana-7-12-1.tar.gz (2)在node节点导入镜像: ctr -nk8s.io images i…...

今天推荐一个文档管理系统 Dorisoy.Pan

Dorisoy.Pan 是一个基于 .NET 8 和 WebAPI 构建的文档管理系统,它集成了 Autofac、MediatR、JWT、EF Core、MySQL 8.0 和 SQL Server 等技术,以实现一个简单、高性能、稳定且安全的解决方案。 这个系统支持多种客户端,包括网站、Android、iO…...

【RocketMQ】消费失败重试与死信消息

🎯 导读:本文档详细介绍了RocketMQ中的重试机制与死信消息处理方法。对于生产者而言,文档提供了如何配置重试次数的具体示例;而对于消费者,它解释了默认情况下消息消费失败后的重试策略,并展示了如何通过代…...

注册安全分析报告:闪送

前言 由于网站注册入口容易被黑客攻击,存在如下安全问题: 暴力破解密码,造成用户信息泄露短信盗刷的安全问题,影响业务及导致用户投诉带来经济损失,尤其是后付费客户,风险巨大,造成亏损无底洞…...

SpringCloud入门

SpringCloud 原版笔记:狂神说笔记——SpringCloud快速入门23 - subeiLY - 博客园 (cnblogs.com) 一.前言 常见面试题 什么是微服务? 微服务之间是如何独立通讯的? SpringCloud 和 Dubbo有哪些区别? SpringBoot和SpringCloud&…...

js替换css主题变量并切换iconfont文件

iconfont不止有单色、双色的图标,还有很多【多色】的图标,于是不能【去色】,只能手动替换primary 新建一个iconfont,替换过主题色的,然后与旧的iconfont配合切换使用 主要如下: reqiure之前必须【清除缓…...

UI设计师面试整理-设计趋势和行业理解

在UI设计师的面试中,了解当前的设计趋势和行业动态可以让你在面试中展示你的前瞻性思维和对设计领域的深刻理解。面试官希望看到你不仅具备扎实的设计技能,还能够洞察和应用最新的设计趋势和技术。以下是一些当前的设计趋势和如何在面试中展示你对这些趋势的理解和应用的建议…...

Java零工市场小程序如何改变自由职业者生活

如今,自由职业者越来越多,他们需要找到合适的工作机会,Java零工市场小程序,为自由职业者提供了一个方便、快捷的寻找工作机会的方式,这样一来,改变了自由职业者找寻工作的方式,也提高了他们的收…...

android11 自动授权访问sdcard

目录 步骤1 步骤2 步骤1 frameworks/base/core/java/com/android/internal/os/ZygoteInit.java OsConstants.CAP_SYS_PTRACE,OsConstants.CAP_SYS_TIME,OsConstants.CAP_SYS_TTY_CONFIG,OsConstants.CAP_WAKE_ALARM,OsConstants.CAP_BLOCK_SUSPENDOsConstants.CAP_BLOCK_SUS…...

优青博导团队/免费指导/数据分析//论文润色/组学技术服务 、表观组分析、互作组分析、遗传转化实验、生物医学

🌟 教授团队领衔,全方位科研服务 🚀 一站式科研解决方案 📈 加速科研进程,让成果不再等待 📝 专业分析 定制服务 科研成功 👨‍🔬 立即行动,让科研成果跃然纸上 业务领…...

Mybatis 学习之 分页实现

文章目录 1. Mybatis1.1. 代码实现 2. Mybatis Plus2.1. 代码实现2.2. 特别注意 3. PageHelper3.1. 代码实现3.2. 特别注意 参考资料 1. Mybatis 1.1. 代码实现 package com.example.demo;import org.mybatis.spring.annotation.MapperScan; import org.springframework.boot…...

Spring Boot文件上传

配置文件上传属性: 在application.properties文件中配置文件上传的属性,包括上传目录的路径、文件大小限制等。 spring.servlet.multipart.max-file-size10MB spring.servlet.multipart.max-request-size10MB处理文件上传请求 上传的文件按照日期进行…...

基于Springboot+Vue的高校体育运动会比赛系统(含源码+数据库)

1.开发环境 开发系统:Windows10/11 架构模式:MVC/前后端分离 JDK版本: Java JDK1.8 开发工具:IDEA 数据库版本: mysql5.7或8.0 数据库可视化工具: navicat 服务器: SpringBoot自带 apache tomcat 主要技术: Java,Springboot,mybatis,mysql,vue 2.视频演示地址 3.功能 该系统…...

【JavaEE】——内存可见性问题

阿华代码,不是逆风,就是我疯,你们的点赞收藏是我前进最大的动力!!希望本文内容能够帮助到你! 目录 一:内存可见性问题 1:代码解释 2:结果分析 (1&#xf…...

YOLO训练参数设置解析

笔者按照教程训练完YOLO后对train训练参数配置产生兴趣,因此下文参考官方文档进行总结 Train - Ultralytics YOLO Docs YOLO 模型的训练设置包括训练过程中使用的各种超参数和配置。 这些设置会影响模型的性能、速度和准确性。 关键的训练设置包括批量大小、学习率…...

基于OpenCV的实时年龄与性别识别(支持CPU和GPU)

关于深度实战社区 我们是一个深度学习领域的独立工作室。团队成员有:中科大硕士、纽约大学硕士、浙江大学硕士、华东理工博士等,曾在腾讯、百度、德勤等担任算法工程师/产品经理。全网20多万粉丝,拥有2篇国家级人工智能发明专利。 社区特色…...

理解Js执行上下文

执行上下文 执行上下文(Context)又称上下文,在 JavaScript 中是一个重要的概念,它决定了变量和函数的可访问性及其行为。每个上下文都有一个关联的变量对象(Variable Object),所有在该上下文中定义的变量和…...

微信小程序 蓝牙通讯

客户的需求如下:通过微信小程序控制蓝牙ble设备(电子面膜),通过不同指令控制面膜的亮度和时间。 01.首先看下客户的ble设备服务文档:(本部分需要有点蓝牙基础,在调试过程中可以用安卓软件nRF Connect软件来执行测试命令) 0xFFF1灯控命令 命…...

开关电源设计实战:Buck、Boost、Buck-Boost三大拓扑公式详解与选型指南

开关电源设计实战:Buck、Boost、Buck-Boost三大拓扑公式详解与选型指南 刚入行电源设计那会儿,我最头疼的就是面对各种拓扑结构的选择。Buck、Boost、Buck-Boost这三种基础拓扑看似简单,但实际设计中总会在参数计算和器件选型上栽跟头。记得第…...

Triton内存管理完全解析:共享内存与缓存策略

Triton内存管理完全解析:共享内存与缓存策略 【免费下载链接】triton Development repository for the Triton language and compiler 项目地址: https://gitcode.com/GitHub_Trending/tri/triton Triton语言和编译器作为深度学习计算的关键基础设施&#xf…...

【2026年阿里巴巴春招- 3月25日-算法岗-第二题- 该博弈了】(题目+思路+JavaC++Python解析+在线测试)

题目内容 有一个 nmnmnm 的棋盘,记第 iii<...

如何使用Docker Compose部署Silero Models:完整指南

如何使用Docker Compose部署Silero Models&#xff1a;完整指南 【免费下载链接】silero-models Silero Models: pre-trained speech-to-text, text-to-speech and text-enhancement models made embarrassingly simple 项目地址: https://gitcode.com/gh_mirrors/si/silero-…...

从服务边界到性能边界:理解 ABAP CDS View 里的窄投影及其重要性

结论先讲清楚 在 ABAP CDS 语境里,很多开发者口中的 窄投影,本质上并不是一个独立的官方语法关键字,而是一种建模策略:在 CDS projection view 这一层,只暴露某个具体业务服务真正需要的那一小部分字段、关联、行为和注解,不把底层业务对象里所有能拿到的内容一股脑端出…...

计算机毕业设计:美食推荐系统设计与协同过滤算法实现 Django框架 爬虫 协同过滤推荐算法 可视化 推荐系统 数据分析 大数据(建议收藏)✅

博主介绍&#xff1a;✌全网粉丝50W,前互联网大厂软件研发、集结硕博英豪成立工作室。专注于计算机相关专业项目实战8年之久&#xff0c;选择我们就是选择放心、选择安心毕业✌ > &#x1f345;想要获取完整文章或者源码&#xff0c;或者代做&#xff0c;拉到文章底部即可与…...

OpenClaw进阶配置:GLM-4.7-Flash模型参数调优实战

OpenClaw进阶配置&#xff1a;GLM-4.7-Flash模型参数调优实战 1. 为什么需要关注模型参数调优 去年冬天&#xff0c;当我第一次用OpenClaw自动整理全年会议纪要时&#xff0c;发现AI助手生成的摘要总带着奇怪的"官方腔调"——明明只是内部讨论&#xff0c;输出却像…...

5个关键步骤:TileLang高性能GPU算子从入门到精通

5个关键步骤&#xff1a;TileLang高性能GPU算子从入门到精通 【免费下载链接】tilelang Domain-specific language designed to streamline the development of high-performance GPU/CPU/Accelerators kernels 项目地址: https://gitcode.com/GitHub_Trending/ti/tilelang …...

百川2-13B模型中文OCR增强:OpenClaw图片信息提取优化

百川2-13B模型中文OCR增强&#xff1a;OpenClaw图片信息提取优化 1. 为什么需要OCR增强的智能体 上个月在处理一份电子合同时&#xff0c;我遇到了一个典型问题&#xff1a;合同是扫描件图片格式&#xff0c;我需要从中提取关键条款、金额和日期等信息。手动录入不仅耗时&…...

智慧交通护栏识别 道路标识识别车道线识别 道路设施目标检测模型训练 交通设施巡检算法 yolo图像分割数据集第10607期

计算机视觉数据集数据集概览 类别&#xff1a;7类&#xff0c;涵盖道路设施相关目标图像数量&#xff1a;500格式&#xff1a;YOLO格式核心任务&#xff1a;目标检测数据集核心信息维度详情数据类别冷塑震荡标线漆、热塑性涂料、凸起式路面标线、橡胶减速带、单W型梁防撞护栏、…...