当前位置：首页 > news >正文

SeeSR: Towards Semantics-Aware Real-World Image Super-Resolution

news 2026/2/10 10:53:14

CVPR2024 香港理工大学&OPPO&bytedance
https://github.com/cswry/SeeSR?tab=readme-ov-file#-license
https://arxiv.org/pdf/2311.16518#page=5.80

问题引入

因为有些LR退化情况比较严重，所以超分之后的结果会出现语义的不一致的情况，所以本文训练了degradationaware prompt extractor来提取soft and hard semantic prompts辅助超分模型；
在inference的过程中LR也参与了；

methods

分为两个阶段，第一个阶段训练DAPE来从LR中提取对应的语义特征，包含soft(feature和hard(tag两个级别，训练的目标是使HR和LR对应的输出尽可能相似；第二个阶段是使用得到的语义信息来进行超分任务；
对应HR-LR数据对 $x, y$ ，其中 $y$ 是对 $x$ 进行degradation得到的，之后分别输入到DAPE模型中得到 $f_x^{rep},f_x^{logits},f_y^{rep},f_y^{logits}$ ，DAPE模型是从tag预训练模型初始化而来，最后的损失是 $L_{DAPE}=L_r(f_y^{ref},f_x^{rep}) + \lambda L_l(f_y^{logits},f_x^{logits})$ ， $L_r$ 是MSE损失， $L_l$ 是cross entropy损失，两部分损失中logits部分损失受到模型thresh值设定的影响，所以使用representation部分进行补充；
超分网络在原始SD模型的基础上新增了representation和image作为条件，分别对应representation cross attention模块和controlnet模块，其中representation cross attention添加到text cross attn模块后面；
LR Embedding in Inference：推理的时候往常是随机初始化的噪声，但是本文是对LR添加噪声来进行噪声初始化；

实验

SeeSR: Towards Semantics-Aware Real-World Image Super-Resolution

CVPR2024 香港理工大学&OPPO&bytedancehttps://github.com/cswry/SeeSR?tabreadme-ov-file#-licensehttps://arxiv.org/pdf/2311.16518#page5.80 问题引入因为有些LR退化情况比较严重，所以超分之后的结果会出现语义的不一致的情况，所以本文训…...

编程日记 2024/7/1 23:41:15

七月论文审稿GPT第5版：拿我司七月的早期paper-7方面review数据集微调LLama 3

前言 llama 3出来后，为了通过paper-review的数据集微调3，有以下各种方式不用任何框架工具技术，直接微调原生的llama 3，毕竟也有8k长度了效果不期望有多高，纯作为baseline通过PI，把llama 3的8K长度扩展…...

编程日记 2024/7/1 23:40:02

盘古5.0，靠什么去解最难的题？

文｜周效敬编｜王一粟当大模型的竞争开始拼落地，商业化在B端和C端都展开了自由生长。在B端，借助云计算向千行万业扎根；在C端，通过软件App和智能终端快速迭代。在华为，这家曾经以通信行业起…...

编程日记 2024/7/1 23:37:50

2.3章节Python中的数值类型

1.整型数值 2.浮点型数值 3.复数 Python中的数值类型清晰且丰富，主要分为以下几种类型，每种类型都有其特定的用途和特性。一、整型数值 1.定义：整数类型用于表示整数值，如1、-5、100等。 2.特点： Python 3中的…...

编程日记 2024/7/1 23:35:41

每日Attention学习7——Frequency-Perception Module

模块出处 [link] [code] [ACM MM 23] Frequency Perception Network for Camouflaged Object Detection 模块名称 Frequency-Perception Module (FPM) 模块作用获取频域信息，更好识别伪装对象模块结构模块代码 import torch import torch.nn as nn import to…...

编程日记 2024/7/1 23:34:40

【从0实现React18】 (五) 初探react mount流程完成核心递归流程

更新流程的目的： 生成wip fiberNode树标记副作用flags 更新流程的步骤： 递：beginWork归：completeWork 在上一节 ，我们探讨了 React 应用在首次渲染或后续更新时的整体更新流程。在 Reconciler 工作流程中&#xff…...

编程日记 2024/7/1 23:33:40

0-30 VDC 稳压电源，电流控制 0.002-3 A

怎么运行的首先，有一个次级绕组额定值为 24 V/3 A 的降压电源变压器，连接在电路输入点的引脚 1 和 2 上。（电源输出的质量将直接影响与变压器的质量成正比）。变压器次级绕组的交流电压经四个二极管D1-D4组成的电桥整流。桥输出端…...

编程日记 2024/7/1 23:32:38

HTML5+CSS3+JS小实例：图片九宫格

实例：图片九宫格技术栈：HTML+CSS+JS 效果：源码：【HTML】 <!DOCTYPE html> <html lang="zh-CN"> <head><meta charset="UTF-8"><meta name="viewport" content="width=device-width, initial-scale=1…...

编程日记 2024/7/1 23:31:37

湘潭大学软件工程数据库总结

文章目录前言试卷结构给学弟学妹的一些参考自己的一些总结前言自己可能很早很早之前就准备复习了，但是感觉还是没有学到要点，主要还是没啥紧迫的压力，我们是三月份开学，那时候实验室有朋友挺认真开始学习数据库了，…...

编程日记 2024/7/1 23:30:36

Codeforces Testing Round 1 B. Right Triangles 题解组合数学

Right Triangles 题目描述 You are given a n m nm nm field consisting only of periods (‘.’) and asterisks (‘*’). Your task is to count all right triangles with two sides parallel to the square sides, whose vertices are in the centers of ‘*’-cells. …...

编程日记 2024/7/1 23:29:35

怎样将word默认Microsoft Office，而不是WPS

设置——>应用——>默认应用——>选择"word"——>将doc和docx都选择Microsoft Word即可...

编程日记 2024/7/1 23:28:34

C语言之进程的学习2

Env环境变量（操作系统的全局变量）...

编程日记 2024/7/1 23:26:30

web使用cordova打包Andriod

一.安装Gradel 1.下载地址 Gradle Distributions 2.配置环境 3.测试是否安装成功在cmd gradle -v 二.创建vite项目 npm init vitelatest npm install vite build 三.创建cordova项目 1.全局安装cordova npm install -g cordova 2. 创建项目 cordova create cordova-app c…...

编程日记 2024/7/1 23:25:29

内卷情况下，工程师也应该了解的项目管理

简介：大家好，我是程序员枫哥，🌟一线互联网的IT民工、📝资深面试官、🌹Java跳槽网创始人。拥有多年一线研发经验，曾就职过科大讯飞、美团网、平安等公司。在上海有自己小伙伴组建的副业团队&…...

编程日记 2024/7/1 23:24:27

【解锁未来：深入了解机器学习的核心技术与实际应用】

解锁未来：深入了解机器学习的核心技术与实际应用 💎1.引言💎1.1 什么是机器学习？ 💎2 机器学习的分类💎3 常用的机器学习算法💎3.1 线性回归（Linear Regression）&#x1…...

编程日记 2024/7/1 23:23:25

1-3.文本数据建模流程范例

文章最前： 我是Octopus，这个名字来源于我的中文名–章鱼；我热爱编程、热爱算法、热爱开源。所有源码在我的个人github ；这博客是记录我学习的点点滴滴，如果您对 Python、Java、AI、算法有兴趣，可以关注我的…...

编程日记 2024/7/1 23:22:24

【FFmpeg】avformat_alloc_output_context2函数

【FFmpeg】avformat_alloc_output_context2函数 1.avformat_alloc_output_context21.1 初始化AVFormatContext（avformat_alloc_context）1.2 格式猜测（av_guess_format）1.2.1 遍历可用的fmt（av_muxer_iterate&#xff0…...

编程日记 2024/7/1 23:20:21

Flask 缓存和信号

Flask-Caching Flask-Caching 是 Flask 的一个扩展，它为 Flask 应用提供了缓存支持。缓存是一种优化技术，可以存储那些费时且不经常改变的运算结果，从而加快应用的响应速度。一、初始化配置安装 Flask-Caching 扩展： pip3 i…...

编程日记 2024/7/1 23:19:20

基于weixin小程序农场驿站系统的设计

管理员账户功能包括：系统首页，个人中心，农场资讯管理，用户管理，卖家管理，用户分享管理，分享类型管理，商品信息管理，商品类型管理开发系统：Windows 架构模式…...

编程日记 2024/7/1 23:16:16

JAVA将List转成Tree树形结构数据和深度优先遍历

引言： 在日常开发中，我们经常会遇到需要将数据库中返回的数据转成树形结构的数据返回，或者需要对转为树结构后的数据绑定层级关系再返回，比如需要统计当前节点下有多少个节点等，因此我们需要封装一个ListToTree的工具类…...

编程日记 2024/7/1 23:14:14

深入剖析AI大模型：大模型时代的 Prompt 工程全解析

今天聊的内容，我认为是AI开发里面非常重要的内容。它在AI开发里无处不在，当你对 AI 助手说 "用李白的风格写一首关于人工智能的诗"，或者让翻译模型 "将这段合同翻译成商务日语" 时，输入的这句话就是 Prompt。…...

编程新知 2026/2/8 20:42:53

Flask RESTful 示例

目录 1. 环境准备2. 安装依赖3. 修改main.py4. 运行应用5. API使用示例获取所有任务获取单个任务创建新任务更新任务删除任务中文乱码问题： 下面创建一个简单的Flask RESTful API示例。首先，我们需要创建环境，安装必要的依赖，然后…...

编程新知 2026/2/8 20:42:43

调用支付宝接口响应40004 SYSTEM_ERROR问题排查

在对接支付宝API的时候，遇到了一些问题，记录一下排查过程。 Body:{"datadigital_fincloud_generalsaas_face_certify_initialize_response":{"msg":"Business Failed","code":"40004","sub_msg…...

编程新知 2026/2/8 20:41:48

postgresql|数据库|只读用户的创建和删除（备忘）

CREATE USER read_only WITH PASSWORD 密码 -- 连接到xxx数据库 \c xxx -- 授予对xxx数据库的只读权限 GRANT CONNECT ON DATABASE xxx TO read_only; GRANT USAGE ON SCHEMA public TO read_only; GRANT SELECT ON ALL TABLES IN SCHEMA public TO read_only; GRANT EXECUTE O…...

编程新知 2025/9/18 19:34:22

《通信之道——从微积分到 5G》读书总结

第1章绪论 1.1 这是一本什么样的书通信技术，说到底就是数学。那些最基础、最本质的部分。 1.2 什么是通信通信发送方接收方承载信息的信号解调出其中承载的信息信息在发送方那里被加工成信号（调制） 把信息从信号中抽取出来&am…...

编程新知 2026/2/7 11:01:56

全志A40i android7.1 调试信息打印串口由uart0改为uart3

一，概述 1. 目的将调试信息打印串口由uart0改为uart3。 2. 版本信息 Uboot版本：2014.07； Kernel版本：Linux-3.10； 二，Uboot 1. sys_config.fex改动使能uart3(TX:PH00 RX:PH01)，并让boo…...

编程新知 2026/2/5 6:28:09

OPENCV形态学基础之二腐蚀

一.腐蚀的原理 (图1) 数学表达式：dst(x,y) erode(src(x,y)) min(x,y)src(xx,yy) 腐蚀也是图像形态学的基本功能之一，腐蚀跟膨胀属于反向操作，膨胀是把图像图像变大，而腐蚀就是把图像变小。腐蚀后的图像变小变暗淡。腐蚀…...

编程新知 2026/2/8 22:00:17

Angular微前端架构：Module Federation + ngx-build-plus (Webpack)

以下是一个完整的 Angular 微前端示例，其中使用的是 Module Federation 和 npx-build-plus 实现了主应用（Shell）与子应用（Remote）的集成。 🛠️ 项目结构 angular-mf/ ├── shell-app/ # 主应用&…...

编程新知 2025/12/3 10:52:37

Java编程之桥接模式

定义桥接模式（Bridge Pattern）属于结构型设计模式，它的核心意图是将抽象部分与实现部分分离，使它们可以独立地变化。这种模式通过组合关系来替代继承关系，从而降低了抽象和实现这两个可变维度之间的耦合度。用例子…...

编程新知 2026/1/23 10:28:48

python爬虫——气象数据爬取

一、导入库与全局配置 python 运行 import json import datetime import time import requests from sqlalchemy import create_engine import csv import pandas as pd作用： 引入数据解析、网络请求、时间处理、数据库操作等所需库。requests：发送 …...

编程新知 2025/12/16 7:53:39

相关文章：