计算机视觉顶刊《International Journal of Computer Vision》2025年5月前沿热点可视化分析
追踪计算机视觉领域的前沿热点是把握技术发展方向、推动创新落地的关键,分析这些热点,不仅能洞察技术趋势,更能为科研选题和工程实践提供重要参考。本文对计算机视觉顶刊《International Journal of Computer Vision》2025年5月前沿热点进行了可视化分析。欢迎阅读和转发。
本文作者为韩煦,审核为邓镝。
一、期刊介绍
《国际计算机视觉杂志》(International Journal of Computer Vision,简称IJCV)是计算机视觉领域的顶级期刊。该期刊现为月刊(每年出版12期),致力于发表高质量、原创性的学术论文,以推动计算机视觉科学与工程的蓬勃发展。期刊影响因子11.6(2023),5年期刊影响因子14.5(2023),提交首次决定(中位数)96天。表1展示了IJCV近5年发表文章的数量及期刊的影响因子(IF)的变化情况。
表 1 IJCV每年的文章数量和影响因子
年度 | 文章数/年 | IF |
2023 | 198 | 11.6 |
2022 | 187 | 19.5 |
2021 | 130 | 13.3 |
2020 | 187 | 7.4 |
2019 | 90 | 5.7 |
该期刊的讨论主题领域主要聚焦于计算机视觉领域,具体来说包括图像形成、处理、分析与解读、机器学习技术、统计方法;传感器技术;基于图像的渲染、计算机图形学、机器人技术、影像解译、图像检索、视频分析与标注、多媒体等;视觉计算模型及人脑视觉架构研究。
期刊网址:https://link.springer.com/journal/11263
二、热点分析
表2 论文标题中出现的高频主题词
高频主题 | 翻译 | 出现次数 | 核心方向 |
Generation | 生成 | 8 | 故事 / 图像 / 视频生成 |
Consistency | 一致性 | 6 | 多视图、跨模态、角色身份一致性 |
Re-identification | 重识别 | 4 | 行人 / 视频重识别 |
Semantic Segmentation | 语义分割 | 4 | 弱监督 / 跨模态 / 医学场景 |
Diffusion Models | 扩散模型 | 3 | 动态跟踪、长视频生成 |
3D Reconstruction | 3D 重建 | 3 | 神经场景、形状表示 |
Self-Supervised | 自监督学习 | 3 | 无监督 / 少监督复杂任务 |
Multi-modal | 多模态 | 3 | 视觉 - 语言、跨模态蒸馏 |
Medical Image | 医学影像 | 2 | 分割、肿瘤预测 |
Adversarial Learning | 对抗学习 | 2 | 质量评估、攻击防御 |
Multi-view | 多视图 | 2 | SLIDE(多视图一致性)、多视图立体网络(深度估计) |
Unsupervised | 无监督 | 2 | 跨模态蒸馏语义分割 |
Semi-supervised | 半监督 | 2 | 医学影像分割、联邦半监督学习 |
DeepFake Detection | DeepFake 检测 | 2 | 鲁棒序列检测、双级适配器检测 |
Cross-Modal | 跨模态 | 2 | 跨模态蒸馏 |
图 1 研究热点词云图
表2列出了在本次会议中,被录用的38篇论文标题中的15个高频主题词。图1展示了基于IJCV研究热点生成的词云图,涵盖语义分割、扩散模型、一致性等研究领域。表3总结了本期IJCV的已被接受的投稿论文。
表3 2025年5月IJCV发表论文的列表
题目 | 中文翻译 |
AutoStory: Generating Diverse Storytelling Images with Minimal Human Efforts | AutoStory:以最小人力生成多样化故事图像 |
SLIDE: A Unified Mesh and Texture Generation Framework with Enhanced Geometric Control and Multi-view Consistency | SLIDE:具有增强几何控制与多视角一致性的统一网格与纹理生成框架 |
Exploring Homogeneous and Heterogeneous Consistent Label Associations for Unsupervised Visible-Infrared Person ReID | 探索同质与异质一致标签关联的无监督可见光–红外行人重识别 |
AniClipart: Clipart Animation with Text-to-Video Priors | AniClipart:基于文本到视频先验的剪贴画动画 |
Combating Label Noise with a General Surrogate Model for Sample Selection | 使用通用替代模型进行样本选择以对抗标签噪声 |
CSFRNet: Integrating Clothing Status Awareness for Long-Term Person Re-identification | CSFRNet:融合服装状态感知的长时跨度行人重识别网络 |
Pseudo-Plane Regularized Signed Distance Field for Neural Indoor Scene Reconstruction | 伪平面正则化签名距离场用于神经室内场景重建 |
RepSNet: A Nucleus Instance Segmentation Model Based on Boundary Regression and Structural Re-Parameterization | RepSNet:基于边界回归与结构重参数化的细胞核实例分割模型 |
Blind Image Quality Assessment: Exploring Content Fidelity Perceptibility via Quality Adversarial Learning | 盲图像质量评估:通过质量对抗学习探索内容保真性感知 |
HUPE: Heuristic Underwater Perceptual Enhancement with Semantic Collaborative Learning | HUPE:基于语义协同学习的启发式水下感知增强 |
Robust Sequential DeepFake Detection | 强健序列化 DeepFake 检测 |
PICK: Predict and Mask for Semi-supervised Medical Image Segmentation | PICK:用于半监督医学图像分割的预测与掩码方法 |
Relation-Guided Versatile Regularization for Federated Semi-Supervised Learning | 基于关系引导的联邦半监督学习通用正则化 |
General Class-Balanced Multicentric Dynamic Prototype Pseudo-Labeling | 通用类平衡多中心动态原型伪标签 |
Diving Deep into Simplicity Bias for Long-Tailed Image Recognition | 深入探讨长尾图像识别中的简单性偏差 |
Context-Aware Multi-view Stereo Network for Efficient Edge-Preserving Depth Estimation | 面向高效边缘保留深度估计的上下文感知多视角立体网络 |
LDTrack: Dynamic People Tracking by Service Robots Using Diffusion Models | LDTrack:服务机器人基于扩散模型的动态人群跟踪 |
Learning Meshing from Delaunay Triangulation for 3D Shape Representation | 从 Delaunay 三角化学习网格以进行三维形状表示 |
RIGID: Recurrent GAN Inversion and Editing of Real Face Videos and Beyond | RIGID:真实人脸视频的循环 GAN 反演与编辑 |
UniCanvas: Affordance-Aware Unified Real Image Editing via Customized Text-to-Image Generation | UniCanvas:通过定制文本到图像生成功能感知的统一真实图像编辑 |
Generalized Robot Vision-Language Model via Linguistic Foreground-Aware Contrast | 通过语言前景感知对比的通用机器人视觉-语言模型 |
Rethinking Generalizability and Discriminability of Self-Supervised Learning from Evolutionary Game Theory Perspective | 从进化博弈论视角重新思考自监督学习的泛化性与判别性 |
Pre-trained Trojan Attacks for Visual Recognition | 预训练木马攻击用于视觉识别 |
GL-MCM: Global and Local Maximum Concept Matching for Zero-Shot Out-of-Distribution Detection | GL-MCM:用于零样本分布外检测的全局与局部最大概念匹配 |
A Mutual Supervision Framework for Referring Expression Segmentation and Generation | 一种用于指代表达式分割与生成的互监督框架 |
DeepFake-Adapter: Dual-Level Adapter for DeepFake Detection | DeepFake-Adapter:用于 DeepFake 检测的双层适配器 |
MoonShot: Towards Controllable Video Generation and Editing with Motion-Aware Multimodal Conditions | MoonShot:面向可控视频生成与编辑的运动感知多模态条件 |
SeaFormer++: Squeeze-Enhanced Axial Transformer for Mobile Visual Recognition | SeaFormer++:用于移动视觉识别的压缩增强轴向 Transformer |
Dual-Space Video Person Re-identification | 双空间视频行人重识别 |
Image Synthesis Under Limited Data: A Survey and Taxonomy | 有限数据条件下的图像合成:调查与分类 |
Sample-Cohesive Pose-Aware Contrastive Facial Representation Learning | 基于样本内聚性与姿态感知的对比人脸表征学习 |
Learning with Enriched Inductive Biases for Vision-Language Models | 面向视觉-语言模型的富归纳偏置学习 |
Self-supervised Shutter Unrolling with Events | 基于事件的自监督快门反展开 |
TryOn-Adapter: Efficient Fine-Grained Clothing Identity Adaptation for High-Fidelity Virtual Try-On | TryOn-Adapter:用于高保真虚拟试穿的高效细粒度服装身份适配 |
Correction: CMAE-3D: Contrastive Masked AutoEncoders for Self-Supervised 3D Object Detection | 勘误:CMAE-3D:用于自监督三维目标检测的对比掩码自编码器 |
Correction: Deep Attention Learning for Pre-operative Lymph Node Metastasis Prediction in Pancreatic Cancer via Multi-object Relationship Modeling | 勘误:基于多目标关系建模的胰腺癌术前淋巴结转移预测深度注意力学习 |
Correction: Few Annotated Pixels and Point Cloud Based Weakly Supervised Semantic Segmentation of Driving Scenes | 勘误:基于少量标注像素与点云的驾驶场景弱监督语义分割 |
投稿的论文主题反映出本期研究热点集中在一下几个方向:
- 图像/视频生成与编辑:包括故事图像生成(AutoStory)、文本到视频/图像生成(AniClipart、UniCanvas、MoonShot)、Diffusion Models 驱动的生成与编辑(LDTrack、RIGID)等。这一方向兼顾“多模态条件下的内容创生”和“运动感知的可控编辑”两大主题。
- 一致性建模与行人重识别:涉及多视角一致性(SLIDE)、可见-红外一致标签关联(Unsupervised Visible-Infrared Person ReID)、长时序状态感知重识别(CSFRNet)等。关注场景中跨视角、跨模态的一致性约束与特征对齐技术。
- 语义分割与三维重构:包括神经签名距离场重建(Pseudo-Plane Regularized SDF)、Delaunay三角网格重建(Learning Meshing from Delaunay Triangulation)、核实例分割(RepSNet)、弱监督/半监督分割(PICK、Few Annotated Pixels)等。兼顾平面、体素、点云等多种三维表示与精细分割任务。
相关文章:

计算机视觉顶刊《International Journal of Computer Vision》2025年5月前沿热点可视化分析
追踪计算机视觉领域的前沿热点是把握技术发展方向、推动创新落地的关键,分析这些热点,不仅能洞察技术趋势,更能为科研选题和工程实践提供重要参考。本文对计算机视觉顶刊《International Journal of Computer Vision》2025年5月前沿热点进行了…...

python学习打卡day45
DAY 45 Tensorboard使用介绍 知识点回顾: tensorboard的发展历史和原理tensorboard的常见操作tensorboard在cifar上的实战:MLP和CNN模型 效果展示如下,很适合拿去组会汇报撑页数: 作业:对resnet18在cifar10上采用微调策…...
JAVA元编程
一、引言:元编程的本质与 Java 实现 元编程(Metaprogramming)是一种 “操纵程序的程序” 的编程范式,其核心思想是通过代码动态操作代码本身。在 Java 中,元编程主要通过 ** 反射(Reflection)、…...

Verilog编程技巧01——如何编写三段式状态机
前言 Verilog编程技巧系列文章将聚焦于介绍Verilog的各种编程范式或者说技巧,编程技巧和编程规范有部分重合,但并非完全一样。规范更注重编码的格式,像变量命名、缩进、注释风格等,而编程技巧则更偏重更直观易读、更便于维护、综合…...

智启未来:当知识库遇见莫奈的调色盘——API工作流重构企业服务美学
目录 引言 一、初识蓝耘元生代MaaS平台 1.1 平台架构 1.2 平台的优势 1.3 应用场景 二、手把手教你如何在蓝耘进行注册 (1)输入手机号,将验证码正确填入即可快速完成注册 (2)进入下面的页面表示已经成功注册&…...
java教程笔记(十一)-泛型
Java 泛型(Generics)是 Java 5 引入的重要特性之一,它允许在定义类、接口和方法时使用类型参数。泛型的核心思想是将类型由具体的数据类型推迟到使用时再确定,从而提升代码的复用性和类型安全性。 1.泛型的基本概念 1. 什么是泛…...
JUnit 和 Mockito 的详细说明及示例,涵盖核心概念、常用注解、测试场景和实战案例。
一、JUnit 详解 1. JUnit 核心概念 测试类:以 Test 结尾的类(或通过 Test 注解标记的方法)。断言(Assertions):验证预期结果与实际结果是否一致(如 assertEquals()࿰…...
【Go语言基础【7】】条件语句
文章目录 零、概述一、if 条件语句1. 单条件模型2. 多条件模型(else if)3. 条件嵌套与优化 二、switch 条件判断1. 基本用法2. fallthrough 穿透执行3. break 终止执行 零、概述 语句类型适用场景核心特点if-else单条件或简单多条件判断逻辑清晰&#x…...
【Python 算法零基础 4.排序 ⑪ 十大排序算法总结】
目录 一、选择排序回顾 二、冒泡排序回顾 三、插入排序回顾 四、计数排序回顾 五、归并排序回顾 六、快速排序回顾 七、桶排序回顾 八、基数排序 九、堆排序 十、希尔排序 十一、十大排序算法对比 十二、各算法详解与应用场景 1. 选择排序(Selection Sortÿ…...
解决神经网络输出尺寸过小的实战方案
训练CIFAR10分类模型时出现报错:RuntimeError: Given input size: (256x1x1). Calculated output size: (256x0x0). Output size is too small。该问题由网络结构设计缺陷导致图像尺寸过度缩小引发。 核心原因分析 网络结构缺陷 原始模型采用六层卷积层,…...
Python备忘
1. 自定义多线程程序: import concurrent.futures import threadingclass CustomThreadPool:def __init__(self, max_workers):self.max_workers max_workersself.pool concurrent.futures.ThreadPoolExecutor(max_workers)self.running_num 0self.semaphore t…...

如何在 Windows 11 中永久更改默认浏览器:阻止 Edge 占据主导地位
在 Windows 11 中更改默认浏览器对于新手或技术不太熟练的用户来说可能会令人沮丧。 为什么要在 Windows 11 中更改默认浏览器? 这是一个重要的问题:你为什么要从 Microsoft Edge 切换过来? 生态系统集成:如果你已经在广泛使用 Google 服务,Chrome 可以提供无缝集成。同…...

量子比特实现方式
经典计算机是通过电子电路运转起来的。使用硅制半导体制成的名为晶体管的小元件发挥了开关的作用,将其与金属布线组合起来即可实现逻辑门,再将逻辑门集成起来就能制造出经典计算机。量子计算机的制造过程则要复杂许多,因为量子计算机既需要量…...

智慧水务发展迅猛:从物联网架构到AIoT系统的跨越式升级
AI大模型引领智慧水务迈入新纪元 2025年5月25日,水利部自主研发的“水利标准AI大模型”正式发布,它标志着水务行业智能化进程的重大突破。该模型集成1800余项水利标准、500余项法规及海量科研数据,支持立项、编制、审查等全流程智能管理&…...
1、cpp实现Python的print函数
实现一 #include <iostream> #include <list> #include <string>using namespace std;// 定义一个空的print函数,作为递归终止条件 void print(){// };// 可变参数模板函数,用于递归输出传入的参数 template <typename T, typenam…...
【Linux基础知识系列】第十四篇-系统监控与性能优化
一、简介 随着信息技术的飞速发展,Linux系统在服务器领域占据着重要地位。无论是web服务器、数据库服务器还是文件服务器,都需要高效的运行以满足业务需求。系统监控与性能优化是确保Linux系统稳定、高效运行的关键任务。通过实时监测系统资源的使用情况…...
云原生思维重塑数字化基座:从理念到实践的深度剖析
📝个人主页🌹:慌ZHANG-CSDN博客 🌹🌹期待您的关注 🌹🌹 一、引言:云原生为何成为数字化的“基础设施语言”? 随着5G、人工智能、物联网等技术逐步进入规模化落地阶段&am…...
Animate On Scroll 用于在用户滚动页面时实现元素的动画效果
AOS (Animate On Scroll) 详细介绍 什么是AOS? AOS(Animate On Scroll)是一个轻量级的JavaScript库,用于在用户滚动页面时实现元素的动画效果。它允许网页元素在进入或离开视口(viewport)时触发各种CSS动…...

Java高级 | 【实验五】Spring boot+mybatis操作数据库
隶书文章:Java高级 | (二十二)Java常用类库-CSDN博客 系列文章:Java高级 | 【实验一】Springboot安装及测试 |最新-CSDN博客 Java高级 | 【实验二】Springboot 控制器类相关注解知识-CSDN博客 Java高级 | 【实验三】Springboot 静…...
[蓝桥杯]搭积木
搭积木 题目描述 小明对搭积木非常感兴趣。他的积木都是同样大小的正立方体。 在搭积木时,小明选取 mm 块积木作为地基,将他们在桌子上一字排开,中间不留空隙,并称其为第 0 层。 随后,小明可以在上面摆放第 1 层&a…...

在MATLAB中使用自定义的ROS2消息
简明结论: 无论ROS2节点和MATLAB运行在哪,MATLAB本机都必须拥有自定义消息源码并本地用ros2genmsg生成,才能在Simulink里订阅这些消息。只要你想让MATLAB或Simulink能识别自定义消息,必须把消息包源码(.msg等)拷到本机指定目录&a…...
使用C/C++和OpenCV实现图像拼接
使用 C 和 OpenCV 实现图像拼接 本文将详细介绍如何利用 OpenCV 库,在 C 环境中实现图像拼接。图像拼接技术可以将多张具有重叠区域的图像合成为一张高分辨率的全景图。OpenCV 提供了一个功能强大的 Stitcher 类,它封装了从特征点检测、匹配到图像融合的…...
神经网络-Day46
目录 一、 什么是注意力二、 特征图的提取2.1 简单CNN的训练2.2 特征图可视化 三、通道注意力3.1 通道注意力的定义3.2 模型的重新定义(通道注意力的插入) 一、 什么是注意力 注意力机制,本质从onehot-elmo-selfattention-encoder-bert这就是…...
Ubuntu中常用的网络命令指南
Ubuntu中常用的网络命令指南 在Ubuntu系统中,网络管理是日常运维和故障排查的核心技能。 🛠️ 基础网络诊断 ping - 测试网络连通性 ping google.com # 持续测试 ping -c 4 google.com # 发送4个包后停止traceroute / tracepath - 追踪数据包路径 …...
JVM——如何打造一个类加载器?
引入 在Java应用程序的生命周期中,类加载器扮演着至关重要的角色。它是Java运行时环境的核心组件之一,负责在需要时动态加载类文件到JVM中。理解类加载器的工作原理以及如何自定义类加载器,不仅可以帮助我们更好地管理应用程序的类加载过程&…...

【MATLAB去噪算法】基于ICEEMDAN联合小波阈值去噪算法
ICEEMDAN联合小波阈值去噪算法相关文献 (注:目前相关论文较少,应用该套代码可发直接一些水刊) 一、CEEMDAN的局限性 模式残留噪声问题:原始CEEMDAN在计算每个IMF时直接对噪声扰动的信号进行模态分解并平均。 后果&a…...
c++ Base58编码解码
Base58 字符集 Base58 使用 58 个字符进行编码,字符集为:123456789ABCDEFGHJKLMNPQRSTUVWXYZabcdefghijkmnopqrstuvwxyz。注意:0(零)、O(大写字母O)、I(大写字母I)和 l&a…...
证券交易柜台系统解析与LinkCounter解决方案开发实践
第一章 证券交易柜台系统基础解析 1.1 定义与行业定位 证券交易柜台系统(Trading Counter System)是券商经纪业务的核心支撑平台,承担投资者指令传输、风险控制、清算结算等职能。根据中国证监会《证券期货业网络信息安全管理办法》要求&am…...

XXTEA,XTEA与TEA
TEA、XTEA和XXTEA都是分组加密算法,它们在设计、安全性、性能等方面存在显著区别。以下是它们的主要区别: 密钥长度 TEA:使用128位密钥。 XTEA:通常使用128位或256位密钥。 XXTEA:密钥长度更灵活,可以使用任…...

机器人玩转之---嵌入式开发板基础知识到实战选型指南(包含ORIN、RDK X5、Raspberry pi、RK系列等)
1. 基础知识讲解 1.1 什么是嵌入式开发板? 嵌入式开发板是一种专门设计用于嵌入式系统开发的硬件平台,它集成了微处理器、内存、存储、输入输出接口等核心组件于单块印刷电路板上。与传统的PC不同,嵌入式开发板具有体积小、功耗低、成本适中…...