当前位置: 首页 > news >正文

[ICCV-23] Paper List - 3D Generation-related

ICCV-23 paper list

目录

Oral Papers

3D from multi-view and sensors

Generative AI

Poster Papers

3D Generation (Neural generative models)

3D from a single image and shape-from-x

3D Editing

Face and gestures

Stylization

Dataset


Oral Papers

3D from multi-view and sensors

  • Zip-NeRF: Anti-Aliased Grid-Based Neural Radiance Fields
  • Tri-MipRF: Tri-Mip Representation for Efficient Anti-Aliasing Neural Radiance Fields
  • LERF: Language Embedded Radiance Fields
  • Mixed Neural Voxels for Fast Multi-view Video Synthesis
  • Multi-Modal Neural Radiance Field for Monocular Dense SLAM with a Light-Weight ToF Sensor
  • Diffusion-Guided Reconstruction of Everyday Hand-Object Interaction Clips
  • Instruct-NeRF2NeRF: Editing 3D Scenes with Instructions
  • Neural Haircut: Prior-Guided Strand-Based Hair Reconstruction
  • ScanNet++: A High-Fidelity Dataset of 3D Indoor Scenes
  • EgoLoc: Revisiting 3D Object Localization from Egocentric Videos with Visual Queries

  • Zip-NeRF: Anti-Aliased Grid-Based Neural Radiance Fields (pdf):Instant-NGP提出grid-based NeRF,对NeRF提速。Grid-based NeRF通常存在锯齿问题(alias),因此mip-NeRF 360提出将采样由射线变为圆锥,实现抗锯齿(Anti-aliasing)。但是,mip-NeRF 360不能很好的与Instant-NGP结合,因此本文提出了zip-NeRF。
  • LERF: Language Embedded Radiance Fields (pdf) :LERF是DFF的后续工作,在DINO features的基础上,额外引入了CLIP features,帮助实现NeRF中的细粒度定位和分类。

Generative AI

  • TexFusion: Synthesizing 3D Textures with Text-Guided Image Diffusion Models
  • Generative Novel View Synthesis with 3D-Aware Diffusion Models
  • VQ3D: Learning a 3D-Aware Generative Model on ImageNet

Poster Papers

3D Generation (Neural generative models)

  • GRAM-HD: 3D-Consistent Image Generation at High Resolution with Generative Radiance Manifolds
  • Generative Multiplane Neural Radiance for 3D-Aware Image Generation
  • Get3DHuman: Lifting StyleGAN-Human into a 3D Generative Model Using Pixel-Aligned Reconstruction Priors
  • Towards High-Fidelity Text-Guided 3D Face Generation and Manipulation Using only Images
  • ATT3D: Amortized Text-to-3D Object Synthesis
  • Fantasia3D: Disentangling Geometry and Appearance for High-quality Text-to-3D Content Creation
  • GETAvatar: Generative Textured Meshes for Animatable Human Avatars
  • Mimic3D: Thriving 3D-Aware GANs via 3D-to-2D Imitation
  • DreamBooth3D: Subject-Driven Text-to-3D Generation
  • 3D-aware Image Generation using 2D Diffusion Models
  • Single-Stage Diffusion NeRF: A Unified Approach to 3D Generation and Reconstruction

3D from a single image and shape-from-x

  • Accurate 3D Face Reconstruction with Facial Component Tokens
  • HiFace: High-Fidelity 3D Face Reconstruction by Learning Static and Dynamic Details
  • Zero-1-to-3: Zero-shot One Image to 3D Object
  • Deformable Model-Driven Neural Rendering for High-Fidelity 3D Reconstruction of Human Heads Under Low-View Settings

3D Editing

  • Vox-E: Text-Guided Voxel Editing of 3D Objects
  • FaceCLIPNeRF: Text-driven 3D Face Manipulation using Deformable Neural Radiance Fields
  • SKED: Sketch-guided Text-based 3D Editing
  • Seal-3D: Interactive Pixel-Level Editing for Neural Radiance Fields

Face and gestures

  • Speech4Mesh: Speech-Assisted Monocular 3D Facial Reconstruction for Speech-Driven 3D Facial Animation
  • Imitator: Personalized Speech-driven 3D Facial Animation
  • EmoTalk: Speech-Driven Emotional Disentanglement for 3D Face Animation
  • SPACE: Speech-driven Portrait Animation with Controllable Expression

Stylization

  • Diffusion in Style
  • Creative Birds: Self-Supervised Single-View 3D Style Transfer
  • StyleDomain: Efficient and Lightweight Parameterizations of StyleGAN for One-shot and Few-shot Domain Adaptation
  • StylerDALLE: Language-Guided Style Transfer Using a Vector-Quantized Tokenizer of a Large-Scale Generative Model
  • X-Mesh: Towards Fast and Accurate Text-driven 3D Stylization via Dynamic Textual Guidance
  • Locally Stylized Neural Radiance Fields
  • DS-Fusion: Artistic Typography via Discriminated and Stylized Diffusion
  • Multi-Directional Subspace Editing in Style-Space
  • StyleDiffusion: Controllable Disentangled Style Transfer via Diffusion Models
  • All-to-Key Attention for Arbitrary Style Transfer
  • DeformToon3D: Deformable Neural Radiance Fields for 3D Toonification
  • Anti-DreamBooth: Protecting Users from Personalized Text-to-image Synthesis
  • Neural Collage Transfer: Artistic Reconstruction via Material Manipulation

Dataset

  • H3WB: Human3.6M 3D WholeBody Dataset and Benchmark
  • SynBody: Synthetic Dataset with Layered Human Models for 3D Human Perception and Modeling
  • Human-centric Scene Understanding for 3D Large-scale Scenario

相关文章:

[ICCV-23] Paper List - 3D Generation-related

ICCV-23 paper list 目录 Oral Papers 3D from multi-view and sensors Generative AI Poster Papers 3D Generation (Neural generative models) 3D from a single image and shape-from-x 3D Editing Face and gestures Stylization Dataset Oral Papers 3D from …...

Transformer为什么如此有效 | 通用建模能力,并行

目录 1 更强更通用的建模能力 2 并行计算 3 大规模训练数据 4 多训练技巧的集成 Transformer是一种基于自注意力机制的网络,在最近一两年年可谓是大放异彩,我23年入坑CV的时候,我看到的CV工作似乎还没有一个不用到Transformer里的一些组…...

【初识Jmeter】【接口自动化】

jmeter的使用笔记1 Jmeter介绍与下载安装介绍安装配置配置与扩展组件 jmeter的使用基本功能元素登陆请求与提取cookie其他请求接口关联Cookie-响应成功聚合报告查看 Jmeter介绍与下载安装 介绍 jmeter是apache公司基于java开发的一款开源压力测试工具,体积小&…...

C:数组传值调用和传地址调用

传地址调用 对数组进行修改&#xff1a;排序… #include <stdio.h>// 函数用于交换两个整数的值 void swap(int *a, int *b) {int temp *a;*a *b;*b temp; }// 函数用于对整数数组进行升序排序 void sortArray(int *arr, int size) {for (int i 0; i < size - 1…...

Python数据容器——字典的常用操作(增、删、改、查)

作者&#xff1a;Insist-- 个人主页&#xff1a;insist--个人主页 本文专栏&#xff1a;Python专栏 专栏介绍&#xff1a;本专栏为免费专栏&#xff0c;并且会持续更新python基础知识&#xff0c;欢迎各位订阅关注. 目录 一、理解字典 1. Python字典是什么&#xff1f; 2. 字…...

JavaScript入门——(5)函数

1、为什么需要函数 函数&#xff1a;function&#xff0c;是被设计为执行特定任务的代码块 说明&#xff1a;函数可以把具有相同或相似逻辑的代码“包裹”起来&#xff0c;通过函数调用执行这些被“包裹”的代码逻辑&#xff0c;有利于精简代码方便复用。 比如之前使用的ale…...

数据库sql查询成绩第二高

select * from propro; #查询成绩第二高 select max(id) from propro where id <(select max(id) from propro); #查询成绩第二高的第二种方式 select * from (select * from propro order by id desc limit 2) as b order by id asc limit 1;...

十五、异常(5)

本章概要 异常限制构造器 异常限制 当覆盖方法的时候&#xff0c;只能抛出在基类方法的异常说明里列出的那些异常。这个限制很有用&#xff0c;因为这意味着与基类一起工作的代码&#xff0c;也能和导出类一起正常工作&#xff08;这是面向对象的基本概念&#xff09;&#…...

途虎养车上市、京东养车“震虎”,如何突围汽车后市场?

“汽车后市场第一股”终于来了&#xff01; 赶在十一黄金周之前&#xff0c;途虎养车股份有限公司(09690.HK&#xff0c;下称“途虎养车”)于9月26日挂牌港交所&#xff0c;开盘价为28港元/股&#xff0c;与发行价持平&#xff1b;IPO首日报收29.50港元/股&#xff0c;涨幅5.3…...

【算法与数据结构】--算法基础--算法入门

一、什么是算法&#xff1f; 算法是一组有序的操作步骤&#xff0c;用于解决特定问题或执行特定任务。它是一种精确而有限的计算过程&#xff0c;以输入数据作为起点&#xff0c;经过一系列明确定义的步骤&#xff0c;最终产生输出结果。算法可以看作是一种计算机程序的抽象&a…...

AnyDesk密钥

最近最新的密钥&#xff1a;7K2CV32ER6T8F8I 这款软件应该是目前用的最好的可以免费的软件了&#xff0c;记录一下密钥...

C#(Csharp)我的基础教程(二)(我的菜鸟教程笔记)-属性和字段的探究与学习

目录 1、字段字段特点&#xff1a;2、属性属性的特点 1、字段 字段是定义在方法外面的变量&#xff0c;是成员变量&#xff0c;主要是为了类的内部数据交换使用&#xff0c;字段一般是用private修饰&#xff0c;也可以用readonly修饰&#xff0c;表示只读字段&#xff0c;其它…...

Programming abstractions in C阅读笔记:p176-p178

《Programming Abstractions In C》学习第59天&#xff0c;p176-p178总结。 一、技术总结 1.addtive sequences tn tn-1 tn-2 序列&#xff1a;3, 7, 10, 17, 27, 44, 71, 115, 186, 301, 487, 788, 1275, … p177, As a general class, the sequences that follow this…...

LeetCode-496-下一个更大元素

题目描述&#xff1a; 题目链接&#xff1a;LeetCode-496-下一个更大元素 解题思路&#xff1a; 方法一&#xff1a;暴力 方法二&#xff1a;单调栈 方法一代码实现&#xff1a; class Solution {public int[] nextGreaterElement(int[] nums1, int[] nums2) {// 最笨的方法&am…...

C++中的Lambda表达式

一、为什么要有lambda表达式 struct Goods {string _name; // 名字double _price; // 价格int _evaluate; // 评价Goods(const char* str, double price, int evaluate):_name(str), _price(price), _evaluate(evaluate){} }; 对于一个Goods类&#xff0c;需要对其中3个成员分…...

dockerfile搭建lnmp

systemctl stop firewalld systemctl disable firewalld setenforce 0 docker network create --subnet172.18.0.0/16 --opt "com.docker.network.bridge.name""docker1" mynetwork #部署nginx&#xff08;容器IP 为 172.18.0.10&#xff09; mkdir /…...

python之数据库操作详解

一般来说&#xff0c;我们对数据库里的操作需要先连接&#xff0c;创建游标对象&#xff0c;然后通过游标对象执行SQL语句去对SQL的数据进行操作&#xff0c;本篇文章旨在记录与科普。 1.cursor相关 元组是不可变的数据类型&#xff0c;只能查询&#xff0c;不能修改&#xf…...

完成flex布局与float布局

一、flex布局 <style>.nav {display: flex;background-color: #f8f8f8; /* 导航栏背景颜色 */}.nav a {flex: 1;display: flex;align-items: center;justify-content: center;padding: 14px 16px;text-decoration: none;color: #555555; /* 导航栏文字颜色 */}.nav a:ho…...

ThinkPHP团购拼购商城源码/带分销团购商城网站源码/完美版

ThinkPHP团购拼购商城源码&#xff0c;带分销团购商城网站源码&#xff0c;很完美的一套基于ThinkPHP开发的团购分销商城源码&#xff0c;界面也很大气&#xff0c;站长亲测。有需要的可以借鉴一下。 下载地址&#xff1a;https://bbs.csdn.net/topics/613231434...

awvs 中低危漏洞

低危 X-Frame-Options Header未配置 查看请求头中是否存在X-Frame-Options Header字段 会话Cookie中缺少secure属性(未设置安全标志的Cookie) 当cookie设置为Secure标志时&#xff0c;它指示浏览器只能通过安全SSL/TLS通道访问cookie。 未设置HttpOnly标志的Cookie 当cookie设置…...

Display Driver Uninstaller完全指南:解决显卡驱动残留的系统级清理方案

Display Driver Uninstaller完全指南&#xff1a;解决显卡驱动残留的系统级清理方案 【免费下载链接】display-drivers-uninstaller Display Driver Uninstaller (DDU) a driver removal utility / cleaner utility 项目地址: https://gitcode.com/gh_mirrors/di/display-dri…...

如何高效使用PDF-Guru:5种实用PDF处理技巧与完整操作指南

如何高效使用PDF-Guru&#xff1a;5种实用PDF处理技巧与完整操作指南 【免费下载链接】PDF-Guru A Multi-purpose PDF file processing tool with a nice UI that supports merge, split, rotate, reorder, delete, scale, crop, watermark, encrypt/decrypt, bookmark, extrac…...

Linux(9)操作系统

linux 之 操作系统冯若依曼体系体系结构理解数据流动操作系统什么是操作系统&#xff1f;&#xff1f;理解操作系统的调用系统调用的接口&#xff1a;冯若依曼体系 体系结构 要理解进程首先就需要了解操作系统&#xff01;&#xff01;&#xff01; 五大组件&#xff1a; ○…...

3种高效方案破解NCM格式限制:从单文件到批量处理的完整指南

3种高效方案破解NCM格式限制&#xff1a;从单文件到批量处理的完整指南 【免费下载链接】ncmdump 项目地址: https://gitcode.com/gh_mirrors/ncmd/ncmdump 你是否曾为网易云音乐的NCM加密格式而烦恼&#xff1f;当你想要在非网易生态设备上播放已购买音乐时&#xff0…...

多模态扩展:OpenClaw结合Qwen3.5-4B-Claude处理截图信息

多模态扩展&#xff1a;OpenClaw结合Qwen3.5-4B-Claude处理截图信息 1. 为什么需要多模态能力 作为一个长期依赖文本交互的技术爱好者&#xff0c;我最初对OpenClaw的理解停留在"能通过自然语言控制电脑的AI助手"层面。直到上个月需要处理大量产品截图中的文字信息…...

避坑指南:Dify 1.3.1 Docker-Compose部署时,除了镜像拉取慢,你还会遇到的3个典型错误

Dify 1.3.1 Docker-Compose部署实战&#xff1a;3个隐藏陷阱与深度排错指南 当你决定在生产环境部署Dify 1.3.1时&#xff0c;Docker-Compose看似简单的up -d命令背后可能暗藏玄机。本文将从真实故障场景出发&#xff0c;解剖那些官方文档未曾提及的"暗坑"——它们不…...

COMSOL能源开采仿真:基质中瓦斯扩散、裂隙中瓦斯渗流,分析不同工况条件下渗透率演化、有效抽...

COMSOL能源开采仿真&#xff1a;基质中瓦斯扩散、裂隙中瓦斯渗流&#xff0c;分析不同工况条件下渗透率演化、有效抽采半径、抽采产量。 使用模块&#xff1a;PDE&#xff08;基质瓦斯扩散&#xff09;&#xff0c;达西定律/PDE&#xff08;裂隙瓦斯渗流&#xff09;&#xff0…...

别再只调headingPitchRoll了!深入Cesium矩阵变换,从原理到代码理解模型朝向控制

深入Cesium矩阵变换&#xff1a;从数学原理到模型朝向控制的实战指南 在三维地理可视化领域&#xff0c;精确控制模型朝向一直是开发者面临的挑战。许多开发者习惯使用现成的headingPitchRoll方法&#xff0c;但当遇到复杂场景如极地附近模型旋转异常时&#xff0c;往往束手无策…...

Phi-3-Mini-128K实操手册:模型加载耗时优化技巧——分层加载与缓存机制应用

Phi-3-Mini-128K实操手册&#xff1a;模型加载耗时优化技巧——分层加载与缓存机制应用 1. 项目概述 Phi-3-Mini-128K是基于微软Phi-3-mini-128k-instruct模型开发的轻量化对话工具&#xff0c;专为本地部署和高效推理场景设计。该工具通过多项技术创新&#xff0c;显著提升了…...

技术深度:Windows任务栏透明化引擎TranslucentTB架构原理与高级配置指南

技术深度&#xff1a;Windows任务栏透明化引擎TranslucentTB架构原理与高级配置指南 【免费下载链接】TranslucentTB A lightweight utility that makes the Windows taskbar translucent/transparent. 项目地址: https://gitcode.com/gh_mirrors/tr/TranslucentTB Tran…...