当前位置: 首页 > news >正文

Meta AR眼镜主管:正开发史无前例的AR,但要解决很多困难

前不久,Meta CTO Andrew Bosworth在个人博客上“怒斥”公司内部不够专注,应该将资源投入在有核心竞争力、高投资回报率的业务上,而不是开发取悦用户却不赚钱的产品。尽管删除一些小众功能后,用户可能会不满,但为了让Meta生存下去,则必须分清主次,因为开发任何应用都有成本,需考虑回报。

实际上,自去年Meta开启大裁员后,“专注”就成为该公司的重要口号之一,具体来讲,就是关闭对未来业务不重要、收入不够高的项目(比如Portal),将资源集中在AR/VR、元宇宙(虚拟社交)研发上。一些热门的游戏也受到牵连,比如《Crayta》、《Echo VR》。另外在这场裁员、业务关闭风波中,Meta投资者们开始对AR/VR这一愿景产生质疑。尤其是考虑到Reality Labs每年花的钱越来越多(去年净亏损已达到137.17亿美元),却没有大规模回报,投资者们开始希望Meta缩减在该部门的经费。

相比于较为成熟的VR,AR也是Reality Labs的一项重大投入,几乎使用了整个机构运营经费的一半。然而AR的发展进度远不及VR,自2018年公布AR眼镜计划以来,Meta似乎还处于技术研发阶段,可能距离推出产品还很远。据此前的报道来看,Meta原本计划在2023-2025年推出首款AR眼镜,但从Bosworth在接受采访时的发言来看,AR研发的实际情况可能并不乐观,发布时间甚至可能推迟至2024-2030年。值得注意的是,前Meta AR眼镜产品负责人Nikhil Chandhok在担任该职位一年多就离职了。这不禁让人担心Meta AR眼镜项目的命运。

近期,Meta在官网公布了对AR眼镜硬件主管Caitlin Kalinowski的采访,Kalinowski在采访中表示:我们正在开发的AR眼镜,是史无前例的产品。据悉,Kalinowski已经在Meta从业近10年,曾是Meta VR团队的资深成员,担任VR硬件负责人,领导了Quest、Go、Link连接线的产品设计和整合。后来在 去年3月,她开始负责Meta AR眼镜硬件团队。另外,她此前在苹果曾担任硬件部门的产品设计工程师,从业时间5年多。

接下来,我们就一起来了解一下,Meta的AR计划进行到了哪一步,又遇到了哪些困难,未来会是怎样的呢?

Meta:现阶段,消费市场对XR的关注主要集中在VR上,因为人们可以在VR中体验沉浸式3D游戏、办公和社交,这些应用场景足够吸引人。相比之下,AR更具变革性,它与VR不同,不是用虚拟场景覆盖真实世界,而是将虚拟内容叠加、交织在现实中的各个角落,增强我们对世界的感知。当然这并不是唯一的区别,AR和VR也处于产品开发的不同阶段。

在最近一波潮流中,VR头显已经发展了至少十年,但AR在主流市场中几乎不存在,就连构建AR的元件也并非现成,因此这项技术几乎是一个从0到1的挑战。

Meta:而在加入AR硬件团队之前,你曾在VR硬件部门工作了近10年。从产品开发角度看,AR和VR有什么区别?你在这两个领域解决的问题有哪些相似之处?哪些不同之处?

Caitlin Kalinowski:AR和VR都处于消费电子前沿,它们都是令人兴奋的技术。但在我看来,它们都面临相同的问题,即“新技术引进”(NTI)。NTI指的是,在市场中引入以前从未出现过的东西,比如一些创新功能。就拿Quest pro来讲,该产品最难的NTI是透镜,因为我们需要将透镜做的足够薄,才能让显示器更靠近人脸,进而缩减头显的厚度和重量。

通常,VR头显使用的是市面现成的部件,或是从手机元件改装的部件,比如塑料模型、泡棉、显示屏和硅基芯片。另外,VR的NTI技术少,所以截至目前产品迭代已经约有6到7次。然而,Meta正在研究的AR眼镜存在约6种NTI技术,它们的难度比VR透镜更大。Meta需要解决所有这些NTI,才能考虑推出AR眼镜。因此AR与VR的最大区别就是,VR比AR走的更远,但长期来看AR也有望赶超VR。

Meta:是不是有些功能必须在AR眼镜上实现,而在VR中则不需要考虑,所以才让AR开发特别困难?

CK:AR面临的最大挑战之一,即使空间定位,其次是重量。我们知道,VR是封闭的视觉体验,即使通过VST透视你可以看到周围环境,这些环境视图也是通过摄像头捕捉的,通过后期算法优化和调整后,AR可以和环境视图很好的融合。然而,AR眼镜为光学透视,环境光通过透镜进入人眼,因此AR眼镜渲染的虚拟图像依赖于精准定位,才能与真实的物理场景自然融合/匹配,你几乎不能用算法来校正。

另一方面,AR眼镜的重量应该达到VR头显的六分之一或更少,它不仅要更小巧、更轻便,还要更强大。这意味着,AR眼镜没有那么多空间放电池(相比之下,Quest Pro可以将电池固定在用户后脑勺位置),因此需要采用定制的元件,尽可能节省功耗。

Meta:AR眼镜的进度如何?

CK:我们正在努力推进,尽快推出产品。

Meta:从本质来讲,AR眼镜原本是不存在的产品,你们需要从0开始研发,并且需要应对NTI所带来的挑战。而产品开发的进度,将取决于NTI问题的解决情况。那么作为团队领导,你个人遇到那些挑战?保持团队积极性和注意力是否很难?

CK:Meta的AR眼镜团队集合了大量人才,其中很多曾就职于微软HoloLens品牌,因此他们了终于研发前沿技术。实际上,我可能还不如我的团队那么适应AR研发,因为相比于AR眼镜,VR头显是更确定的技术。不过,我已经开始调整心态。

现阶段,眼镜形态、功能强大的AR硬件史无前例,而Meta正在努力将这项技术产品化。然而,我并不能百分百确定AR眼镜何时成熟、何时普及,因此我要适应这种不确定性。

比如,每当我们的日程安排发生变化,我的团队就会安慰我,这是计划的一部分,于是我只能耐心接受。为了新的技术突破,这是不得不做的让步,我花了一些时间才真正适应。

Meta:AR眼镜最终会取代VR头显吗?它们是否能相互补充?

CK:在我和Meta看来,AR和VR不会融合。VR的用途是带你到新的场景,在这里你可以专注思考、学习、玩游戏或旅行。而AR则将场景设定在现实,也就是你所在的位置,这与VR非常不同。尽管如此,AR可以从VR中学习经验。

总体来讲,AR和VR是不同的技术。我认为,未来人们使用AR的时间会超过VR,因为AR可能会具备目前手机的大部分用途。比如在视觉导航领域,AR眼镜可以比手机更直观,操作起来更自然,而且不干扰你的旅行体验。

实际上,我们还不知道AR会有哪些关键应用,现在只有一些预测。从VR的经验来看,一些应用场景超出了我们预期,比如VR健身,相信AR也会出现这种预期外的用途。

Meta:高效、创新的团队依赖于有效的合作,Meta AR团队是怎样管理的?

CK:成员的技能、工作方式需要互补,我们需要分析能力强的人,也需要直觉能力强的人,或是有激励作用的人,能够团结大家。因此,员工多样性对我们团队很重要。

AR眼镜是穿戴式设备,使用方式与手机不同,因为手机是放在口袋里的。此外相比于手机,人们对AR眼镜的美感要求更高,因此我们需要不同类型的人才,来丰富AR眼镜设计的多样性,以迎合不同类型的人群。

举个例子,初代Apple Watch并没有考虑到用户身上的文身,这影响了其传感器读取信息的准确性。人性化设计,应该是穿戴式产品的重要部分。

Meta:最后,在推动AR从0到1这个过程,如果遇到失误、计划失败、不如预期等情况,你是如何应对的?

CK:从0开始研发AR,你不可能不经历失败,我们只能尽量避免犯错。在团队管理时,你需要对错误有一定程度预期,即使犯错也要积极面对,这样才能鼓励成员尽早报告错误。当我们发现一条路走不通,那就尽快找下一条路。虽然AR是一场冒险,但如果你乐观且耐心,失败也能变成经验。参考:Meta

相关文章:

Meta AR眼镜主管:正开发史无前例的AR,但要解决很多困难

前不久,Meta CTO Andrew Bosworth在个人博客上“怒斥”公司内部不够专注,应该将资源投入在有核心竞争力、高投资回报率的业务上,而不是开发取悦用户却不赚钱的产品。尽管删除一些小众功能后,用户可能会不满,但为了让Me…...

Docker 搭建KingbaseES主备流复制

author: aming email: jikcheng163.com title: Docker 安装KingbaseES读写分离集群 creation_date: 2023-02-16 13:59 Last modified date: 2023-02-16 19:18 tags: Docker 安装KingbaseES读写分离集群 File Folder with relative path: reading notes/doc/Docker技术入门与实战…...

java易错题锦集四

effective java 不要再构造方法中启动任何线程 g new GameServer(); g.start();构造器无返回值,但是不能void修饰 字符串 String是包装类型吗?答案: 不是 对应的基本类型和包装类如下表: 基本数据类型 包装类 byte Byte bool…...

每天10个前端小知识 【Day 17】

前端面试基础知识题 1.使用原生js实现以下效果:点击容器内的图标,图标边框变成border:1px solid red,点击空白处重置 const box document.getElementById(box); function isIcon(target) { return target.className.includes(icon); } b…...

Python语言零基础入门教程(二十三)

16、Python os.fpathconf() 方法 概述 os.fpathconf() 方法用于返回一个打开的文件的系统配置信息。 Unix上可用。 语法 fpathconf()方法语法格式如下: os.fpathconf(fd, name)参数 fd – 打开的文件的描述符。 name – 可选,和buffersize参数和Pyt…...

[ansible系列]ansible使用扩展

目录 一. 本地执行 二. 任务委托 三. 任务暂停 四. 滚动执行 五. 只执行一次 六. 设置环境变量 七. 交互提示 一. 本地执行 我们知道ansible的是操作被控端的,所有执行的动作都是在被控端上完成的,当然在某些特定的时候我们想要有些tas…...

Java工具类(时间格式转换)

import java.util.Date; import java.text.DateFormat; /** * 格式化时间类 * DateFormat.FULL 0 * DateFormat.DEFAULT 2 * DateFormat.LONG 1 * DateFormat.MEDIUM 2 * DateFormat.SHORT 3 * author Michael * version 1.0, 2007/03/09 */ public c…...

数据库(第五次作业)

1.1 Redis概述 1.1.1 什么是Redis 2008年,意大利的一家创业公司Merzia推出了一款基于MySQL的网站实时统计系统LLOOGG,然而没过多久该公司的创始人 Salvatore Sanfilippo便开始对MySQL的性能感到失望,于是他决定亲自为LLOOGG量身定做一个数据…...

代码随想录【Day16】| 110. 平衡二叉树、257. 二叉树的所有路径、404. 左叶子之和

110. 平衡二叉树 题目链接 题目描述: 给定一个二叉树,判断它是否是高度平衡的二叉树。 本题中,一棵高度平衡二叉树定义为:一个二叉树每个节点 的左右两个子树的高度差的绝对值不超过1。 示例 1: 给定二叉树 [3,9,20,null,nul…...

套娃式工具!用 AI 识别 AI ?#AI classifier

2022年以来,市面上就出现了不少 AI 生成文本的工具,尤其是 OpenAI 推出的 ChatGPT ,不仅能够协助完成撰写邮件、视频脚本、文案、翻译、代码等任务,还能通过学习和理解人类的语言来进行对话,并根据聊天的上下文进行互动…...

CURL error 60: SSL certificate problem: certificate has expired

项目使用guzzleHttp做的一个接口,报错:certificate has expired 因为在linux centos环境与window环境有所不同,在此记录一下解决过程。 目录 报错提示 原因 解决方式 1.去掉guzzlehttp的验证 2.更新CA证书 总结 报错提示 cURL error 60…...

接口自动化:requests

引言:目前软件测试对测试人员的能力要求 业务测试能力:占比5-6成接口、自动化、性能测试能力:占比4-5成流程规范:1成(需要综合型的测试人才):业务能力、代码能力、开发思维(封装&…...

极简TypeScript教程--数据类型

TypeScript最大的特点就是有类型检测,格式为let/const 标识符: 数据类型 赋值;例子:let msg: string Hello World这样msg这个变量就有了字符串类型,如果再给他赋值为数字类型,就会在编译期报错。变量的类型推导在开发中,有时候为了方便起见…...

JAVA开发测试(jmeter如何测试性能与估算)

对C的业务网站或应用,进行性能测试来评估使用服务器情况是必不可少的一项工作。 一、测试工具: Apache JMeter 可以用于对服务器、网络或对象模拟巨大的负载,来自不同压力类别下测试它们的强度和分析整体性能,是Apache组织开发的…...

【新解法】华为OD机试 - 求解连续数列 | 备考思路,刷题要点,答疑,od Base 提供

华为 OD 清单查看地址:blog.csdn.net/hihell/category_12199275.html 求解连续数列 | 备考思路,刷题要点,答疑,od Base 提供 题目 已知连续正整数数列{K}=K1,K2,K3… Ki的各个数相加之和为S, i = N (0 < S < 100000, 0 < N < 100000), 求此数列K。 输入 输…...

Python3 File(文件) 方法

Python3 File(文件) 方法 open() 方法 Python open() 方法用于打开一个文件&#xff0c;并返回文件对象。 在对文件进行处理过程都需要使用到这个函数&#xff0c;如果该文件无法被打开&#xff0c;会抛出 OSError。 注意&#xff1a;使用 open() 方法一定要保证关闭文件对…...

APP渗透抓包

APP渗透抓包1.APP渗透测试原理2.安装安卓模拟器抓包2.1.安装模拟器2.2.设置代理下载证书2.2.1.burp suite设置代理2.2.2.浏览器设置代理2.2.3.下载证书2.3.模拟器安装证书2.3.1.移动证书2.3.2.证书设置2.4.设置代理2.4.1.设置burp suite代理2.4.2.夜神模拟器代理2.5.抓包测试2.…...

力扣(LeetCode)414. 第三大的数(2023.02.16)

给你一个非空数组&#xff0c;返回此数组中 第三大的数 。如果不存在&#xff0c;则返回数组中最大的数。 示例 1&#xff1a; 输入&#xff1a;[3, 2, 1] 输出&#xff1a;1 解释&#xff1a;第三大的数是 1 。 示例 2&#xff1a; 输入&#xff1a;[1, 2] 输出&#xff1a;2…...

Spring底层

一、什么是Spring&#xff1f;谈谈你对IOC和AOP的理解。Spring&#xff1a; 是一个企业级java应用框架&#xff0c;他的作用主要是 简化软件的开发以及配置过程&#xff0c;简化项目部署环境。Spring的有点&#xff1a;1、Spring低侵入设计&#xff0c;对业务代码的污染非常低。…...

Cache-Control 常见字段

Cache-Control 常见字段 参考&#xff1a;https://blog.csdn.net/qq_41996454/article/details/108644436 Cache-Control 可以在请求头或者响应头中设置&#xff0c;并且可以组合使用多种指令 no-cache 和 no-store 用作控制缓存&#xff0c;被服务器通过响应头 Cache-Contro…...

【机器视觉】单目测距——运动结构恢复

ps&#xff1a;图是随便找的&#xff0c;为了凑个封面 前言 在前面对光流法进行进一步改进&#xff0c;希望将2D光流推广至3D场景流时&#xff0c;发现2D转3D过程中存在尺度歧义问题&#xff0c;需要补全摄像头拍摄图像中缺失的深度信息&#xff0c;否则解空间不收敛&#xf…...

多模态商品数据接口:融合图像、语音与文字的下一代商品详情体验

一、多模态商品数据接口的技术架构 &#xff08;一&#xff09;多模态数据融合引擎 跨模态语义对齐 通过Transformer架构实现图像、语音、文字的语义关联。例如&#xff0c;当用户上传一张“蓝色连衣裙”的图片时&#xff0c;接口可自动提取图像中的颜色&#xff08;RGB值&…...

Neo4j 集群管理:原理、技术与最佳实践深度解析

Neo4j 的集群技术是其企业级高可用性、可扩展性和容错能力的核心。通过深入分析官方文档,本文将系统阐述其集群管理的核心原理、关键技术、实用技巧和行业最佳实践。 Neo4j 的 Causal Clustering 架构提供了一个强大而灵活的基石,用于构建高可用、可扩展且一致的图数据库服务…...

【git】把本地更改提交远程新分支feature_g

创建并切换新分支 git checkout -b feature_g 添加并提交更改 git add . git commit -m “实现图片上传功能” 推送到远程 git push -u origin feature_g...

关于 WASM:1. WASM 基础原理

一、WASM 简介 1.1 WebAssembly 是什么&#xff1f; WebAssembly&#xff08;WASM&#xff09; 是一种能在现代浏览器中高效运行的二进制指令格式&#xff0c;它不是传统的编程语言&#xff0c;而是一种 低级字节码格式&#xff0c;可由高级语言&#xff08;如 C、C、Rust&am…...

3403. 从盒子中找出字典序最大的字符串 I

3403. 从盒子中找出字典序最大的字符串 I 题目链接&#xff1a;3403. 从盒子中找出字典序最大的字符串 I 代码如下&#xff1a; class Solution { public:string answerString(string word, int numFriends) {if (numFriends 1) {return word;}string res;for (int i 0;i &…...

基于matlab策略迭代和值迭代法的动态规划

经典的基于策略迭代和值迭代法的动态规划matlab代码&#xff0c;实现机器人的最优运输 Dynamic-Programming-master/Environment.pdf , 104724 Dynamic-Programming-master/README.md , 506 Dynamic-Programming-master/generalizedPolicyIteration.m , 1970 Dynamic-Programm…...

作为测试我们应该关注redis哪些方面

1、功能测试 数据结构操作&#xff1a;验证字符串、列表、哈希、集合和有序的基本操作是否正确 持久化&#xff1a;测试aof和aof持久化机制&#xff0c;确保数据在开启后正确恢复。 事务&#xff1a;检查事务的原子性和回滚机制。 发布订阅&#xff1a;确保消息正确传递。 2、性…...

Unity UGUI Button事件流程

场景结构 测试代码 public class TestBtn : MonoBehaviour {void Start(){var btn GetComponent<Button>();btn.onClick.AddListener(OnClick);}private void OnClick(){Debug.Log("666");}}当添加事件时 // 实例化一个ButtonClickedEvent的事件 [Formerl…...

Chrome 浏览器前端与客户端双向通信实战

Chrome 前端&#xff08;即页面 JS / Web UI&#xff09;与客户端&#xff08;C 后端&#xff09;的交互机制&#xff0c;是 Chromium 架构中非常核心的一环。下面我将按常见场景&#xff0c;从通道、流程、技术栈几个角度做一套完整的分析&#xff0c;特别适合你这种在分析和改…...