这可能是2018年最全面的AR操作系统设计指南

首页 > 新酷 > 可穿戴 > 本文
2018年07月05日 14:31 | 维科网 esense
AR是下一代人机交互平台,为了实现更加自然的交互方式,AR操作系统会是重要的一环。那么,为AR而构建的操作系统,它将会是什么样子?......

关注亮风台的朋友们,一定对AR眼镜不陌生,但仔细想想,是不是对AR眼镜的操作系统和核心用户界面没什么特别的印象?可能你印象中的它们都是碎片式的,一个界面,一个按钮,似乎摘下眼镜就完全失去了印象。是的,没有真正意义上的规则、权衡和能力将定义这种即时的用户体验。

亮风台认为,AR是下一代人机交互平台,为了实现更加自然的交互方式,AR操作系统会是重要的一环。那么,为AR而构建的操作系统,它将会是什么样子?哪些潜在的概念和考量将影响用户的体验?对开发人员有什么规则和限制?

我们如何更接近下一个AR操作系统?

不妨先对未来做一些假设:

AR眼镜制造商想要的是一种可以扩展功能的操作系统

HMDs的AR操作系统应该是原生的,而不同于我们熟悉的移动端系统,目前的操作系统并不能让AR的价值完全被发挥。

下一个AR操作系统应该有能力跨越从短期使用到佩戴一整天的鸿沟。例如微软的Holo UI,它似乎比其他UI更向前迈了半步,但是“以任务为中心的方法”,似乎并不能完美阐述“第一次的AR用户体验”。

AR眼镜具有运动、位置和物体的感知能力

AR眼镜应该支持位置跟踪,需要传感器来识别用户的环境和3D物体。人工智能将提供环境信息和分类。Web服务将用于识别平面图像、3D环境和大型数据库中的对象。

谷歌VPS支持识别预先扫描的环境,并确定精确的位置

AR眼镜的用例将随着时间的推移而发展和扩展

一开始,AR眼镜仅仅被用于单一的任务,比如在工厂进行培训或设备监控。虽然由于舒适度、体积和电池的限制,佩戴时间很短,但是随着软硬件的发展解决了更多的问题,使用时间将会增加。

从2023年到203X年的进展将会时断时续,依赖于硬件的突破

应用程序和标签

运行在AR操作系统上的软件可以分为两大类:应用程序和标签。

应用程序类似于我们熟悉的PC和移动应用程序,它们由用户启动,并且可以定位(尽管是在3D空间),支持多任务切换,并且将一直保持开启状态直到被关闭。

示例:给工人工作参考的应用程序,可以打开并放置在正在处理的对象旁边。

标签更像是自动的应用程序,它们不断地寻找特定的环境或对象,它们可以为其赋予增强的信息,甚至通过可视化来改变世界。

示例:一个建筑物管理器启用一个标记,当它们进入一个房间时,它会高亮显示任何有报告错误的设备。

任务:应用程序

直到今天,移动操作系统中的基本概念还是90年代个人电脑和非智能手机操作系统的延续:专注于单个任务的应用程序从桌面或主屏幕上启动,然后接受输入,直到关闭或暂停。

可惜,这种以任务为中心的模型不适用于AR眼镜。当你拿起手机时,你已经决定了你想要执行的任务。手机操作系统只需要关心它自己的显示,并尽快让你完成正确的任务。

然而,AR UI是持续可见的,与用户正在执行的实际物理任务共享同一个空间:例如在切菜的时候,如果在你的眼前漂浮着一排图标,那么这就是一种糟糕的体验。

AR操作系统的“主屏幕”是基于环境,它需要积极地与世界互动,而不是等待用户选择一个单一的任务。

大多数设备上的体验都不是作为独立的任务来完成整个展示,而是作为应用程序或标签显示在周围:例如视频在墙上播放,菜谱在厨房台面上显示下一步的准备工作,恒温器在门边盘旋等。

我们与环境的关系会影响思维方式,相对于设计2D界面而言,组织物理世界可能与AR的相关性更大一些。当然,我们目前熟悉的以任务为中心的应用程序也会存在,但它们不是AR操作系统的默认状态,相反,它们将是用户输入的特殊状态。AR操作系统的默认模式就像在一个光线充足的客厅,所有可能的任务都是可见的,但不需要注意。一个专注于任务的应用就像关掉灯去看电影,这是一种暂时的情况,可以减少分心。

全环境、以任务为中心的导航应用程序(The Division)

环境:标签

AR能够自然地捕捉我们所处环境中的任务和信息。但是目前,这一功能被锁定在移动操作系统的限制之下。移动AR面临的最大挑战是需要借助特定的App,用户可能愿意为一次简短的品牌体验而下载App,但作为日常生活的一部分,它根本无法扩展。

如何“发现”AR,对于在移动设备和AR操作系统中面向任务的AR应用来说,也是一个大问题。用户需要在现实世界中得到提示(“嘿,下载我们的应用并扫描这个!”),商家通过市场营销的方式才能让用户意识到在某个地点或某个物体上存在AR体验。


标签会被自动放置在环境中,而不需要用户识别它们在特定的位置是有用的并启动它们,例如植物的名字标签,食物中的卡路里计数,或者历史兴趣点。

标记了可能的交互或信息标签的电子游戏(Deus Ex:Human Resolution)

有用的标签可能包括:

使用标签删除周围的广告

建立维护标签,显示所有安装设备的年限和最后的认证日期。

AR美颜,美妆,佩戴。

货品快卖光的时候,显示“订购更多”标签。

在默认情况下,这些标签在AR操作系统中被启用,基于位置的标签可以自动显示来自位置所有者的内容。例如我们之前提到过的AR博物馆,gg以及基于地理信息的AR导航等等。

基于环境的增强,包括了拥有额外的信息、交互和美学层,而这在架构和用户体验方面基本上是一个未知的领域,因为它只有通过AR才能实现。

管理资源:注意力和空间

手机屏幕的局限性迫使人们从窗口式的多任务界面后退一步,转向单一任务。

虽然在移动设备上进行多任务处理是可能的,但至今仍然很尴尬,因为这是由于硬件的限制而做出的让步。

AR尽管有能力在任何地方以显示信息,但仍然会受到严格的限制。然而,这次的让步主要是针对用户而不是硬件,用户有感知/心理上的限制,比如注意力和空间理解,过多的信息很容易被淹没,并且导致用户的沮丧和不适。

AR操作系统需要管理用户的资源,就像管理设备本身的资源一样,这需要一些非常谨慎的、有同理心的用户体验设计。注意力需要被当作一种有限的资源来管理,并与现实世界的需求相平衡。物理空间也需要被仔细管理,以确保AR操作系统总是易于理解的。

注意力

目前的移动操作系统有这样一个假设:当如果用户看屏幕的时候,将大部分注意力放在正在呈现的任务上。如果用户希望转移注意力,只要把目光移即可。

然而,在AR中,“Display”由用户可以看到的所有内容组成,因此无法做出相同的假设。

如果你在一个用户空间里填满了旋转的信息,当他们试图做另一个非AR的任务时,会变得心烦和沮丧。用户对世界的关注是有限的,因此,一个AR操作系统必须将注意力作为一种资源来管理。它的目标是只提供用户在需要的信息,尽可能减少精神负担。

那么,我们如何管理用户的注意力呢?下面的一些规则可能会有借鉴意义。

A.强度:

快速或持续的动作会让人分心,特别是当它们朝向用户或视线的边缘时。

在一臂长的距离内的有更大的物体存在。

明亮或饱和的颜色自然会吸引更多的注意力。

比例大的物体将会吸引更多的注意力。

B.复杂性:

在同一空间中重叠的对象需要更多的脑力劳动来理解。

复杂的形状需要更多的注意力来理解,比如高度详细的图标或接口。

另外,由于我们处理的是用户的视觉皮层而不仅仅是显示,所以AR UI比传统的UI设计要复杂得多。举个例子,设计师们需要避免让他们的受到惊吓:

在附近的周边视觉上突然的,小规模的运动将会吓到用户,因为我们已经进化到条件反射性地认为有一个生物需要我们的注意来判断它是否危险。

类似地,任何突然的大规模运动也可能吓到用户。

C. 注意力和标签

当用户专注于单个活动时,注意力很容易管理,因为用户已经启动了一个任务,我们可以假定用户已经在给予关注,而任务导向软件的创建者可以在这个基础上设计。对于AR操作系统,为了避免分心和烦恼,UI的目标应该是在尽可能少关注下,同时还能传递所需的信息。

标签所提供的信息应该是暂时的,但以后可以恢复。例如,在识别一道菜时,卡路里计数标签可能只能在一段时间内进入一个有限的空间,以显示计数。我们可能需要一个通知系统来管理这些事件,并巧妙地提示用户。

D.空间

由于太多的AR是环境相关的,所以许多用例依赖于在被引用的对象旁边显示的信息,因此活动需要能够请求特定的空间容量。为了避免AR内容重叠,AR操作系统需要具备管理访问能力,例如活动类型、请求的总量、请求的锚点、任务优先级和当前环境等细节都需要在分配空间时被操作系统考虑。

E. 信任

用户希望在隐私问题上拥有自主权,需要了解第三方可以获得多少数据。信任将会是一个巨大的因素,在一个设备中有摄像头、麦克风和其他传感器,这些传感器需要在一天中持续佩戴。

信任的问题也延伸到用户周围的其他人。

尽管我们随身携带并不断使用的智能手机上也有相机和麦克风,但是AR眼镜与智能手机有所不同,头戴式的本质更加个人化,任何入侵都将是非常令人不安的,需要比智能手机更严格地限制传感器的使用,以赢得任何信任。

F. 环境

操作系统应该有意识地去感知用户正在做的事情,并适当地转换信息的显示。例如,当你与某人真诚地交谈时,在你的视野中有卡路里计数、歌曲名和收到的电子邮件提醒是一种糟糕的体验。

目前的移动设备预先设置了改变通知、铃声音量和振动设置。然而,这些需要手动设置,用户需要根据自己的位置和动作不断地更改设置,这是十分不合理的。

操作系统应该感知到用户的焦点,假设用户的焦点是与他们交谈的人,则通知需要被关闭,这该怎么做到呢?

幸运的是,机器学习可能是一个“足够好”的解决方案。

一系列的人工智能模型,包括人脸识别、运动检测、位置标签和对象分类,可以作为环境相关的模型输入,以确定用户是否参与了对话。例如,面部识别模型报告在用户面前有一张脸,动作模型报告用户最有可能坐着,音频模型报告一个真实的(非视频)的对话正在发生,位置模型报告环境就像一个办公室,对象分类器识别钢笔,文件和会议桌。

从这些提示中,我们可以合理地假设用户正在开会,或者至少在工作场所进行讨论,并且不希望分心,除非它有一定的重要性。

例如工作、吃、购物、回家放松、锻炼、睡觉、社交、洗浴、通勤等,这些环境都有来自用户的不同期望:

专注与探索:用户专注于一项任务的程度,以及他们对额外信息和可能性的接受程度。

隐私:在这种情况下,对隐私的合理期望。设备是否应该设置自己的静音模式,或者提示用户设置它。

导航:操作系统是否应该对用户敏感,在传输过程中需要查看和导航。

社交:用户是否与他人互动,以及这些互动是否不应被打断。

静音模式:当环境系统出现故障时,用户想要不受干扰时,他们可以启用“静音模式”。这将完全禁用摄像头、位置传感器和显示,直到用户恢复它们。

目前看来这并不是一个问题,因为用户会戴上AR眼镜来完成他们喜欢的特定任务,但未来一旦用户全天戴着AR眼镜,这些就会变得很重要,因为要对环境进行敏感处理,而传感器状态也能清晰地传达给用户和其他人。

总结

这篇文章并不是未来AR操作系统的畅想,而更多的是理性的思考。但这也预示了,在AR眼镜普及大众的那一天起,我们需要考虑的事情可能比现在还要多的多。