在工业大厅中,手势交互是令人兴奋的新事物。随着微处理器的尺寸、力度、花费的发展,现在存储器、摄像机和其他的感应设备通过擦拭、轻拍、手的姿态、身体移动来控制设备有了可能性。在这里有一个新的交互世界:规则手册和指导方针正在被重写,或者至少,这个可以被断言。并且,新的交互行为甚至有一个市场化的新名字:自然的,例如“自然的用户界面。”
像往常一样,营销修辞早于现实。
基本原则知识中的结果、反馈、一个良好的概念模型仍然占统治地位。图形用户界面(GUI)的力量对它的图形的使用几乎没有作用:它必须和回忆行为有关联,包括在何种行为中可能和回忆有关联和如何借用它们这两方面。可视的图标和可视的菜单是机械的,此外,尽管有关于按比例放大来到现在的复杂系统的要求这个熟悉的问题,它们任然允许人们探究和学习。可见度是重要的GUI设计规则:穿过菜单,所有可能性的行为能被可视的制造,因此,可能性行为能被简单的发现。系统经常通过探索而被掌握。系统应避免受到这些总所周知的方法的影响。
手势界面并非新事物。从很早的时候起,手势已经是界面科学的一部分。Brad Myer在1998年的评论中描述了1960年代的成果,并提醒我们,1992年的苹果牛顿掌上电脑(Apple NewtonPDA)才是第一个商业上展开的电脑辅助设计系统。1980年代早期,Myron Krueger在人工实境的首创工作是第一次在大型的投影图像上介绍了手势交互。从1980年代起,多点触摸系统已经四处使用:Bill Buxton回顾了首次为了人-计算机交互而设计的多点触摸系统提出的日期是在1982年Nimish Mehta的硕士论文答辩时。探测人的位置和移动的专业传感器已经在游戏设计中长期起作用。在乐器的设计中包括多点触摸和手势,并且例如鼓声缓冲和电子吉他这类的电子输入设备,它们延伸了这些音乐交互的模式,变成大量的电子设备。然而乐器中电子化调整手势已经超过了半个世纪的历史:泰勒明电子琴,它是一个手势控制的电子音乐合成器,是由俄罗斯的发明家于1928年的专利。
大多数学习和记忆绝的手势,即不自然,也不简单。只有很少的动作是先天的或容易快速预先处理和方便学习的。当与文化混合时,即使是简单的摇头动作也容易产生混淆。那些旅游去印度的西方人就经历了理解印度人摇头是十分困难的,首先出现的姿势是好像是斜着的混合动作,看上去不知该如何理解,因为西方点头代表“肯定”,摇头代表“否定”。相似的,表示你好、再见和“过来”的挥手姿势在不同的文化中也有不同的表现。想了解世界通用的手势范围的一个部分列表,可以在维基百科中查阅“手势”和“手势列表”。
更重要的是,手势被认为对成功的人机交互缺乏必要的关键线索。因为手势只是短暂的,它们不能遗留下它们路径的记录,这意味着某人如果制造了一个手势,然后没有获得任何回应或者没有获得错误的回应,这里就几乎没有告诉他这样的原因的可用信息。必要的反馈是缺乏的。不仅如此,一个纯粹的手势系统使发现执行可能性的设置和精确的力度十分困难。当然,这些困难能被克服,但是只能通过增加通用的界面组件,例如菜单、帮助系统、追踪、教程、撤销选择和其它的反馈和导航的形式。
手势是一个强有力的交互模式吗?是的,我毫不怀疑手势交互将会在所有的交互系统中找到一个合适的位置。现在的系统和那些已经发展了超过50年的系统两者的主要的区别是随着技术的强有力的上升,传感器和加工的技术越来越廉价,所以配置这些系统和大量的成品项目实质上很便宜。我们已经准备好看见这些技术使用中的巨大的进步。手势将变得标准化,也许是通过一个正式标准身体或通过简单的惯例—例如,快速来回打击是为了指示删去,或双手向上移动,表示更多(声音,动作,振幅等)。摇动一个设备是开始意味着“提供另一个选择”。一只手指水平擦拭的动作意味着去另一个页面。收缩或者放大两只手指间的位置真的能缩小或放大一张显示的图片,许多这些类似的功能已经存在于手势系统的最初发展中。既然手势已经包含了GUI(图形用户界面)发展的经验总结,因此,向下拖拽两个手指是为了让屏幕图片往上移动,保持GUI习惯的隐喻是移动一个取景器,而非移动单元自己。
新的惯例将会被发展。因此,加上“动力”后,它很容易的实现通过手指的轻打应该造成图片的移动,使在轻打这个动作不太明显的中断后,图片动作继续。(最近一些手机已经忽略这方面的设计,而更多的去针对用户的困难和这些能迅速的指出了缺点和问题的评审员的兴致。)动量必须与粘滞摩擦结合在一起,我应该增加这些考量,所以运动不只是由一个轻打速度统治,还应该考虑之后的移动和扩展,但是它也会渐渐平滑的停止下来。使用这些参数来调整设计现在还是一门艺术,它必须转化成一门科学。
再强调一次,点击与动量的观念已经十分老旧了。我第一次看见这个点击手势与动量(虽然那个词并没有使用)在工作中完成是苹果公司的Joy Mountford的人机团队在1980年代的晚期到1990年代的早期的发展成果。
手势的时机和力度无疑是许多学位论文和会议论文的主题。即使今天,不同的族群也有不同的习惯。当点击遇到窗口的边缘,或者封闭屏幕的边缘时,点击对象该怎么做?如果遇上有很多屏幕呢?如果几个人共同的合作一个任务,但是每一个人都用着不同的电脑,一个点击对象该如何从一个电脑到另一个电脑移动呢?还有,假如这样的话,发送者如何自己也能保留一个副本?(注意那些系统已经面对的-并且创造的答案-为这些已经存在了一段时间的问题。)
手势开发者面临的问题使我想起了早期GUI发展时出现的相同问题。因此,在施乐PARC系统早期发展之中,当某人移动一个文件的图标穿过屏幕去一个文件夹,它是自然的,进入文件夹后图标将会消失。同样的,当一个文件被移进垃圾桶,它也是自然的,图标和文件在视线中消失了。但是这个行为规则使打印机陷入麻烦之中:移动文件至打印机的图片让这个项目被打印出来,但是它也导致了文件从屏幕上消失。在这个情况后发生了许多再思考。同样的,现在也需要更多的再思考。
移动某东西进入打印机的适当的行为是十分明显的:对象应该呆在视图中。如果移动去一个外部存储设备或另一个电脑会怎样?在今日,文件同样保留在家庭电脑中。依赖于自然目的地的最终结果的不同之处是一些频繁混淆的来源。什么手势标志着复制而不是移动?
一些系统正在尝试发展一套手势语言,有时候接触点的数目作为一个关于移动范围的元信号。一个单独的手指姿势意味着一件事情,相同的姿势被两只手指做出时意味着其他的事情,三只和四只手指也是同样的规律。但是注意关于现有的类似方式的失败,即试图使用鼠标多样化点击的失败。一个独立的鼠标击打点、一个双重鼠标点击选择一个单词、一个三次连击选择一个段落。但是如果每一个额外的点击会在等级制度中向前移动一个级别,点击三次难道不是应该是选择句子?既然早期的施乐恒星电脑开发者花费了值得考虑的努力和时间去发展一个系统点击语言,即使他们的一些努力保留了下来,但是更多的则是失败了。
身体的姿势有其他的作用。通过他们的可能性能参与整个身体,他们能加强参与者的参与性和快乐。它们甚至能被用作锻炼的器械。但是它们也能做出损害。
当任天堂wii游戏机介绍的它的保龄球游戏时,“自然的”界面是摆动手臂,好像握住一个球,然后,当使用者的手臂接触到球能松开的点,为了释放控制手柄转换的手持压力。释放转换上的压力也是类似从手上放开球并且它能非常容易的学习和使用。在游戏最激烈的时候,游戏者将也会在空中飞行控制手柄上释放他们的手上压力,有时候,在足够的击打力量时,能打破在显示保龄球道的电视屏幕。任天堂发布关于务必扣上腕带的警告,但是当这个警告不起作用时,它重新设计了腕带。问题还是残留了。(这当然是加固了另一个设计声明:发生适当的行为是通过仔细的设计,而不是通过介绍菜单和警告。)它对自然的手势能产生益处吗?最起码在这个个案中是没有的。手势的习惯在这里太自然了。它导致了一个不被期待的,不幸的影响,这些影响很难克服。
那些完全依靠手势系统的用户倾向于回应他们不需要一个控制手柄,这样就不会有物理对象被损坏。的确,但是使用怎样的手势才能在放开球的时候得到松开的信号呢?它也不像能被身体动作语言控制的独立复杂的系统,因为微妙的动作实在太复杂了,所以很难被动作控制—它犹如组成的我们口头语言的独立动词。我们需要明确的范围,时间顺序的方式,以及有条件的依赖关系。结果,最为复杂的手势系统也要提供开关,手持设备,手套,口语命令语言,甚至是对良好的老式键盘添加更多的有特异性和精确的命令。
手势系统与其他交互行为方式相比并没与众不同。它们也需要遵循交互设计的基本规则,这就意味着清晰的表达模式,一个和系统交互明确的概念模型,它们的结果,并且意味着导航无意识的影响。结果,意味着提供反馈,明确的提示可能采取的行动,并且指明引导是被需要的。因为手势是不受约束的,它们倾向于带有歧义或者不间断方式的表现。在这种情况下,建设性的反馈是必须的,从而允许人们学习合适的表达方式并理解他们行为中什么是错的。与所有的系统一样,在无意识行为或手势的解释创造了不受欢迎的情况中,一些撤销的机制将被要求存在。还有,因为手势是一个自然的、自动的行为,系统必须要调整好对不被期待动作输入时,避免产生错误回应。解决这个问题也许导致更多意外的失误,动作意图被解释,但是没有解释。这些情况与键盘、触摸板、笔或者鼠标的行为都不相同。
我想得出什么结论?手势将对我们所有的交互技术是一个有价值的补充。但是它们同样需要时间得到更好的发展,使我们了解它们能发展到多么好,了解发展在不同的系统中相同的手势意味着相同的事物这样的标准惯例。并且我们需要发展支持的基础设施来帮控制导航,反馈、纠错、还有其他的手势结果,也许一些结果是众所周知的,一些结果将会是新奇的。
手势和触摸系统已经被很好的接受了,我经常看见人们向系统制造手势,虽然并不了解它们:轻拍没有触摸感应的屏幕,缩小或者放大手指间距离,还有在屏幕上划过手指穿过不支持这些行为的系统,在那种情况下,在接收器前挥动手臂 使用老式的控件,没有传感器,来消除水。
手势系统的确是一个更全面,人与科技的未来人机交互的重要途径之一。在许多例子中,它们将会加强我们的控制,我们控制的感觉和授权,我们的便利,乃至我们的快乐。但是就像所有的科技一样,基于手势的系统将会有很多花费。不同的系统将会设计不同的管理。这里将会变成一个学习曲线。残疾的人们将得到满足。并且届时将会成为一个全新的喜剧演员素材新来源。想象当一个关于整个系统是由许多的手势组成的问题,所有的手势都有一定的含义,但是并不是所有接近设备的人都知道这个规矩。我回想起那些老的喜剧电影,正装的人们在表演无声的命令。一个人打喷嚏并且因此购买了一幅不需要的绘画。一对夫妇抱怨,当他们彼此挥手时,挥动的手被看作为不断升级的出价。
我们的系统控制通过忽略常见的机械开关、键盘、和鼠标交互对我们的军火库是一个受欢迎的添加。无论它是讲话、手势、或者拍打身体的电子信号从而“思想控制”都有着优化我们的交互的巨大潜力,尤其是传统的方式不合适或者不方便的时候。但是它们并不是一个万能药。它们与新问题、新挑战、巨大错误和混乱的可能性一起产生,正如它们也产生巨大的价值和潜能。
所有的新科技都有合适它们的地方。我们去确认所有的新技术中最好的交互方式和能移去可能混乱的标准化能将会需要一段时间。与其他相比这些系统中没有一个拥有更多固定的自然元素。鼠标和键盘并非自然产物。随着时间的推移,演说体系将不得不被学习,手势将发展的更仔细和标准化。这些标准不一定要成为一切最好的可能性。现在遍及世界的键盘在QWERT和Yazerty键盘这两种至键盘之上已经变得标准化,即使两者都不是最佳的—但标准比最佳更重要。
自然的用户界面是遵循自然的吗?不,但是它们将会变得有效。
关于作者
Don Norman身上有许多荣誉,包括尼尔森诺曼公司的共同创办人,西北大学的教授,韩国科学技术院(南韩)的客座教授,还有作家。他最新的书,《与复杂一起生活》将会作为这本杂志上一系列文章的合集来发表。他活跃在jnd.org.网站上。
{旁注}
[1] Ballmer, S. "CES 2010: 一个转化趋势 – 自然的用户界面。" 赫芬顿邮报, 2010年一月
12日, 来自
http://www.huffingtonpost.com/steve-ballmer/ces-2010-a-transforming-t_b_416598.html
[2] Buxton, B. "我已知和喜爱的多点触摸系统," 来自
http://www.billbuxton.com/multitouchOverview.html
[3] Krueger, M.W. 人工现实. 阅读, 麻省.: Addison-Wesley, 1983.
[4] Myers, B.A. "人机交互技术的简史." Interactions 5, 2 (1998)44-54.
http://www.cs.cmu.edu/~amulet/papers/uihistory.tr.html
为美国计算机协会交互杂志写的专栏。这是作家的工作版本。它被投递到这里是获得美国计算机协会的个人使用许可。它也许只能非商业性使用,这段文字需要被保留。最终版本将会发表在交互杂志上。
翻译:upa编辑小组-胖西
链接:http://jnd.org/dn.mss/natural_user_interfaces_are_not_natural.html