1.4 机器人关键技术
机器人学是专门研究机器人工程的学科,其最基础的研究内容是机器人的路径规划控制与人机交互。人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门系统科学。机器人的研究推动了许多人工智能思想的发展,在人工智能构建世界状态的模型和描述世界状态变化的过程中起到了至关重要的作用。举例来说,关于机器人动作规划生成和规划监督执行等问题的研究,推动了人工智能这一学科中有关机器人规划方法的发展。机器人智能化的发展更是人工智能的研究成果运用的一个重要方面。机器人学与人工智能的发展存在着千丝万缕的关系,可以说二者的发展是休戚与共的。人工智能的主要研究方向有语言识别、图像识别、自然语言处理和专家系统等,这些研究方向对于机器人智能化的实践有着重要的意义。其中,机器翻译、智能控制、专家系统及语言和图像理解不仅是人工智能需要研究的重点,同时也是智能机器人得以实现的科技难点。人工智能实际上是将人的智能赋予其他工具,而机器人则是为这样的智能化提供了一个很好的容器与载体。机器人学的发展主要围绕移动机器人、仿人机器人、人机交互等细分领域的研究展开,其中移动机器人和仿人机器人一直是大多数研究者的主攻方向,近期学者对人工智能关键技术人机交互、路径规划、控制系统和强化学习的研究愈发关注。
1.4.1 感知与学习
对感知与学习的研究是从1990年开始的,Manuela M. Veloso、Minoru Asada、Marco Dorigo、Cynthia Breazeal等学者奠定了该研究的发展基础。目前,后起之秀Darwin G. Caldwell教授积极投入相关领域的研究。智能机器人感知与学习技术是目前机器人领域研究的热点,旨在充分利用人工智能现有的成果,把人工智能的现有成果和机器人有机地结合,从环境感知、知识获取与推理、自主认知和学习等角度开展机器人智能发育的研究,使机器人通过不断的学习和自身积累,能够自我提升。
感知是机器人与人、机器人与环境以及机器人之间进行交互的基础。简单地定义“感知”为对周围动态环境的意识。对感知的研究主要有以下目的:首先是对机器人地图构建功能的补充,对环境的重新构建,以满足实时更新所处位置地理信息的需要;其次是帮助智能机器人对周遭物体进行探测、识别和追踪,以做到能够对日常小型物体近乎完美的区分;最后是使机器人能够观察人类、理解人类行动,最终达到机器人能够与人类友好共存的条件。从以上标准可以看出,感知技术作为不可或缺的一部分,与智能机器人的地图构建、运动等功能实现都息息相关。具体来讲,机器人的感知通常需要借助各种传感器的帮助来代替人类的感觉,如视觉、触觉、听觉以及动感等。
从感知向认知的跨越一度是区分“第二代”机器人与“第三代”机器人的准则,而认知机器人的定义中最核心之处就在于学习行为的出现。作为机器学习和机器人学的交叉领域,机器人的学习将允许机器人通过学习算法获取新技能或适应其环境的技术。通过学习,机器人可能展示的技能包括运动技能、交互技能以及语言技能等;而这种学习既可以通过自主自我探索实现,又可以通过人类老师的指导来实现。随着人工智能的快速发展,机器人学习也是日新月异。其中,美国加州伯克利大学的人工智能团队的研究一直处于前沿。2018年4月,伯克利人工智能研究院发布一篇文章,提出一个强化学习框架,并基于此打造出一款可以自学功夫的虚拟机器人,目前已有相关研究成果。这说明机器人学习技术在未来不仅能够融入人们的现实生活,而且将可能在虚拟游戏世界中大放异彩。
1.4.2 规划与决策
路径规划从1990年开始发展,自2005年起进入发展的高速期,大量的学者以极大的热情投入该领域的研究,主要有Howie Choset、Manuela M. Veloso、Sebastian Thrun等人。其中,Howie Choset教授至今仍致力于路径规划领域的研究,并创造出历史性的成果。而路径规划仅仅是机器人学中规划与决策技术的一个分支。事实上,规划与决策技术对于机器人系统中自主性的实现至关重要。换句话说,这两项要素是决定机器人在无人操控的状态下通过算法得出满足特定约束条件的最优决策能否成功的关键。尽管这类技术最常见的用武之地在于无人驾驶汽车的导航问题以及自主飞行器或航海探测器的线路规划问题,但其实它的影响更为广泛,从路径规划到运动规划,再到任务规划,都离不开这一技术的作用;而这类技术的应用范围也不止探测器或智能汽车,它还可以应用在人形机器人、移动操作平台甚至多机器人系统等,在数字动画角色模拟、人工智能电子游戏、建筑设计、机器人手术以及生物分子研究中都能够发挥作用。具体来说,目前实现规划与决策仍然主要依靠应用算法,其中著名的理论包括人工势场法等。近两年,来自瑞典皇家理工学院的机器人学研究团队提出了新的观点:运用形式化验证将机器人的行为树模型化,由此能够在实现规划和决策的过程中获得两大优势,一是它能够以一种用户友好却谨慎细致的方式捕捉到复杂的机器人任务信息,二是它能够为机器人决策的正确性提供可证实的保证。
1.4.3 动力学与控制
机器人动力学是对机器人结构的力和运动之间关系与平衡进行研究的学科,主要通过分析机器人的动力学特性来建造模型、研究算法以决定机器人对物体的动态响应方式。而机器人控制技术,指的是为使机器人完成各种任务和动作所执行的各种控制手段,既包括各种硬件系统,又包括各种软件系统。
自20世纪70年代以来,随着电子技术与计算机科学的发展,计算机运算能力大大提高而成本不断下降,这就使得人们越来越重视发展各种考虑机器人动力学模型的计算机实时控制方案,以充分发挥出为完成复杂任务而设计得日益精密从而也越加昂贵的机器人机械结构的潜力。因此,在机器人研究中,控制系统的设计已显得越来越重要,成为提高机器人性能的关键因素。
最早的机器人采用顺序控制方式,而随着计算机的发展,现已通过计算机系统来实现机电装置的功能,并采用示教再现的控制方式。目前机器人控制技术的发展越来越智能化,离线编程、任务级语言、多传感器信息融合、智能行为控制等新技术都可以应用到机器人控制中来。作为影响机器人性能的关键部分,机器人控制系统在一定程度上制约着机器人技术的发展。然而传统的机器人控制系统存在结构封闭、功能固定、系统柔性差、可重构性差、缺乏运行时再配置机制、组件的开发和整合限制在某种语言上等问题。如今出现了各种基于网络、PC、人脸识别、实时控制等技术的机器人控制系统,精度高、功能全、稳定性好,并逐渐向标准化、模块化、智能化方向发展。
智能化的控制系统为提高机器人的学习能力奠定了基础。2016年,伯克利大学的人工智能团队利用深度学习和强化学习策略向控制软件提供即时视觉和传感反馈,使一个名为BRETT(Berkeley Robot for the Elimination of Tedious Tasks的缩写)的机器人成功通过学习来提升自己的家务技能。这种人工智能与机器人学交叉运用的结果使得机器人能够将从一个任务中获得的经验推广到另一个任务中,从而提高机器人的学习能力,使其能够掌握更多技能。
1.4.4 人机交互
人机交互即人与机器人相互作用的研究,其研究目的是开发合适的算法并指导机器人设计,以使人与机器人之间更自然、高效地共处。最早开始研究人机交互的出发点是学者们希望能够探讨如何才能减轻人类操纵计算机时的疲劳感,由此开启了人机工程学的先河。1969年可谓是人机界面学发展史的里程碑,这一年在英国剑桥大学召开了第一届人机系统国际大会,同年第一份专业杂志IJMMS(International Journal of Mechatronics and Manufacturing Systems,国际人机研究)创刊。到了20世纪80年代初期,学界先后出版了六本专著,从理论和实践两个方面推动了人机交互的发展。20世纪90年代后期以来,随着高速处理芯片、多媒体技术及互联网的飞速发展与普及,人机交互向着智能化的方向发展,这一技术关注的重点也由计算机的反馈转向以人为中心。值得一提的是,2018年,ACM新增一本杂志Interactions,其主题是人机交互和交互设计,每两个月出版一次,在全球范围内流通,这也说明人机交互技术研究的不断深入,并越来越得到重视。
人机交互技术大致可以分为四个阶段:基本交互、图形交互、语音交互和感应交互(体感交互)。基本交互仍然停留在最原始的状态,人与机器的关系仅仅是人工手动输入与机器输出的交互状态,比如早期的按钮式电话、打字机与键盘;图形交互时期是随着电脑的出现而开始的,以显示屏、鼠标问世为标志,在触屏技术成熟期达到巅峰;语音交互最开始是单向的,即语音识别,如科大讯飞的语音识别系统,后来微软的Cortana、小冰,苹果的Siri以及Google公司的Google Now突破了单向交互的壁垒,实现了人机双向语音对话;最后,随着当前机器人的发展越来越强调交互形式的智能化,体感交互将成为未来交互发展的新方向。体感交互是直接从人姿势的识别来完成人与机器的互动,主要是通过摄像系统模拟建立三维的世界,同时感应出人与设备之间的距离与物体的大小。目前,索尼发明的触控型投影仪已经实现了体感交互。未来,这种交互方式将成为先前各种技术的结合,包括即时动态捕捉、图像识别、语音识别、VR等技术,最终衍生出多样化的交互形式,而机器人有望在未来成为体感交互的载体。