1.2.4 机器人和多智能体系统
机器人通常被认为是物理智能体,通过操纵物理世界执行动作来完成任务。通过适当的物理网络接口,机器人在某些情况下可以成为软件智能体。一般来说,机器人有以下硬件。
●传感器:传感器是机器人与环境之间的感知接口。被动传感器捕捉环境中各种信号源(如摄像机和温度计)产生的真实信号。主动传感器则向环境中发送探测信号,通过对反射信号的分析来捕获环境信息,如雷达、激光雷达(light detection and ranging,lidar)、声呐等。基于距离感知的位置传感器是另一类传感器,如全球定位系统(Global Position System,GPS)接收器。最后一类传感器是本体感受传感器,它向机器人提供有关其运动的信息(例如里程计,用来测量运行里程),像惯性传感器一样补充GPS的功能。
●执行器或效应器:执行器为机器人提供对环境做出反应的手段。特别是,效应器允许机器人移动或改变其形状,这可以通过自由度的概念来理解。6轴机器人手臂如图1.9所示。
●板载计算:机器人配备了计算核心,根据传感器收集到的信息执行动作。这种板载计算有助于实现人工智能的功能。
●通信/网络设备:目前的机器人通常有有限的通信功能,如从传感器收集数据的无线通信。智能体之间的通信和联网还处于初级阶段[1]。
图1.9 6轴机械臂,https://robotics.stackexchange.com/questions/12213/6-axis-robot-arm-with-non-perpendicular-axes
由于环境的真实状态可能无法被直接观测到,板载计算的主要任务是根据当前的信念状态和新的观测结果递归地更新(或估计)其信念状态,从而执行适当的动作。设Xt为t时刻环境的状态(向量),Zt为t时刻获得的观测(向量),At为获得Zt后采取的动作。信念状态的更新可以通过下式来实现:
P(Xt|z1:t+1,a1:t)=αP(zt+1|Xt+1)(Xt+1|xt,at)P(xt|z1:t,a1:t-1) (1.4)
这意味着状态变量X在t+1时刻的后验概率是根据前一时刻的相应估计(即预测)递归计算得到的。概率P(Xt|z1:t+1,a1:t)称为机器人的转移模型或运动模型,P(zt+1|Xt+1)表示传感器模型。
智能机器人的一个很好的例子是一辆由各种传感器(如激光雷达、雷达、摄像头)、效应器和车载电源计算组成的自动驾驶汽车,如图1.10所示。
图1.10 自动驾驶汽车的装备
来源:纽约时报
练习:查普曼(Chapman)打算设计一种能对人类语言指令做出反应的机器狗,这些指令包括坐、立、左、右、走、停、后退。你能为这样的机器狗设计硬件和软件架构吗?
到目前为止,我们只考虑了单个智能体。然而,一个系统可能涉及多个相互作用的智能体,称为多智能体系统(Multi-Agent System,MAS)。例如,街道上的许多自动驾驶汽车、智能工厂装配线上的机器人,或者会下棋的智能体。这些智能体的角色可以是互动的、协作的或竞争的。智能体之间可能存在通信,特别是理性的智能体。网络MAS将为本书后面的章节提供一个新的探索领域。
[1] 见本章参考文献[1]。