欠驅(qū)動(dòng)兩關(guān)節(jié)平面機(jī)械手的控制
李明軍,馬保離
北京航空航天大學(xué)第七教研室,北京100191)
摘 要:欠驅(qū)動(dòng)平面機(jī)械手是帶有非完整約束的高度非線性系統(tǒng),對(duì)其進(jìn)行有效的控制仍然是個(gè)難點(diǎn)熱點(diǎn)問題針對(duì)****代表性的兩關(guān)節(jié)情形,給出了欠驅(qū)動(dòng)兩關(guān)節(jié)平面機(jī)械手的
動(dòng)力學(xué)方程,據(jù)此分析了該系統(tǒng)的可積性、線性化、穩(wěn)定性、可控性和可反饋鎮(zhèn)疋性。根據(jù)控制目標(biāo)的不同,將控制任務(wù)分為鎮(zhèn)定到流形、鎮(zhèn)定到單個(gè)平衡點(diǎn)和跟蹤時(shí)變信號(hào)3種,,針對(duì)這3種控制任務(wù),分別回顧了各種已有的控制方式,仔細(xì)分析了,它們的優(yōu)點(diǎn)和有待改進(jìn)的地方一最后探索了欠驅(qū)動(dòng)平面機(jī)械手的研究中需要解決的幾個(gè)關(guān)鍵問題,指出未來(lái)的可能研究方向.
關(guān)鍵詞:欠驅(qū)動(dòng)系統(tǒng);兩關(guān)節(jié)平面機(jī)械手;可積性;穩(wěn)定性;可控性
中國(guó)分類號(hào):TP 27 文獻(xiàn)標(biāo)識(shí)碼:A
Control of an Underactuated Planar 2R Manipulator
L/Ming-jun,VIA Bao-li
(The Seventh Reseawh Division,Beihang University,Beijing 100083,China)
Abstract:The control pmblem of the underaetnated planar manipulator with high nonlinearity an d nonholonom)are introduced’Fhe dy-namlcal model of the typical esse with two joints is presented The integrability,linearization,stability,controllability an d feedback sta-bilization ofthe model are analyzed.According to the control objectives,the control task is derided into three types:stabilizing to the manifold,stabilizaing to a single equilibrium an d tracking the time-variant signals Control schemes of these tasks are reviewed,an d the advantages an d the disadvantages of these schemes are analyzed .Finally,some key problems for control of underactuated planar manip-ulators ale proposed,an d the further possible resealch directions are pointed out
Key words:underaetuated systems;planar 2R manipulator;integrability;stability;controllability
1引言
欠驅(qū)動(dòng)系統(tǒng)是指控制輸入個(gè)數(shù)少于廣義坐標(biāo)個(gè)數(shù)的系統(tǒng),一般都具有一階或二階非完整性[1]、不能完全反饋線性化等復(fù)雜特性,使得傳統(tǒng)的非線性控制技術(shù)如反步法[2]、高低增益法[3]、滑?刂[4]等直接或間接失效,目前尚無(wú)成熟的帶有普遍性的控制方案,因此,欠驅(qū)動(dòng)系統(tǒng)的控制問題仍然是一個(gè)開放性問題[5]。
欠驅(qū)動(dòng)兩關(guān)節(jié)(簡(jiǎn)稱2R)平面機(jī)械手是結(jié)構(gòu)簡(jiǎn)單的欠驅(qū)動(dòng)機(jī)械系統(tǒng),它體現(xiàn)了欠驅(qū)動(dòng)系統(tǒng)的多數(shù)典型特征,如二階非完整性、線性近似系統(tǒng)的不可控性、漂移項(xiàng)帶來(lái)的復(fù)雜性等[6]。因此,對(duì)這個(gè)結(jié)構(gòu)簡(jiǎn)單、特性復(fù)雜的系統(tǒng)進(jìn)行的研究,是研究更復(fù)雜的欠驅(qū)動(dòng)系統(tǒng)的基礎(chǔ)。大約從20世紀(jì)90年代開始,國(guó)內(nèi)外學(xué)者對(duì)該系統(tǒng)進(jìn)行了較深的研究,提出了多種控制方案,取得了較好的效果。本文對(duì)欠驅(qū)動(dòng)兩關(guān)節(jié)平面機(jī)械手的研究成果做一個(gè)綜述,分析現(xiàn)有控制方案的優(yōu)缺點(diǎn),指出今后的研究方向。
2)研究對(duì)象及其特性
1)數(shù)學(xué)模型研究對(duì)象是兩關(guān)節(jié)平面機(jī)械手,關(guān)節(jié)1有驅(qū)動(dòng)電機(jī),關(guān)節(jié)2沒有,如圖1所示。
 根據(jù)拉格朗日方程,選擇狀態(tài)變量x=[q 1 q 2 q 1 q 2] T,進(jìn)行化簡(jiǎn),容易得到如下動(dòng)力學(xué)方程:
 式中,A是結(jié)構(gòu)常數(shù)。
2)可積性式(1)的欠驅(qū)動(dòng)約束為
根據(jù)文獻(xiàn)[7]的結(jié)論,式(2)是一次不可積的(從而也是二次不可積的),故式(2)是二階非完整約束。二階非完整約束不能降低位形空間的維數(shù)和狀態(tài)空間的維數(shù),這使得基于對(duì)稱性的約簡(jiǎn)理論[8]失效。
3)線性化分析令x=0,則得到平衡點(diǎn)集合:
這是連續(xù)的平衡點(diǎn)集合,要比孤立的平衡點(diǎn)更難以控制。
式(1)在平衡點(diǎn)處的線性化系統(tǒng)處于臨界穩(wěn)定狀態(tài),因此不能通過線性狀態(tài)反饋實(shí)現(xiàn)漸近穩(wěn)定;旦可控性矩陣的秩總是2,總是有2個(gè)不可控模態(tài)。需要注意的是,文獻(xiàn)[9]指出,如果系統(tǒng)含有重力項(xiàng),則在任何平衡點(diǎn)處的線性化系統(tǒng)都是可控的。
4)穩(wěn)定性式(1)沒有考慮摩擦力的影響,在沒有外界控制作用下,將保持能量守恒和角動(dòng)量守恒,處于臨界穩(wěn)定狀態(tài)。
在已有的文獻(xiàn)中,經(jīng)常使用的開環(huán)控制一般不涉及到穩(wěn)定性,而閉環(huán)控制及萁穩(wěn)定性討論可見“控制策略”一節(jié)。
5)可控性針 對(duì)可控性,已有文獻(xiàn)所研究的大多數(shù)欠驅(qū)動(dòng)系統(tǒng)都不含有漂移項(xiàng)[10],而式(1)含有漂移項(xiàng):對(duì)于無(wú)漂系統(tǒng),可達(dá)性一般意味著可控性,而可達(dá)性可用李括號(hào)秩條件來(lái)驗(yàn)證[2]。而漂移項(xiàng)的存在,使得可達(dá)性不再意味著可控性,需要用更復(fù)雜的工具才能驗(yàn)證是否具有可控性。
文獻(xiàn)[11]提出了小時(shí)間局部可控性(sTLc: Small-Time Local C0ntrollability)的概念,并給出了有漂系統(tǒng)具有sTLc的充分條件。具有sTLc的系統(tǒng)具有局部可達(dá)性,但是對(duì)于有漂系統(tǒng)而言,可達(dá)性不意味著可控性。文獻(xiàn)[6]證明了式(1)不滿足sTLc的充分條件。文獻(xiàn)[12]更進(jìn)一步,說(shuō)明除若干點(diǎn)外,式(1)都不具有sTLc.文獻(xiàn)[12]還提出小時(shí)間局部輸出可控性(sTLOc:small-Time Local Output confrnllability)的概念,說(shuō)明除一些特殊點(diǎn)外,系統(tǒng)(1)處處具有sTLOc。
據(jù)筆者所知,目前還沒有文獻(xiàn)給出式(1)的可控性證明方法,但是文獻(xiàn)[13]給出了欠驅(qū)動(dòng)3R平面機(jī)械手的可控性證明,文獻(xiàn)[14]進(jìn)一步指出,只要第一關(guān)節(jié)含驅(qū)動(dòng)電機(jī),那么含有n≥3個(gè)轉(zhuǎn)動(dòng)關(guān)節(jié)的水平機(jī)械手都具有sTLc。從這個(gè)角度來(lái)看,欠驅(qū)動(dòng)2R平面機(jī)械手比欠驅(qū)動(dòng)3R平面機(jī)械手的難度要大,文獻(xiàn)[15]從另一個(gè)角度證實(shí)了這個(gè)觀點(diǎn).
6)反饋鎮(zhèn)定式(1)不能通過線性反饋來(lái)實(shí)現(xiàn)鎮(zhèn)定,但仍可通過非線性反饋來(lái)實(shí)現(xiàn)鎮(zhèn)定。文獻(xiàn) [7]根據(jù)文獻(xiàn)[16]關(guān)于一般非線性系統(tǒng)存在定常光滑反饋鎮(zhèn)定律的必要條件,證明了式(1)在單個(gè)平衡點(diǎn)處不存在定常光滑反饋鎮(zhèn)定律。
實(shí)際上,很多非線性系統(tǒng)都不存在定常光滑反饋鎮(zhèn)定律,但是可以使用開環(huán)控制[6]、時(shí)變反饋控制[17]、離散控制[18]和非光滑反饋鎮(zhèn)定律[19]。
對(duì)于不存在定常光滑反饋鎮(zhèn)定律的系統(tǒng),可以提出其他的控制目標(biāo),如鎮(zhèn)定到平衡點(diǎn)流形(mani—folds 0f equilmrium points)E或某些軌線上[19]。
3控制策略
由上文可知,系統(tǒng)(1)是一個(gè)很難控制的系統(tǒng),原因還在于該系統(tǒng)在某些情況下具有混沌行為[20]。
對(duì)系統(tǒng)(1),從控制目標(biāo)來(lái)說(shuō),可以分為如下幾類:
①鎮(zhèn)定到流形,包括平衡點(diǎn)流形[7]和普通流形[21-22]。
②鎮(zhèn)定到單個(gè)平衡點(diǎn)[6,18,20]。
③跟蹤時(shí)變信號(hào),就筆者所知,這類問題還未
見報(bào)道。
從控制策略來(lái)說(shuō),有連續(xù)控制、離散控制、模糊控制、切換控制、混雜控制等。由于式(1)的控制問題仍然是一個(gè)開放性問題,因此難以就其控制策略給出一個(gè)清晰的歸類;在上面所列的幾種控制策略中,除了切換控制、混雜控制是將桿1和桿2交替地鎮(zhèn)定到目標(biāo)位置外,前面3種方法大多采用了“兩步走”的策略,即先控制好桿I并使之不動(dòng),然后控制好桿2[6,20,21,22],或反之[23]。目前仍難同時(shí)控制好桿1和桿2。
當(dāng)然,也有研究人員試圖對(duì)式(1)進(jìn)行簡(jiǎn)化,如在關(guān)節(jié)2處添加制動(dòng)器[11],或是將關(guān)節(jié)2處的摩擦力考慮進(jìn)來(lái)[21,23]。
1)鎮(zhèn)定到流形
①鎮(zhèn)定到平衡點(diǎn)流形文獻(xiàn)[11]成功地將式
(1)控制到平衡點(diǎn)流形:
式中,q1d是桿l的期望位置。
所采用的控制律是典型的PD控制“u=-kpq1-kDq1,其中,kp,kD是正實(shí)數(shù),g=q1-q1d。文獻(xiàn)[7]利用BarhaIat引理、q1的一致連續(xù)性和Lya—punov函數(shù):
證明了,在上述PD控制的作用下,平衡點(diǎn)流形M是局部漸近穩(wěn)定的。
6)反饋鎮(zhèn)定式(1)不能通過線性反饋來(lái)實(shí)現(xiàn) 顯然,文獻(xiàn)[7]只是把桿2的運(yùn)動(dòng)看成一種擾
并未考慮桿2的最終停留位置,所以沒有什么實(shí)用價(jià)值,因?yàn)閷?shí)際的工業(yè)機(jī)械手的操作部分都是末端連桿。但是,該控制策略在理論上不限于兩關(guān)節(jié)機(jī)械手,可推廣到更一般的機(jī)器人結(jié)構(gòu)[24]。
②鎮(zhèn)定到普通流形文獻(xiàn)[22]采用“兩步走”的策略:先用反饋控制或文獻(xiàn)[7]的方法,將桿1從(q1,q1)控制到(0,q,q1d);然后給式(1)施以周期輸入信號(hào)u=sω2cosωt,將系統(tǒng)變成一個(gè)周期系統(tǒng),使用平均化方法,將它近似化成在時(shí)間上的平均,根據(jù)一個(gè)Lyapunov函數(shù),設(shè)計(jì)一個(gè)漸近穩(wěn)定的反饋控制律,將平均化系統(tǒng)從初始狀態(tài)控制到包含期望位置(q2,q2)=(0,q2d)的流形上去,從而將原系統(tǒng)控制到包含該位置的流形上。
上述方法具有一般性,有一定的理論價(jià)值,但是它不能保證系統(tǒng)以零速度停止在期望位置的小鄰域內(nèi),因此實(shí)用價(jià)值不高。
文獻(xiàn)[21]在處理系統(tǒng)(1)時(shí),認(rèn)為第二個(gè)關(guān)節(jié)存在較大的摩擦力,這減小了問題的難度,同時(shí)也比較符合實(shí)際情況。該文采用“兩步走”的策略,使用周期性輸入和平均化的方法將系統(tǒng)鎮(zhèn)定到包含期望位置的流形上去。這些措施具有全局鎮(zhèn)定能力。
2)鎮(zhèn)定到單個(gè)平衡點(diǎn)
①兩步走策略文獻(xiàn)[20]提出了一種控制律,將式(1)從任意初始狀態(tài)控制到任意單個(gè)平衡點(diǎn)。嚴(yán)格說(shuō)來(lái),該控制律既不是純反饋控制也不是純鎮(zhèn)定控制,應(yīng)該算作反饋、鎮(zhèn)定和開環(huán)的混合控制策略。文中采用“兩步走”的策略,思路是:
先用反饋控制或者文獻(xiàn)[7]的方法,將桿l從 (q1,q1)控制到(0,q1d);然后對(duì)桿1施加周期性輸入u=ycosωt(以保證每個(gè)周期之后(q1,q1)又重新回到(O,q1d),將振幅y看做輸入,設(shè)計(jì)其反饋鎮(zhèn)定律,將桿2控制到相平面q2-q1的一條類橢圓形軌線上(該軌線通過桿2的期望位置(q2,q2)=(O,q2d)。當(dāng)進(jìn)入期望位置(q1,q1,q2,q2)=(O,q1d,O, q2d)的小鄰域之后,通過調(diào)整周期性輸入信號(hào)u=ycosωt的振幅,將系統(tǒng)的狀態(tài)控制在期望位置的鄰域之內(nèi)。然而,無(wú)法保證系統(tǒng)以零速度停止在期望位置的小鄰域內(nèi)。
由于桿1可能需要經(jīng)過多個(gè)周期的重復(fù)運(yùn)動(dòng)后,桿1和桿2才能停留在目標(biāo)位置的小鄰域之內(nèi),因此,從節(jié)能的角度和機(jī)械手末端的高精度定位需求來(lái)看,文獻(xiàn)[20]的控制策略不具有太大的實(shí)用價(jià)值。另外,該策略太過于啟發(fā)式,振幅y的反饋鎮(zhèn)定律以及桿1的周期運(yùn)動(dòng)次數(shù)都嚴(yán)重依賴于實(shí)際的和期望的類橢圓形軌線的參數(shù),很難推廣到其他系統(tǒng),因此理論價(jià)值也不很高。最后,文獻(xiàn)[20]的控制律的穩(wěn)定性沒有嚴(yán)格保證。
文獻(xiàn)[6]對(duì)式(1)進(jìn)行Nilpotent近似化,然后將開環(huán)控制策略以迭代方式應(yīng)用于近似系統(tǒng),將系統(tǒng)從一個(gè)平衡點(diǎn)控制到另一個(gè)平衡點(diǎn)。采用“兩步走”的策略:先將桿1控制到期望位置(q1,q1)=(0,q1d),然后以迭代方式將開環(huán)控制應(yīng)用于近似系統(tǒng),在每個(gè)迭代階段末期,桿1回到期望位置(q1,q1)=(O,q1d),而桿2離期望位置(q2,q2)=(O,q2d)更近。文獻(xiàn)[6]證明了這種迭代過程是指數(shù)收斂的。
文獻(xiàn)[6]所采用的Nilpotem近似化方法具有一般性,其缺陷如下:
每次迭代所持續(xù)的時(shí)間需要重新選擇;需要調(diào)整幾個(gè)參數(shù)以滿足每次迭代前的初始條件,這些參數(shù)的調(diào)整本身又是一個(gè)很復(fù)雜的過程;由于采用的是開環(huán)控制策略,無(wú)法抑制擾動(dòng)。
②模糊控制策略文獻(xiàn)[23]為每個(gè)桿建立一個(gè)模糊控制子系統(tǒng),并采用“兩步走”的策略。
在先控制好桿2后,考慮關(guān)節(jié)2的摩擦力,僅對(duì)桿l的模糊控制系統(tǒng)施加一個(gè)較小的控制輸入(以免桿1的運(yùn)動(dòng)引起桿2的擺動(dòng))。最終,桿1通過減幅振蕩運(yùn)動(dòng)到期望位置,而桿2仍在期望位置。
文獻(xiàn)[23]說(shuō)明了模糊控制對(duì)非完整欠驅(qū)動(dòng)這類極為復(fù)雜的非線性系統(tǒng)仍然有效。其缺點(diǎn)是:沒有對(duì)控制律進(jìn)行穩(wěn)定性證明;驅(qū)動(dòng)電機(jī)的輸出與桿2的運(yùn)動(dòng)之間的關(guān)系,不能靠人的主觀經(jīng)驗(yàn)來(lái)提煉模糊規(guī)則,桿2的模糊規(guī)則庫(kù)完全是事先通過仿真試湊出來(lái)的,缺乏直觀性、可靠性和適應(yīng)性。
③坐標(biāo)變換策略文獻(xiàn)[18]討論了式(1)對(duì)笛卡爾空間的固定目標(biāo)點(diǎn)的路徑規(guī)劃,利用逆運(yùn)動(dòng)學(xué)將笛卡爾空間的坐標(biāo)轉(zhuǎn)換到關(guān)節(jié)空間的坐標(biāo),也可算作是鎮(zhèn)定到單個(gè)平衡點(diǎn)。使用多速率采樣方法對(duì)式(1)進(jìn)行離散建模,結(jié)合前饋控制、反饋控制以及數(shù)值算法進(jìn)行求解。
文獻(xiàn)[18]的控制過程略顯復(fù)雜,離線規(guī)劃的路徑和離線設(shè)計(jì)的控制器對(duì)于不同的目標(biāo)點(diǎn)不具適應(yīng)性,且數(shù)值算法需要在線進(jìn)行,實(shí)時(shí)性無(wú)法保證。
④切換控制策略文獻(xiàn)[5]提出的切換控制幾乎能同時(shí)將桿1和桿2控制到目標(biāo)位置。
首先,為桿1和桿2分別設(shè)計(jì)一個(gè)基于計(jì)算力矩法的穩(wěn)定子系統(tǒng),然后,使用模糊控制對(duì)這兩個(gè)子系統(tǒng)進(jìn)行切換控制,模糊規(guī)則是通過遺傳算法離線獲取和離線優(yōu)化的。文獻(xiàn)[5]所用方法可用于更多關(guān)節(jié)的情形,但是對(duì)初始位置不具有適應(yīng)性,每當(dāng)初始位置改變時(shí),就要用遺傳算法重新離線獲取和離線優(yōu)化模糊規(guī)則。
文獻(xiàn)[25]也幾乎同時(shí)將桿1和桿2控制到目標(biāo)位置。首先,為桿1和桿2分別設(shè)計(jì)了一個(gè)基于計(jì)算力矩法的子系統(tǒng)及其模糊能量區(qū)域,然后,在2個(gè)模糊能量區(qū)域之間設(shè)計(jì)一條總能量下降曲線,使用切換控制策略使得系統(tǒng)的總能量沿著這條曲線減少,直到達(dá)到控制目標(biāo)。該文成功地完成了控制任務(wù),但是其缺點(diǎn)電較為明顯,即:切換策略易導(dǎo)致高頻抖動(dòng);對(duì)于三桿或更多桿的機(jī)械手,總能量下降曲線的尋找變得很困難。
⑤自適應(yīng)模糊滑模控制策略文獻(xiàn)[26]采用自適應(yīng)模糊滑?刂撇呗詫⑹(1)鎮(zhèn)定到單個(gè)平衡點(diǎn),采用“兩步走”的策略,目前考慮關(guān)節(jié)2的摩擦力以減少問題的難度。模糊輸入不再采用傳統(tǒng)的誤差和浸差變化率而是采用滑模面為模糊輸入,減少了模糊規(guī)則數(shù)量。
利用李亞普諾夫穩(wěn)定性理論推導(dǎo)出自適應(yīng)調(diào)整律,保證了系統(tǒng)的穩(wěn)定性。最后,它顯式考慮了外來(lái)擾動(dòng),有較好的魯棒性和實(shí)用價(jià)值。
4結(jié)語(yǔ)
綜上所述,欠驅(qū)動(dòng)2R平面機(jī)械手在特性分析、運(yùn)動(dòng)控制等方面都取得到了一定的成果,但仍有很多如下問題需進(jìn)一步研究。
①已有的控制策略幾乎都沒有考慮動(dòng)態(tài)品質(zhì),如時(shí)間****、燃料****等。
②大部分控制策略使用的是精確模型,沒有考慮模型的不確定性,缺少魯棒性,減弱了實(shí)用價(jià)值。
③大部分控制策略都沒有給出嚴(yán)格的穩(wěn)定性證明。
④在跟蹤時(shí)變信號(hào)方面,所做的研究還很有限。
⑤從笛卡爾空間到關(guān)節(jié)空間的逆動(dòng)力學(xué)求解可能存在奇異位形,所以大部分文獻(xiàn)都是在關(guān)節(jié)空間里進(jìn)行研究,但是這種做法在實(shí)用上缺乏直觀性。
⑥如何將欠驅(qū)動(dòng)兩關(guān)節(jié)機(jī)械手的成果推廣更多關(guān)節(jié)的情形,需進(jìn)一步研究。
|