Algoritmo compensador neuronal discreto de dinámica en robots móviles usando filtro de Kalman extendido

(1)

Revista

Internacional

de

Métodos

Numéricos

para

Cálculo

y

Diseño

en

Ingeniería

w w w . e l s e v i e r . e s / r i m n i

Algoritmo

compensador

neuronal

discreto

de

dinámica

en

robots

móviles

usando

ﬁltro

de

Kalman

extendido

F.G.

Rossomando

∗

,

C. Soria

y

R. Carelli

InstitutodeAutomática,FacultaddeIngeniería,UniversidadNacionaldeSanJuan,Av.SanMartín1112Oeste,5400SanJuan,Argentina

i n f o r m a c i ó n

d e l

a r t í c u l o

Historiadelartículo:

Recibidoel10dejuniode2010 Aceptadoel28denoviembrede2011 On-lineel5demarzode2013 Palabrasclave: Robotsmóviles Redesneuronales FiltrodeKalmanextendido Controlnolineal

r

e

s

u

m

e

n

Esteartículopresentaeldise ˜nodeunalgoritmobasadoenredesneuronalesentiempodiscretoparasu aplicaciónenrobóticamóvil.Tambiénsemuestranlascondicionesdeestabilidadyunaevaluaciónde losresultados.

Elrobotmóvilenelcualseaplicóelalgoritmoneuralposee2controladoresencascada,unoparala cinemáticayotroparaladinámica;amboscontroladoresestánbasadosenlalinealizaciónpor realimen-tación.Elcontroladordeladinámicasoloposeelainformacióndeladinámicanominal(parámetros).La redneuronaldecompensaciónseadaptaparareducirlasperturbacionesocasionadasporlasvariaciones enladinámicaylasincertidumbresexistentesenelmodelo,yesasdiferenciasenladinámicaentreel modelonominalyelrealsonaprendidasporunaredneuronalRBF(funcionesdebaseradial)usando elﬁltrodeKalmanextendidoparaelajustedelospesosdesalidadelasfuncionesdebaseradial.El algo-ritmodecompensaciónneuronaleseﬁciente,yaqueelcostocomputacionalesmenorqueelnecesario paraaprenderlatotalidaddeladinámicayalmismotiempoposeelarobustezquepodríaaprenderla totalidaddeladinámicaencasodefallodelcontroladordinámico.Enestetrabajosemuestraunanálisis deestabilidaddelalgoritmoneuronaladaptable,yademássecompruebaqueloserroresdecontrolestán acotadosenfuncióndelerrordeaproximacióndelaredneuronalRBF.Semuestranresultadosde expe-rimentaciónsobreunrobotmóvilquepruebanlaviabilidadprácticayelrendimientoparaelcontrolde losmismos.

Discrete

neural

compensator

algorithm

of

dynamic

in

mobile

robots

using

extended

Kalman

ﬁlter

Keywords: Mobilerobots Neuralnetworks ExtendedKalmanﬁlter Nonlinearcontrol

a

b

s

t

r

a

c

t

Thispaperpresentsthedesignofanalgorithmbasedonneuralnetworksindiscretetimeforitsapplication inmobilerobots.Inaddition,thesystemstabilityisanalyzedandanevaluationoftheexperimentalresults isshown.

Themobilerobothastwocontrollers,oneaddressedforthekinematicsandtheotheronedesigned forthedynamics.Bothcontrollersarebasedonthefeedbacklinearization.Thecontrollerofthe dyna-micsonlyhasinformationofthenominaldynamics(parameters).Theneuralalgorithmofcompensation adaptsitsbehaviourtoreducetheperturbationscausedbythevariationsinthedynamicsandthemodel uncertainties.Thus,thedifferencesinthedynamicsbetweenthenominalmodelandtherealoneare learnedbyaneuralnetworkRBF(radialbasisfunctions)wheretheoutputweightsaresetusingthe extendedKalmanﬁlter.Theneuralcompensationalgorithmisefﬁcient,sincetheconsumedprocessing timeislowerthantheonerequiredtolearningthetotalityofthedynamics.Inaddition,theproposed algorithmisrobustwithrespecttofailuresofthedynamiccontroller.Inthiswork,astabilityanalysis oftheadaptableneuralalgorithmisshownanditisdemonstratedthatthecontrolerrorsarebounded dependingontheerrorofapproximationoftheneuralnetworkRBF.Finally,theresultsofexperiments performedbyusingamobilerobotareshowntotesttheviabilityinpracticeandtheperformanceforthe controlofrobots.

∗ _Autor_para_{correspondencia.}

Correoelectrónico:[email protected](F.G.Rossomando).

(2)

1. Introducción

Lasredesneuronales (RN)poseenunampliocampo de apli-cación,que incluyelaclasificación,laidentificaciónyelcontrol de sistemas. Eneste trabajose presenta el dise ñode un algo-ritmobasadoenredesneuronalesRBF(funcionesdebaseradial) para su aplicación en robótica móvil,cuyo objetivo es mejorar elcontroldetrayectoriasentiemporeal,perodebidoa desliza-mientos,perturbaciones,ruidosyerroresdesensadoymedición (odometría)resultamuydifícilreducirloserroresentrelaposición deseadayla posiciónrealdelrobot.Asimismo,lograr controlar eficazmente un robot móvil para realizar el seguimiento pre-cisode unatrayectoria deseada esaúnunproblemaabiertoen robótica.

Sehanpublicadovariosestudiosenrelaciónconeldise ˜node controladoresparaelseguimientodetrayectoriaderobots móvi-les.Lamayoríadeloscontroladoresdise ˜nadoshastaelmomento sebasanúnicamenteenlacinemática,comoloscontroladores pre-sentadosenWuetal.[1],Künheetal.[2]yenGraciayTornero [3].

Sinembargo,pararealizartareasquerequierenmovimientosde altavelocidadotransportedecargaspesadasesimportantetener encuenta,ademásdelacinemática,ladinámicadelrobot.Másaún: elcontroladordeberíacontemplarlasincertidumbresolos even-tualescambiosenesadinámicasindegradareldesempe ño.Amodo deejemplo,enelcasodetransportedecarga,lascaracterísticas dinámicascomolamasa,elcentrodemasaylainerciavaríancon lacarga.Paramantenerunbuendesempe ño,elcontroladordebe sercapazdeadaptarseaestetipodecambios.Estacapacidadde adaptacióntambiénesimportantedebidoaladificultadde mode-larelsistemaconexactitud,auncuandonoseverifiquencambios dinámicosdetareaatarea.

Otroscontroladoresdeseguimientoquecontemplanla incerti-dumbreenladinámicadelrobotsondesarrolladosporLiuetal.[4] yDongyGuo[5],cuyodesempe ˜noesmostradoatravésde simula-ciones.OtrostrabajossimilaressepuedenverenLiyongyWei[6] yenChaitanyaySarkar[7].DasyKar[8]presentanun controla-dordelógicadifusaadaptabledondelaincertidumbredelsistema, queincluyevariacióndeparámetrosdelrobotmóvilyno linealida-desdesconocidas,seestimaporunsistemadelógicadifusacuyos parámetrossonsintonizadosenlínea.

EnFukaoetal.[9]seproponeeldise ˜nodeuncontroladorde seguimientodetrayectoriaadaptativoparagenerarpares moto-ressobrelabasedeunmodelodinámico cuyosparámetrosson desconocidos.

EnVelagicetal.[10]sepresentaeldise ˜nodeuncontrolador adaptabledirectoutilizandoRNrecurrentes.Laeﬁcienciadela téc-nicadecontrolesinvestigadasobreelmodelocinemáticodelrobot móvil.

Otrostiposdecontroladoresdeseguimientodetrayectoriaque consideranlaincertidumbreenladinámicadelrobotsonlos de-sarrolladosenDongyGuo[5]yenDongyHuo[11],loscuales presentanresultadosdesimulación.

Martins et al. [12] y Rossomando et al. [13] utilizan un controladordedinámicainversaadaptableyneuraladaptable res-pectivamentequeidentiﬁcatodaladinámicarealdelrobot;estos trabajospresentantodoeldise ˜noeneldominiocontinuo.

Bugejaetal.[14]presentanelusodeunaredneuronalRBFen tiempodiscretoparalasestimacionesdelasincertidumbresenel dise ˜nodelcontrol,enlaqueseoptóporempleartécnicasdecontrol adaptableestocástico,másconcretamente,el principiodedoble control,quefueronintroducidasporFel’dbaum[15].

ParalograreseobjetivolaredRBFseentrenaporunalgoritmo basadoenelﬁltrodeKalmanextendido(EKF).Estaredaproxima ladinámicadirectacompletadelosrobotsmóviles.Conesta esti-macióndeladinámicaseobtieneunfuncionaldecostepara el

desarrollodelcontrolador.Losautoressolomuestranresultados desimulaciónynopresentanunanálisisdeestabilidad.

Alanísetal.[16]presentanuncontroladorbacksteppingbasado enRN;elcontroladorestádise ˜nadoentiempodiscretosobrela dinámicacompleta,solomuestraunejemplodesimulaciónynoes aplicadoenrobóticamóvil.Enestetrabajoserealizaelajustede lospesosdelaRNdelcontroladoratravésdeunﬁltrodeKalman extendido.

Kimetal.[17]hanpropuestouncontroladoradaptablerobusto para un robot móvil dividido en 2partes. El primero se basa enla cinemáticaderobotsyseencargadegenerarlas referen-ciasparalasegunda,quecompensaladinámicadelmodelo.Sin embargo,losparámetrosadaptadosnosonlosparámetrosreales delrobot,ynosepresentanresultadosexperimentales.Además, lasaccionesdecontrolsedanentérminosdeparesmotores,aun cuandousualmentelosrobotscomercialesaceptancomandosde velocidad.

EneltrabajodeDelaCruzyCarelli[18]sepresentauna para-metrización linealdeunrobotmóvilunicicloyel dise ñodeun controladordeseguimientodetrayectoriaquesebasaenelmodelo completoconocido.Unadelasventajasdesucontroladoresque susparámetrosestándirectamenterelacionadosconlos paráme-trosdelrobot.Sinembargo,silosparámetrosnosoncorrectamente identificadosocambianconeltiempo,debidoporejemploala variacióndelacarga,eldesempe ñodelcontroladorresulta afec-tado.

Lacontribucióndeestetrabajoeseldise ñodeuncontrolador deseguimiento detrayectoria adaptablebasado enla dinámica nominal del robot y en un algoritmo compensador neuronal. Todoelsistemadecontrolestádise ñadoen2partes:unaincluye un controlador cinemático yotra un controlador dinámico con sucompensadorneuronal.Estopresentacomoventaja,respecto de trabajosprevios, que lacompensación se hacesolo sobre la parteinciertadeladinámica.Elmétodopresentadoaquí mues-tra algunas ventajas: la primera es la aplicación a un sistema no linealmultiple input-multipleoutput (MIMO) en tiempo dis-creto;lasegundaeslagarantíadequeelerrorestáacotadoen presenciadeperturbaciones,ylaterceraesqueeldise ñopuede seraplicadoa diferentessistemas. Finalmente,estetrabajo pro-pone el uso de una red RBFentrenada porun EKF que ajusta lospesosdesalidadelasRBF,conelfin deaproximarlaleyde controldecompensación.Tambiénseincluyeunanálisisdelos erroresdecontroldetrayectoria paraelsistemarobóticoMIMO no linealen función de los errores de aproximación de la red neural.

Estetrabajoestáorganizadodelasiguientemanera:lasección2 presentaun panorama generaldelsistema ymuestra la repre-sentaciónmatemáticadetodoelmodelodeuniciclodelrobot.La cinemáticayladinámicadeloscontroladoresydelaredde com-pensaciónRBFseexaminan,respectivamente,enlassecciones3 y4,asícomoloscorrespondientesanálisisdeerrores.Enla sec-ción5 sepresentanalgunosresultadosdeexperimentaciónque muestranelrendimientodelcompensadoradaptable.Porúltimo, enlasección6sepresentanlasconclusiones.

2. Modelodelrobot

2.1. Visióngeneraldelsistema

En esta sección se describe el modelo delrobot móvil tipo uniciclocomoelquesemuestraenlaﬁgura1,dondeseindican los parámetros y las variables de interés. Las variables

v

y ω representan las velocidades lineal y angular, respectivamente, desarrolladasporelrobot,Geselcentrodemasadelrobot,cesla posicióndelaruedacastor,Eeslaubicacióndelaherramienta,h

(3)

Figura1. Parámetrosdelrobotmóviluniciclo.

eselpuntodeinterésconcoordenadasrx,ryenelplanoXY,es laorientacióndelrobot,aesladistanciaentreelpuntodeinterés yelpuntocentraldelejevirtualvinculadoalasruedasdetracción. Larepresentaciónmatemáticadelmodelocompleto[18]estádada por: Modelocinemático

⎡

⎢

⎣

˙ rx ˙ ry ˙

⎤

⎥

⎦

=

⎡

⎣

cossin −aacossin

0 1

⎤

⎦

v

ω +

⎡

⎢

⎣

ırx ıry 0

⎤

⎥

⎦

(1) Modelodinámico

˙

v

˙ ω =

⎡

⎢

⎣

ϑ3 ϑ1 ω2₋ϑ4 ϑ1

v

−ϑ5 ϑ2

v

ω−ϑ6 ϑ2 ω

⎤

⎥

⎦

+

⎡

⎢

⎣

1 ϑ1 0 0 1 ϑ2

⎤

⎥

⎦

v

ref ωref

+

ıv ıω

(2)

Losparámetrosidentiﬁcadosϑ₌

ϑ1 ϑ2 ϑ3 ϑ4 ϑ5 ϑ6

T

del modelo dinámico del robot móvil están descritos por las siguientesrelaciones(validadasen[18]):

ϑ1=

_R_a ka(mRtr+2Ie)+2rkDT

2rkPT

ϑ2=

⎛

⎝

_R a ka

Ied2+2Rtr

Iz+mb2

+2rdkDR

2rdkPR

⎞

⎠

ϑ3=

⎛

⎝

Ra ka mbRt 2kPT

⎞

⎠

;ϑ4=

⎛

⎜

⎝

Ra ka

_k akb Ra +Be

rkPT + 1

⎞

⎟

⎠

ϑ5=

_R a kambRt dkPR

;ϑ6=

⎛

⎝

Ra ka

kakb Ra +Be

d 2rkPR + 1

⎞

⎠

Enestasrelacionesmeslamasadelrobot;reselradiodelas ruedasizquierdayderecha;kbesigualalaconstanteelectromotriz multiplicadaporlaconstantedereducción;Raeslaconstantede

resistenciaeléctrica;kaeslaconstantedetorquemultiplicadapor laconstantedereducción;kPR,kPT,ykDTsonconstantespositivas;

IeyBesonelmomentodeinerciayelcoeﬁcientedefricciónviscosa delacombinaciónrotordelmotor,cajadereducciónyrueda,yRt eselradionominaldelneumático.

Elvalordelosparámetrosidentiﬁcadosdelosrobotsmóviles estáindicadoenlatabla1.

Elvectordeincertidumbres asociadosal robotmóviles,ı=

ırx ıry 0 ıv ıω

T

,dondelasvariablesırxyırysonfunciones delavelocidaddedeslizamientoydelaorientacióndelrobot,ıvy

ıωsonfuncionesdelosparámetrosfísicoscomolamasa,la

iner-cia,diámetrosdelasruedas,delmotoryparámetrosdelosservos, fuerzasaplicadassobrelasruedas,yotrasvariables.Elvectorde incertidumbresesconsideradocomounaperturbaciónalsistema. Elmodelodelrobotpresentadoen(1)y(2)sedivideenunaparte cinemáticayunadinámica,respectivamente,talcomosemuestra enlaﬁgura2.Porlotanto,seaplican2controladores,basadosen lalinealizaciónporrealimentación,paralacinemáticayladinámica delmodelodelrobot,respectivamente.

Elmodelodelrobotsediscretiza,alosﬁnesdesucontroldigital, conun intervalo demuestreo T0=0,1s. Estevalor es el mismo queusaelrobotinternamenteparaelmuestrodelasse ˜nalesde velocidadyposición.Elíndicekeselíndicedetiempodiscreto.El resultadodeladiscretizacióndirectadelmodelodelrobotresulta:

Modelocinemáticodiscretizado

⎡

⎢

⎣

rx(k+1) ry(k+1) (k+1)

⎤

⎥

⎦

=T0

⎡

⎣

cossin ((kk)) −aacossin (k(k))

0 1

⎤

⎦

v

(k) ω(k) +

⎡

⎢

⎣

rx(k) ry(k) (k)

⎤

⎥

⎦

+

⎡

⎢

⎣

ırx ıry 0

⎤

⎥

⎦

(4)

Modelodinámicodiscretizado

v

(k+1) ω(k+1) =

⎡

⎢

⎣

˝3 ˝1 ω2(k)+˝4 ˝1

v

( k) −˝5 ˝2

v

(k)ω(k)+˝6 ˝2 ω(k)

⎤

⎥

⎦

+

⎡

⎢

⎣

1 ˝1 0 0 1 ˝2

⎤

⎥

⎦

v

ref(k) ωref(k)

+

ıv ıω

(5) Donde: ˝3 ˝1 =

_ϑ 3 ϑ1 .T0

;˝4 ˝1 =

1−ϑ4 ϑ1 .T0

; 1 ˝1 =

₁ ϑ1 .T0

˝5 ˝2 =

−ϑ5 ϑ2 .T0

;˝6 ˝2 =

1−ϑ6 ϑ2 .T0

; 1 ˝2 =

₁ ϑ2 .T0

(6) Tabla1

Parámetrosidentiﬁcadosdelosrobotsmóviles

Pioneer3DX Pioneer2DX Pioneer2DX(c/cámara)

ϑ1 0,24089 0,3037 0,1992 ϑ2 0,2424 0,2768 0,13736 ϑ3 –0,00093603 –0,0004018 –0,001954 ϑ4 0,99629 0,9835 0,9907 ϑ5 –0,0037256 –0,003818 –0,01554 ϑ6 1,0915 1,0725 0,9866

(4)

Figura2. Estructuradecontroladaptable.

3. Controladorcinemáticodiscreto

Eldise ˜nodelcontroladorcinemáticosebasaenelmodelodela

cinemáticadelrobotmóvil(4).Seproponeelsiguientecontrolador

cinemático:

⎡

⎣

v

c ref(k) ωc ref(k)

⎤

⎦

=

⎡

⎢

⎣

cos (k) T0 sin (k) T0 −1_asin_T (k) 0 1 a cos (k) T0

⎤

⎥

⎦

⎡

⎢

⎣

rxs(k+1)+lxtanh

_k x lx˜rx(k)

rys(k+1)+lytanh

ky ly ˜ ry(k)

⎤

⎥

⎦

−

_r x(k) ry(k)

(7) donde

v

c ref(k),ω c ref(k)

T

eselvectordevaloresdeseadosde

velo-cidadlinealyangular,y

rxs(k),rys(k)

T

eselvectordeposición

deseadadelrobot.Considerandosololasvariablesdeposicióndel

robotenlatrayectoria[rx(k),ry(k)]Tybajolasuposiciónde

segui-mientoperfectodevelocidad,

v

c ref(k),ω c ref(k)

T =[

v

(k),ω(k)]T,

puedesustituirse(7)en(4),resultandolaecuacióndelazocerrado:

˜ rx(k+1) ˜ ry(k+1)

+

lx 0 0 ly

⎡

⎢

⎣

tanh

_k x lx ˜ rx(k)

tanh

ky ly ˜ ry(k)

⎤

⎥

⎦

=

0 0 (8)

Deﬁniendoelvectordeerrordesalida ˜h(k)=

˜rx(k) r˜y(k)

T =

rxs(k) rys(k)

T −

rx(k) ry(k)

T

, la ecuación(8) puede ser

escritacomo: ˜ h(k+1)=

lxtanh

_k x lx ˜ rx(k)

lytanh

ky ly ˜ ry(k)

T (9)

locualimplicaque ˜h(k)→0cuandok→∞.Lasuposiciónde

segui-mientoperfectodevelocidadseráabandonadaluego,enelanálisis

deestabilidaddelcontroladordinámico.

4. Controladordinámicodiscreto

4.1. Formulacióndelproblema

El controlador dinámico recibe las referencias de velocidad

linearyangular,lascualessongeneradasporelcontrolador

cine-mático,yestegeneraotropardecomandosdevelocidadeslinear

yangularquesonenviadosalosservosdelrobotmóvil,comose

muestraenlaﬁgura2.

Primeramente se dise ˜na el controlador dinámico principal basadosobreladinámicanominaldelrobot.Estadinámica nomi-nalrepresentaunaestimacióndeladinámicaprincipaldelrobot móvil.Ladinámicainversadelrobotesobtenidaenbasea(5),sin considerarlasincertidumbresdinámicas,yesparametrizadadela siguienteforma:

vref(k) ωref(k) =

v(k+1) 0 −ω2₍_k₎ _v₍_k₎ ₀ ₀ 0 ω(k+1) 0 0 v(k)ω(k) ω(k) (10)

dondeeselvectordeparámetrosdiscretoyesiguala: =

˝1 ˝2 ˝3 ˝4 ˝5 ˝6

T

(11) Laecuación(10)puedeserreescritacomo:

v

ref(k) ωref(k)

=

˝1 0 0 ˝2

v

(k+1) ω(k+1) +

0 0 −ω2₍_k₎

_v

₍_k₎ ₀ ₀ 0 0 0 0

v

(k)ω(k) ω(k)

(12)

Ennotacióncompactasepuedeexpresardelasiguienteforma:

vref(k)=Dv(k+1)+␩(k) (13) donde vref(k)=

v

ref(k) ωref(k)

T v(k)=

v

(k) ω(k)

T, =

0 0 −ω2₍_k₎

_v

₍_k₎ ₀ ₀ 0 0 0 0

v

(k)ω(k) ω(k)

dondeD₌diag

˝v,˝ω

,ysiendo˝v=˝1,˝ω=˝2. Laleydecontrolpropuestadeladinámicainversaes: vd

ref(k)=G

v

(k),ω(k),

v

c

ref(k),ωcref(k),...

v

cref(k+1),

ωc ref(k+1)

(14) donde G=

1(k) 0 −ω2(k)

v

(k) 0 0 0 2(k) 0 0

v

(k)ω(k) ω(k)

1(k)=

v

c_ref(k+1)+v

v

c ref(k)−

v

(k)

2(k)=ωc_ref(k+1)+ω

ωc ref(k)−ω(k)

(15)

Enformamatricialseexpresa: ␴(k)=vc ref(k+1)+

vc ref(k)−v(k)

(16) donde␴(k)=

1(k) 2(k)

T y=diag(v,ω)

Laecuación(13)puedeserexpresadacomo:

vd_ref(k)=D(k)+␩(k) (17)

En(14), es elvector de parámetros,el cuales constante. Debidoalasincertidumbresenelmodelonominal (incertidum-bresparamétricas ˜ydinámicanoconsideradaenelmodelo␦), seproponeelusodeunacompensaciónneuronalRBF.Laleyde controlcompletapuedeserexpresadapor:

v

ref(k),ωref(k)

=[D␴(k)+␩(k)]−... NN

v

(k),ω(k),

v

c ref(k),ω c ref(k),

v

c ref(k+1),ω c ref(k+1)

vref(k)=vdref(k)−vN(k) (18)

(5)

dondeNN(.)esunafunciónqueindicalacompensaciónneuronal queaprendeladiferenciaentreenladinámicanominalyactualdel robotmóvil,yvref(k) eslaaccióndecontroldelrobotmóvil.

Laestructuracompletadecontrolpropuestasemuestraenla ﬁgura2,enlacuallaimplementaciónesexpresadaenfuncióndel tiempodiscretok.

4.2. Algoritmocompensadorneural

Uncompensadorneuronalpuedeserobtenidousandola infor-maciónpasadaypresentedelvectordesalidadelaredvN_(k)_,_y delvectordesalidadelsistemav.MuchasRNson implementa-dasporcomputadoresdigitalesylapartedinámicadeunsistema nolinealesobtenidautilizandooperadoresdeatrasodetiempo

(time-delays).UnaredneuronalRBFimplementadaenun compu-tadordigitalpuedeserconsideradacomounsistemadecontrolde tiempodiscreto.

ParaidentiﬁcarladinámicadelrobotseproponelasiguienteRN cuyaestructuraestábasadaenunaredneuraldebaseradial(RBF):

w∗(k+1)=w∗(k)

vN₍_k₎₌_w∗T₍_k₎_␰

_␨₍_k₎

₊_␧ (19)

dondew*_representa_los_pesos_óptimos_del_compensador_neuronal

w∗=

w∗_v w∗ω

y␧∈2x1_es_un_vector_de_{perturbaciones}_acotado. ElvectordefuncionesRBFesindicadopor*_,_siendo_el_número deestasfuncionesigualaM.

Enlaﬁgura3semuestralaestructurainternadelcompensador neuronal,lacualestábasadaenunaredRBF,dondeta,tbsonenteros queestánrelacionadosconelordendelsistema,dondez–1_es_el operadordeatrasodetiempoy

v

cref(k+1)eselvectordesalida deseadodelsistemadinámicodelrobotmóvil.

Elvectordesalida

v

N_(k)_de_la_de_red_de_{compensación}_neuronal esadicionadaalvector

vref

(k)paragenerarlaaccióndecontroltotal delrobot

v

d

ref(k).DeﬁnimoselvectordelpatróndeentradaalaRN: ␨(k)=

vN₍_k₎_,_...,_vN₍_k₋_a₊₁₎_,_v₍_k₎_,_v(_k₋₁₎_, ...,v(k−b+1),vc ref(k+1)

(20) donde vc ref(k)=

v

c ref(k),ωcref(k)

T ,vN₌

_v

N₍_k₎_,_ωN₍_k₎

T _y _v₌ [

v

(k),ω(k)]T

Aquí,␰ esla función debaseradialnolinealdela red,yse representapor: i

␨(k)

=exp

−

␨(k)−ci

T

␨(k)−ci

2 2

(21)

Figura3.EstructurainternadelaredneuronalRBF.

dondeceselvectordecentrosdecadafunción(.);␭esuna cons-tantedelafunción(.),ennuestrocasoesiguala1,yMeselnúmero deneuronasRBF.

Elvectordepesosidealesw*_es_una_cantidad_artiﬁcial_requerida soloparapropósitosanalíticos.Engeneralsesuponequeexisteun vectordepesosconstantesw*_pero_desconocido_cuya_estima_es w(k).Deﬁniendoelerrordepesos:

˜

w(k)=w(k)−w∗ (22)

dondelasalidadelaRN

v

N_(k)_queda_expresada_por: vN₍_k₎₌_wT₍_k₎₍₍_k₎₎₋_w_˜T

(k)((k))+ε (23)

4.3. AlgoritmodeentrenamientousandoﬁltrodeKalman extendido

ElﬁltrodeKalmanestimademodoóptimolosestadosdeun sistemalinealqueestáafectadoconruidoblancosobrelos esta-dosylassalidas.ParaelentrenamientodelaRNbasadoenelﬁltro deKalman,lospesosneuronalessonlosestadosaserestimados. Enestecaso,elerrorentrelasalidadelareferenciadevelocidad (vc_ref(k))ylasalidadeladinámicadelrobot(v(k))puedeser consi-deradocomounruidoblancoaditivo.Debidoaestehechoyaque elmapeodelaRNesnolinear,senecesitaunEKF[19].

Elobjetivodelentrenamientoesencontrarlosvaloresóptimos delospesosqueminimizanlaprediccióndelerror[20].Seaplica unalgoritmodeentrenamientobasadoenelﬁltrodeKalman des-acopladodescritopor:

Kv,ω(k)=Pv,ω(k)Hv,ω(k)Mv,ω(k) wv,ω(k+1)=wv,ω(k)+Kv,ω(k)ev,ω(k) Pv,ω(k+1)=Pv,ω(k)−Kv,ω(k)HTv,ω(k)Pv,ω(k)+v,ω(k) (24) siendo Mv,ω(k)=

Rv,ω(k)+HT_v,ω(k)Pv,ω(k)Hv,ω(k)

e(k)=

vc ref(k)−v(k)

(25)

dondeev,ω(k)sonloselementosdelvectordeerrordesalida,donde

el subíndice

v

yω indican sucorrespondencia conlavelocidad linealylavelocidadangular, respectivamente,Pv,ω(k)∈MxM es

lamatrizdecovarianzadelerrordepredicción,wv,ω(k)∈Mx1esla

estimacióndelvectordepesosdesalidadelaredRBFpara

v

yω, res-pectivamente,␥eselfactordeaprendizaje(0<␩<1),Kv,ω(k)∈Mx1

eselvectordegananciadeKalman,v,ω(k)∈MxMeslamatrizde

covarianzadelruidoqueafectalosestados(pesos),Rv,ω(k)∈1x1es

lamatrizdecovarianzadelruidodemedición.UsualmentePv,ω(k)

yv,ω(k)soninicializadascomomatricesdiagonales.Además,Hvω

∈Mx1_es_la_matriz_de_medición,_la_cual_puede_obtenerse_aplicando elmétododelaregladelacadenasobreelvectordesalidacon respectoalvectordepesos.Estamatrizpuedeexpresarsecomo:

Hv,ω(k)=

∂v(k) ∂w(k) = ∂v ∂vN. ∂vN ∂w (26)

Lasmatrices(Hv,ω)puedenserexpresadaspor:

Hv,ω(k)= ∂v ∂w= ∂v(k) ∂vN₍_k₎.␰

␨(k)

(27)

Parautilizareﬁcazmenteestamatriz(H_v,_␻)esnecesarioconocer

∂

v

/

∂

v

N_,_que_es_difícil_de_calcular_cuando_el_modelo_del_sistema_es desconocidoolosparámetrosdelmismovarían.Sinembargo,se puedeutilizarunaaproximación,siendoestaunafunciónacotada.

∂v ∂vN =sign

_v vN

→

∂v ∂vN

=1 (28)

(6)

LaredRBFdecompensaciónneuralpuedeserentrenadaporel métodopresentadoconlasecuacionesprecedentesyproporciona unmapeonolinealexpresadopor(19).

Generalmentelasmatricesv,ω(k),Rv,ω(k)yPv,ω(k)son

iniciali-zadascomomatricesdiagonales.EsimportanteindicarqueHv,ω(k),

Kv,ω(k)yPv,ω(k)sonacotadas[21].

4.4. Entrenamientoyubicacióndeloscentrosenlasfunciones debaseradial

ElprocedimientodeentrenamientoparalasredesRBFsedivide en 2etapas: el ajuste de los centros de las funciones de base radialenlacapaoculta,seguidodelentrenamientodelospesos entrelasalidaylacapaocultaindicadapor(24b).Generalmenteen aplicacionesdecontrolsoloseentrenalospesosentrelasalidayla capaoculta,dondeloscentrossonajustadosfueradelínea.

Losalgoritmosdeajustedeloscentrosmásusadossonelfast k-means(métododeentrenamientoautorganizado)yelgradiente descendente(métodosupervisado)[19].Paraestaaplicaciónseusa elmétododelgradientedescendente.

Laposicióndeloscentros(capaoculta)puedeserexpresada:

c(k+1)=c(k)+∂J(k) ∂c(k)

J(k)=1₂

eT(k)e(k)

= 1₂

vc_ref(k)−v(k)

T

vc_ref(k)−v(k)

(29)

dondeJ(k)esunafuncióndecosto.Parapoderusarelmétododel gradientedescendientedebemosaplicarlaregladelacadena a

∂

J(k)/

∂

ci(k),yseobtiene: ∂J(k) ∂ci(k)= ∂J(k) ∂v(k) ∂v(k) ∂vN₍_k₎ ∂vN₍_k₎ ∂c(k) (30) donde ∂vN₍_k₎ ∂c(k) =−

wT␰

␨(k)

+␧ ␨(k)−c(k) (31) Parausarelmétododelgradientedebemosconocer

∂

v

/

∂

v

N_,_que fueaproximadopor(28).

Sustituyendo(31)y(28)en(30): c(k+1)=c(k)+e(k)

sign

_v vN

...

wT_␰

_␨₍_k) _␨₍_k₎₋_c₍_k) (32)

Esteresultadopermiteajustar loscentrosdelaredneuronal

RBF-NN,queparaﬁnesprácticos␧noesconsiderado.

4.5. Descripcióndelalgoritmocompensadorneuronal

Hayquetenerencuentaqueparaelvectordesalidadeseado

v

c_ref(k+1),elcompensadorproducirálase ˜nal

v

N_(k):

vN₍_k₎₌_NN

_vN₍_k₋₁₎_,_...,_vN₍_k₋_a₊₁₎_,_v(_k₎_,_v₍_k₋₁₎_,

... ,v(k−b+1),vc_ref(k+1)

Elalgoritmodecompensacióndeestesistemaneuralesdescrito porlossiguientespasos:

a)Inicializaraleatoriamentelospesosycentrosdelaredde com-pensaciónRBFneuralwi(0),ci;einicializarlasmatricesv,ω(k),

Rv,ω(k)yPv,ω(k)comomatricesdiagonales.

b)Proporcionarelpatróndeentradadecompensaciónneuralenel momentodek:

␨(k)=

vN₍_k₋₁₎_,_...,_vN₍_k₋_a₊₁₎_,_v₍_k₎_,_v(_k₋₁₎_,

...,v(k−b+1),vc ref(k+1)

c) Calcularlasalidadelcompensaciónneural(19)comoacciónde controlenelmomentok.

d) TomarlasalidavN_(k)_y_adicionar_v

ref(k)alinstantek,calcularel errordesalidadelsistemacomo:

e(k+1)=vc_ref(k+1)−v(k+1);

e)Actualizarlospesospormediodelaecuación(24b)yloscentros por(32).

f)Hacemosk=k+1yretornamosalpasob)paracalcularelpróximo ciclo.

4.6. Análisisdeestabilidaddelcontrolador

Paralaleydecontrolpropuesta,laredneuronalRBF(19) entre-nadaconelalgoritmobasadoenelEKF(24)aseguraqueelerror deestimacióndelasalida(25b)esuniformementeacotado;por lotanto,lospesosdelaredneuronalRBFsemantienenacotados, siendo:

w˜i

≤wMax (33)

dondewMaxesunvalorconstante.

Pararealizarelanálisissedebedeterminarelerrordecontrol enelinstantek+1yteniendoencuentaquelaleydecontroldela dinámicainversarepresentadapor(14)seexpresacomo: vd

ref(k)=G(k)+G(k) ˜ (34)

Laleydecontrolcompletaqueincluyelacompensación neuro-nal(18)puedeserexpresadapor:

vref(k)=D␴(k)+G(k) ˜+␩−vN(k) (35)

De(13),elmodelodinámicoqueincluyelasincertidumbresestá representadopor:

vref(k)=Dv(k+1)+␩+␦ (36)

Igualando(36)y(35),elsistemadelazocerradoresulta: D(v(k+1)−(k))−

G(k) ˜−␦

=−vN(k) (37)

Teniendo encuentala(25), que deﬁneelerror control,(37) puedeserreescritapor:

D

e(k+1)+e(k)

−

G(k) ˜−␦

=−vN(k) (38) Lacompensaciónneuronaltiende ahacerel errordecontrol igualacero,yreemplazandoelvalordevN_(k)_expresado_por_(23):

D

e(k+1)+e(k)

−

G(k) ˜−␦

=−wT₍_k₎_␰₍_␨₍_k₎₎

+w˜T(k)␰(␨(k))−␧ (39) eigualandoambosmiembrosen(39),queda:

D(e(k+1)+e(k))=w˜T(k)␰(␨(k))−␧

G(k) ˜−␦=wT₍_k₎_␰₍_␨₍_k₎₎ (40)

Reescribiendo(39):

(7)

Expresando(41)enfuncióndesuscomponentes:

ev(k+1)=−vev(k)+˝−11

˜ wT_v(k)␰(␨(k))−εv

eω(k+1)=−ωeω(k)+˝−₂1

˜ wT_ω(k)␰(␨(k))−εω

(42)

ConsiderandolafuncióncandidatadeLyapunovparaelanálisis deestabilidad:

V(k)=eT(k)e(k)=

i=v,ω

e2_i(k)=e2_v(k)+e2ω(k) (43)

dondeelsubíndiceiindicasicorrespondealoselementosde

v

o deω.

LaecuaciónendiferenciasdeLyapunovexpresadaenfunción deloscomponentesdeerrordevelocidadqueda:

V(k)=eT₍_k₊₁₎_e₍_k₊₁₎₋_eT₍_k₎_e₍_k₎₌ i=v,ω [e2 i(k+1)−e 2 i(k)] (44) Reemplazando(42)en(43): V(k)= i=v,ω

2 i −1

e2 i(k)−... −2ei(k)T_i˝−_i1

˜ wT_i␰((k))−εi

+˝−2 i

2

(45)

Calculandolasraícesdelaecuación(45)paradeterminarlacota deerrordecontrol,seobtiene:

− b 2a±

!

b2₋₄_ac 2a =− T i˝− 1 i

˜ wT_i((k))−εi

2 i −1

±... ˝−_i1

"

2 i

2 −

2 i−1

2

2 i−1

(46)

Elerrorquedaacotadopor:

##

ei(k)##≥

2

w˜T_i␰((k))−εi

˝i(i+1)

(47)

De(47)paragarantizarqueV(k) seanegativoydeestaforma elsistemadecontrolpropuestoseaasintóticamenteestablesedebe cumplir:

min##ev(k)##,

##

eω(k)##≥

2

w˜T_i␰((k))−εi

min(D) min(+I)

(48)

LocualimplicaV(k)_≤0.Estoasegura quee(k)_→B_ı_˜_e está acotado.

Conesteresultadoseregresaal análisisdelcomportamiento delerrordecontroldetrayectoria ˜h(k).Abandonandolasuposición inicialdeunseguimientoperfectodevelocidaddeloscontroladores cinemáticosdelasección3,(8)sereescribeahoracomo:

˜ rx(k+1) ˜ ry(k+1)

+

lx 0 0 ly

⎡

⎢

⎣

tanh

_k x lx ˜ rx(k)

tanh

ky lyr˜y(k)

⎤

⎥

⎦

=

ε1(k) ε2(k)

(49)

dondeelvectordeerrorε(k)=

ε1(k) ε2(k)

T

eselerrordela velocidaddeseguimiento previamentedeﬁnidocomo(k)e(k). Siendolamatriz(k): (k)=T0

cos (k) −asin (k) sin (k) acos (k) (50) De(49)hacemos: L

h(˜ k)

=

lx 0 0 ly

⎡

⎢

⎣

tanh

_k x lx ˜ rx(k)

tanh

ky ly ˜ ry(k)

⎤

⎥

⎦

(51)

Reescribiendo(49)en formacompacta, para peque ˜nos erro-resdecontrol,sepuedeaproximarL

h˜(k)

≈Kxyh˜(k) conKxy=

diag

kx,ky

˜

h(k+1)+Kxyh(˜ k)=e(k) (52)

ConsiderandolafuncióncandidatadeLyapunov:

V(k)=1 2h˜

T

(k) ˜h(k)>0, (53)

Ladiferenciadiscretaes: V(k)=V(k+1)−V(k) =_h˜T₍_k₊_{1) ˜}_h₍_k₊₁₎₋_h˜T₍_k_{) ˜}_h₍_k₎ =eT₍_k₎T e(k)−2eT₍_k₎T Kxyh˜(k)+ ˜ hT(k)KTxyKxyh˜(k)−h˜ T (k) ˜h(k) (54)

LacondiciónsuﬁcienteparaqueVseanegativa:

I

−K2_xy

h(˜ k)2≥

2

e(

k)2+2

K

xy

e(

k)h(˜ k)

(55)

Calculandolaraícesdelaecuación(65):

h˜ >−2

K

xy

e

(k) 2

I

−Kxy2

±

"

4

2

K

xy

2

e

(k)2₊4

I

₋Kxy2

e(

k) 2

2 2

I

−K2xy

= −2

K

xy

e

(k)±2

e(k) 2

I

−K2xy

(56)

La condición suﬁciente para estabilidad asintótica para que V≤0puedaserexpresadacomo:

h˜ _≥

1−

K

xy

e(

k)

I

₋K2xy

(57)

EstoimplicaqueV<0.Asegurandoque ˜h→Bıh˜.

Estoconstituyeunresultadoprácticoquepermiteaﬁrmarqueel errordecontroldeposiciónquedaﬁnalmenteacotadoentérminos delerrordeaproximacióndelalgoritmoneuronalde compensa-ción.

5. Resultadosexperimentales

ElrobotmóvilPioneer2-DXposeeabordounaPCPentiumIII con800MHzy512MbdememoriaRAM(fig.4),ylosalgoritmosde controlpropuestoseaplicaronenelrobotqueadmitevelocidades linealesyangulares,comolasse ñalesdeentradadereferencia.El controladorfueinicializadoconlosparámetrosdinámicosdelrobot Pioneer3-DXyseusaron5neuronasRBF(M=5).Losparámetros dinámicosfueronobtenidosatravésdelaidentificación,segúnlo propuestoporSongyGrizzle[21].

El objetivo del experimento es demostrar que para distin-tas velocidades y distintas trayectorias el robot móvil sigue la

(8)

trayectoriadereferencialomásﬁelmenteposibleconelmenor error.Elrobotdebeseguirunatrayectoriaindicadapor:

rxs=0,3sin(0,05kT0)

rys=1,5sin(0,025kT0)

(58)

En el experimento, el robot comienza en la posición (rx,ry)=(0,0)mysigueunatrayectoriadereferenciaenformade 8horizontal(58).Elexperimentoserealizóusandoelalgoritmo decompensación neuronalyse comparóconotroexperimento desactivandoelalgoritmodecompensaciónneuronal.Los resul-tadossedescribenacontinuación.

Lasfiguras5y6describenlasvelocidadesyaccionesde con-troldelcompensadorneuronalRBF,asícomolasreferenciasylas variablesdeposicióndelrobotmóvil,respectivamente.Lafigura7 muestralatrayectoriaseguidaporelrobotmóvil,sincompensación yconelcompensadorneuronaladaptableparaelseguimientodela trayectoriadeseada.Seobservaclaramenteendichafiguraqueel robotconcompensadorneuronalsiguemásfielmentelatrayectoria deseada.

Laﬁgura8muestralanormadelerrordetrayectoriadelos con-troladoresconysincompensación.Elerrordetrayectoriasedeﬁne comoladistanciainstantáneaentrelareferenciaylaposicióndel robot.Tambiénmuestraqueelerrorconcompensadorneuronal discretoesmenorcuando losparámetrosdinámicos noson los correctos,debidoalamalasintoníadelcontroladoroporqueestos hanvariadoaconsecuenciadeperturbacionesexternas.

Figura4.RobotMóvilPioneer2DX.

0 20 40 60 80 100 120 140 160 180 200 -0,2 0 0,2 0,4 0,6 Tiempo (seg.) V e l. lin e a l (m ./ s e c .)

Accion Control C/Comp. Neural

νd ref ν 0 20 40 60 80 100 120 140 160 180 200 -0.5 0 0.5 1 Tiempo (seg.) V e l. a n g . (r a d ./s e g .)

Accion Control C/Comp. Neural

ωd ref

ω

Figura5.Velocidadeslinearyangulardelrobotyaccionesdecontroldel controla-dorconcompensadorneural.

0 20 40 60 80 100 120 140 160 180 200 -2 -1 0 1 2 Pos. Robot Ref. Pos. X 0 20 40 60 80 100 120 140 160 180 200 -0,4 -0,2 0 0,2 0,4 Pos. Robot Ref. Pos. Y

Figura6. Referenciadeposiciónyposicióninstantáneadelrobotmóvil.

-2 -1,5 -1 -0,5 0 0,5 1 1,5 2 -0,4 -0,3 -0,2 -0,1 0 0,1 0,2 0,3 0,4 Dist. X (m) Dist. Y (m) Ref. Tray. Comp Tray. S/Comp

Figura7. Trayectoriadereferenciayposicióninstantáneadelrobotenelplanode coordenadasX-Y. 0 20 40 60 80 100 120 140 160 180 200 0 0,05 0,1 0,15 0,2 0,25 Tiempo (seg.) Error de trayectoria (m)

Norma del Error

Err. Comp Err. S/Comp

Figura8. Normadelerrordedistanciaconcompensadorneuronal.Elerrorgraﬁcado conlíneadetrazoindicasincompensación;enlíneacontinua,concompensación neuronal.

En el experimento no se utilizó un sistema de referencia absoluto. Se comparó el controlador sin compensación y con compensación, y se muestra que coneste último se mejora el seguimiento.Elmismoresultadoseesperaríaconunsistemade referenciaabsoluto.

(9)

6. Conclusiones

Enestetrabajosepropusounalgoritmodecompensación neu-ronaladaptableparaelseguimientodelatrayectoriadeunrobot móvildeltipouniciclo.Estecompensador,juntoalcontroladorno lineal,escapazdegenerarloscomandosdevelocidadconmínimo errorparaelmismo.Se demostróque loserroresdecontrolde seguimientoestánacotados, yque loslímitessoncalculadosen funcióndelerrordeaproximacióndelaredneuronalRBF.

ElalgoritmoneuronaladaptableRBFaprendeladiferenciaentre unadinámicanominalconocidayladinámicarealdelrobotparasu posteriorcompensación.Porlotanto,elesfuerzocomputacionales signiﬁcativamentemenorqueunmodelocompletodeRNinversa quetuvieraqueaprendertodaladinámicadelrobot.Losresultados experimentalesmuestranelbuendesempe ˜nodelcontroladorde seguimientopropuestoysucapacidadparaadaptarsealadinámica derobotsreales.

Apéndice1. Listadodevariables

v

Velocidadlinealdelrobotmóvil

ω Velocidadangulardesarrolladaporelrobotmóvil

v

Vectordevelocidadesdelrobotmóvil

rx,ry Coordenadasdelrobot(pto.h)enelplanoXY

h Vectordeinterésconcoordenadasrx,ryenelplanoXY

G Centrodemasadelrobot

C Posicióndelaruedacastor

E Ubicacióndelaherramienta

␺ Orientacióndelrobot

a Distanciaentreelpuntodeinterésyelpuntocentraldel ejevirtualvinculadoalasruedasdetracción

␦ Vectordeincertidumbresdelrobot

␽ Vectordeparámetrosdelrobot(tiempocontinuo) ␽i Elementosdelvectordeparámetros(tiempocontinuo)

dondei=1,...,6

Vectordeparámetrosdelrobot(tiempodiscreto) ˝i Elementos delvector de parámetros(tiempodiscreto)

dondei=1,...,6

D Matrizdiagonaldiag(˝1,˝2)

T0 Periododemuestreo

k Índicedetiempodiscreto

M NúmerodeneuronasRBF

wv,ω(k) PesosdesalidadelaredneuronalRBF

˜

wv,ω(k) Errordepesosdesalida

w∗_v_,ω Pesosóptimosdesalida i(.) FuncionesRBF

T_(.) _Vector_de_funciones_RBF ␭ Constantedelafuncióni(.)

ci Vectordecentrosasociadosalafuncióni(.)

vN₍_k₎ _Vector_de_salida_de_la_red_RBF

vc

ref(k) Vectordesalidadelcontroladorcinemático

vd

ref(k) Vectordesalidadelcontroladordinámico

vref(k) Vectorde accióndecontroltotal para ladinámicadel

robot(

v

ref(k)=

v

_refd (k)−

v

N(k))

Pv,ω(k)∈MxM Matrizdecovarianzadelerrordepredicción

wv,ω(k)∈Mx1 Estimacióndelvectordepesosdesalida

Factordeaprendizaje(0<<1)

Kv,ω(k)∈Mx1 VectordegananciadeKalman.v,ω(k)∈MxMes

lamatrizdecovarianzadelruidoqueafectalosestados (pesos)

Rv,ω(k)∈1x1 Matrizdecovarianzadelruidodemedición

Hvω∈Mx1 Matrizdemedición

J(k)∈1x1 _Funcional_de_costo_que_es_usado_para_la_{localización}_de centrosdelaRBF

e(k)_∈2x1 _Vector _de _error _de _velocidades _de _salida, _siendo e(k)=[ev(k),eω(k)]T

ev,ω(k)∈1x1 Errordesalida,para

v

yωrespectivamente

␧∈2x1 _Vector_de_{perturbaciones}_(acotado) (k) MatrizT0

cos (k) −asin (k) ; sin (k) acos (k)

Bibliografía

[1] W.Wu,H.Chen,Y.Wang,P.Woo,AdaptiveExponentialStabilizationofMobile RobotswithUncertainties,en:ProceedingsoftheIEEE38thConferenceon DecisionandControl,Phoenix,Arizona,EE.UU.,1999,pp.3484–3489. [2]F.Künhe,J.Gomes,W.Fetter,MobileRobotTrajectoryTrackingUsingModel

PredictiveControl,en:IIIEEELatin-AmericanRoboticsSymposium,SãoLuis, Brasil,2005.

[3]L.Gracia,J.Tornero,Kinematiccontrolofwheeledmobilerobots,Lat.Am.Appl. Res.38(2008)7–16.

[4]S.Liu,H.Zhang,S.X.Yang,J.Yu,DynamicControlofaMobileRobotUsingan AdaptiveNeurodynamicsandSlidingModeStrategy,en:Proceedingsofthe 5thWorldCongressonIntelligentControlandAutomation,Hangzhou,China, 2004,pp.5007–5011.

[5]W.Dong,Y.Guo,Dynamictrackingcontrolofuncertainmobilerobots,IEEE/RSJ InternationalConferenceonIntelligentRobotsandSystems(2005)2774–2779. [6] Y.Liyong,X.Wei,AnAdaptiveTrackingMethodforNon-holonomic Whee-ledMobileRobots,en:Proceedingsofthe26thChineseControlConference, Zhangjiajie,Hunan,China,July26-31,2007.

[7] V.S.K.Chaitanya,P.K.Sarkar,ANeuralNetworkAlgorithmfortheError Opti-mizationinthePathTrackingControlofaMobileRobot,en:International JointConferenceonNeuralNetworksSheratonVancouverWallCentreHotel, Vancouver,BC,Canada,July16-21,2006.

[8] T.Das,I.N.Kar,Designandimplementationofanadaptivefuzzylogic-based controller forwheeledmobilerobots,IEEETrans.ControlSyst.14(2006) 501–510.

[9]T.Fukao,H.Nakagawa,N.Adachi,AdaptiveTrackingControlofaMobileRobot, IEEERobot&Autom16(2000)609–615.

[10] J.Velagic,N.Osmic,B.Lacevic,Neuralnetworkcontrollerformobilerobot motioncontrol,WASETV47(2008)93–198.

[11]W.Dong,W.Huo,TrackingControlofWheeledMobileRobotswithUnknown Dynamics,en:ProceedingsoftheIEEEInternationalConferenceonRobotics& Automation,Detroit,Michigan,1999,pp.2645–2650.

[12]F.N.Martins,C.C.Wanderley,R.Carelli,M.SarcinelliFilho,T.F.BastosFilho,An adaptivedynamiccontrollerforautonomousmobilerobottrajectorytracking, ControlEng.Pract.16(2008)1354–1363.

[13]F.G.Rossomando,C.Soria,R.Carelli,Controlderobotsmóvilescon incertidum-bresdinámicasusandoredesdebaseradial,Rev.Iberoam.Autom.Inf.Ind.7 (2010)28–35.

[14] M.K.Bugeja,S.G.Fabri,L.Camilleri,Dualadaptivedynamiccontrolofmobile robotsusingneuralnetworks,IEEETrans.Syst.ManCybern.39(2009)129–141. [15]A.Fel’dbaum,OptimalControlSystems,AcademicPress,NewYork,NY,1965. [16]A.Y.Alanis,E.N.Sanchez,A.G.Loukianov,Discrete-timeadaptivebackstepping

nonlinearcontrolviahigh-orderneuralnetworks,IEEETrans.NeuralNetworks 18(2007)1185–1195.

[17]M.S.Kim,J.H.Shin,J.J.Lee,DesignofaRobustAdaptiveControllerforaMobile Robot,Proceedings oftheIEEE/RSJInternationalConferenceonIntelligent RobotsandSystems(2000)1816–1821.

[18]C.DelaCruz,R.Carelli,DynamicModelingandCentralizedFormationControl ofMobileRobots,en:32ndAnnualConferenceoftheIEEEIndustrialElectronics SocietyIECON,París,2006.

[19]S.Haykin,KalmanFilteringandNeuralNetworks,JohnWiley&Sons,Inc,2001. [20]S.Haykin,NeuralNetworks:AComprehensiveFoundation,2ndedition,

Pren-ticeHall,2001.

[21]Y.Song,J.W.Grizzle,TheextendedKalmanﬁlteraslocalasymptoticobserver fordiscrete-timenonlinearsystem,JMSEC5(1995)59–78.