Revista
Internacional
de
Métodos
Numéricos
para
Cálculo
y
Diseño
en
Ingeniería
w w w . e l s e v i e r . e s / r i m n i
Algoritmo
compensador
neuronal
discreto
de
dinámica
en
robots
móviles
usando
filtro
de
Kalman
extendido
F.G.
Rossomando
∗,
C.
Soria
y
R.
Carelli
InstitutodeAutomática,FacultaddeIngeniería,UniversidadNacionaldeSanJuan,Av.SanMartín1112Oeste,5400SanJuan,Argentina
i n f o r m a c i ó n
d e l
a r t í c u l o
Historiadelartículo:
Recibidoel10dejuniode2010 Aceptadoel28denoviembrede2011 On-lineel5demarzode2013 Palabrasclave: Robotsmóviles Redesneuronales FiltrodeKalmanextendido Controlnolineal
r
e
s
u
m
e
n
Esteartículopresentaeldise ˜nodeunalgoritmobasadoenredesneuronalesentiempodiscretoparasu aplicaciónenrobóticamóvil.Tambiénsemuestranlascondicionesdeestabilidadyunaevaluaciónde losresultados.
Elrobotmóvilenelcualseaplicóelalgoritmoneuralposee2controladoresencascada,unoparala cinemáticayotroparaladinámica;amboscontroladoresestánbasadosenlalinealizaciónpor realimen-tación.Elcontroladordeladinámicasoloposeelainformacióndeladinámicanominal(parámetros).La redneuronaldecompensaciónseadaptaparareducirlasperturbacionesocasionadasporlasvariaciones enladinámicaylasincertidumbresexistentesenelmodelo,yesasdiferenciasenladinámicaentreel modelonominalyelrealsonaprendidasporunaredneuronalRBF(funcionesdebaseradial)usando elfiltrodeKalmanextendidoparaelajustedelospesosdesalidadelasfuncionesdebaseradial.El algo-ritmodecompensaciónneuronaleseficiente,yaqueelcostocomputacionalesmenorqueelnecesario paraaprenderlatotalidaddeladinámicayalmismotiempoposeelarobustezquepodríaaprenderla totalidaddeladinámicaencasodefallodelcontroladordinámico.Enestetrabajosemuestraunanálisis deestabilidaddelalgoritmoneuronaladaptable,yademássecompruebaqueloserroresdecontrolestán acotadosenfuncióndelerrordeaproximacióndelaredneuronalRBF.Semuestranresultadosde expe-rimentaciónsobreunrobotmóvilquepruebanlaviabilidadprácticayelrendimientoparaelcontrolde losmismos.
©2010CIMNE(UniversitatPolitècnicadeCatalunya).PublicadoporElsevierEspaña,S.L.Todoslos derechosreservados.
Discrete
neural
compensator
algorithm
of
dynamic
in
mobile
robots
using
extended
Kalman
filter
Keywords: Mobilerobots Neuralnetworks ExtendedKalmanfilter Nonlinearcontrol
a
b
s
t
r
a
c
t
Thispaperpresentsthedesignofanalgorithmbasedonneuralnetworksindiscretetimeforitsapplication inmobilerobots.Inaddition,thesystemstabilityisanalyzedandanevaluationoftheexperimentalresults isshown.
Themobilerobothastwocontrollers,oneaddressedforthekinematicsandtheotheronedesigned forthedynamics.Bothcontrollersarebasedonthefeedbacklinearization.Thecontrollerofthe dyna-micsonlyhasinformationofthenominaldynamics(parameters).Theneuralalgorithmofcompensation adaptsitsbehaviourtoreducetheperturbationscausedbythevariationsinthedynamicsandthemodel uncertainties.Thus,thedifferencesinthedynamicsbetweenthenominalmodelandtherealoneare learnedbyaneuralnetworkRBF(radialbasisfunctions)wheretheoutputweightsaresetusingthe extendedKalmanfilter.Theneuralcompensationalgorithmisefficient,sincetheconsumedprocessing timeislowerthantheonerequiredtolearningthetotalityofthedynamics.Inaddition,theproposed algorithmisrobustwithrespecttofailuresofthedynamiccontroller.Inthiswork,astabilityanalysis oftheadaptableneuralalgorithmisshownanditisdemonstratedthatthecontrolerrorsarebounded dependingontheerrorofapproximationoftheneuralnetworkRBF.Finally,theresultsofexperiments performedbyusingamobilerobotareshowntotesttheviabilityinpracticeandtheperformanceforthe controlofrobots.
©2010CIMNE(UniversitatPolitècnicadeCatalunya).PublishedbyElsevierEspaña,S.L.Allrights reserved.
∗ Autorparacorrespondencia.
Correoelectrónico:[email protected](F.G.Rossomando).
0213-1315/$–seefrontmatter©2010CIMNE(UniversitatPolitècnicadeCatalunya).PublicadoporElsevierEspaña,S.L.Todoslosderechosreservados. http://dx.doi.org/10.1016/j.rimni.2011.10.004
1. Introducción
Lasredesneuronales (RN)poseenunampliocampo de apli-cación,que incluyelaclasificación,laidentificaciónyelcontrol de sistemas. Eneste trabajose presenta el dise ˜node un algo-ritmobasadoenredesneuronalesRBF(funcionesdebaseradial) para su aplicación en robótica móvil,cuyo objetivo es mejorar elcontroldetrayectoriasentiemporeal,perodebidoa desliza-mientos,perturbaciones,ruidosyerroresdesensadoymedición (odometría)resultamuydifícilreducirloserroresentrelaposición deseadayla posiciónrealdelrobot.Asimismo,lograr controlar eficazmente un robot móvil para realizar el seguimiento pre-cisode unatrayectoria deseada esaúnunproblemaabiertoen robótica.
Sehanpublicadovariosestudiosenrelaciónconeldise ˜node controladoresparaelseguimientodetrayectoriaderobots móvi-les.Lamayoríadeloscontroladoresdise ˜nadoshastaelmomento sebasanúnicamenteenlacinemática,comoloscontroladores pre-sentadosenWuetal.[1],Künheetal.[2]yenGraciayTornero [3].
Sinembargo,pararealizartareasquerequierenmovimientosde altavelocidadotransportedecargaspesadasesimportantetener encuenta,ademásdelacinemática,ladinámicadelrobot.Másaún: elcontroladordeberíacontemplarlasincertidumbresolos even-tualescambiosenesadinámicasindegradareldesempe ˜no.Amodo deejemplo,enelcasodetransportedecarga,lascaracterísticas dinámicascomolamasa,elcentrodemasaylainerciavaríancon lacarga.Paramantenerunbuendesempe ˜no,elcontroladordebe sercapazdeadaptarseaestetipodecambios.Estacapacidadde adaptacióntambiénesimportantedebidoaladificultadde mode-larelsistemaconexactitud,auncuandonoseverifiquencambios dinámicosdetareaatarea.
Otroscontroladoresdeseguimientoquecontemplanla incerti-dumbreenladinámicadelrobotsondesarrolladosporLiuetal.[4] yDongyGuo[5],cuyodesempe ˜noesmostradoatravésde simula-ciones.OtrostrabajossimilaressepuedenverenLiyongyWei[6] yenChaitanyaySarkar[7].DasyKar[8]presentanun controla-dordelógicadifusaadaptabledondelaincertidumbredelsistema, queincluyevariacióndeparámetrosdelrobotmóvilyno linealida-desdesconocidas,seestimaporunsistemadelógicadifusacuyos parámetrossonsintonizadosenlínea.
EnFukaoetal.[9]seproponeeldise ˜nodeuncontroladorde seguimientodetrayectoriaadaptativoparagenerarpares moto-ressobrelabasedeunmodelodinámico cuyosparámetrosson desconocidos.
EnVelagicetal.[10]sepresentaeldise ˜nodeuncontrolador adaptabledirectoutilizandoRNrecurrentes.Laeficienciadela téc-nicadecontrolesinvestigadasobreelmodelocinemáticodelrobot móvil.
Otrostiposdecontroladoresdeseguimientodetrayectoriaque consideranlaincertidumbreenladinámicadelrobotsonlos de-sarrolladosenDongyGuo[5]yenDongyHuo[11],loscuales presentanresultadosdesimulación.
Martins et al. [12] y Rossomando et al. [13] utilizan un controladordedinámicainversaadaptableyneuraladaptable res-pectivamentequeidentificatodaladinámicarealdelrobot;estos trabajospresentantodoeldise ˜noeneldominiocontinuo.
Bugejaetal.[14]presentanelusodeunaredneuronalRBFen tiempodiscretoparalasestimacionesdelasincertidumbresenel dise ˜nodelcontrol,enlaqueseoptóporempleartécnicasdecontrol adaptableestocástico,másconcretamente,el principiodedoble control,quefueronintroducidasporFel’dbaum[15].
ParalograreseobjetivolaredRBFseentrenaporunalgoritmo basadoenelfiltrodeKalmanextendido(EKF).Estaredaproxima ladinámicadirectacompletadelosrobotsmóviles.Conesta esti-macióndeladinámicaseobtieneunfuncionaldecostepara el
desarrollodelcontrolador.Losautoressolomuestranresultados desimulaciónynopresentanunanálisisdeestabilidad.
Alanísetal.[16]presentanuncontroladorbacksteppingbasado enRN;elcontroladorestádise ˜nadoentiempodiscretosobrela dinámicacompleta,solomuestraunejemplodesimulaciónynoes aplicadoenrobóticamóvil.Enestetrabajoserealizaelajustede lospesosdelaRNdelcontroladoratravésdeunfiltrodeKalman extendido.
Kimetal.[17]hanpropuestouncontroladoradaptablerobusto para un robot móvil dividido en 2partes. El primero se basa enla cinemáticaderobotsyseencargadegenerarlas referen-ciasparalasegunda,quecompensaladinámicadelmodelo.Sin embargo,losparámetrosadaptadosnosonlosparámetrosreales delrobot,ynosepresentanresultadosexperimentales.Además, lasaccionesdecontrolsedanentérminosdeparesmotores,aun cuandousualmentelosrobotscomercialesaceptancomandosde velocidad.
EneltrabajodeDelaCruzyCarelli[18]sepresentauna para-metrización linealdeunrobotmóvilunicicloyel dise ˜nodeun controladordeseguimientodetrayectoriaquesebasaenelmodelo completoconocido.Unadelasventajasdesucontroladoresque susparámetrosestándirectamenterelacionadosconlos paráme-trosdelrobot.Sinembargo,silosparámetrosnosoncorrectamente identificadosocambianconeltiempo,debidoporejemploala variacióndelacarga,eldesempe ˜nodelcontroladorresulta afec-tado.
Lacontribucióndeestetrabajoeseldise ˜nodeuncontrolador deseguimiento detrayectoria adaptablebasado enla dinámica nominal del robot y en un algoritmo compensador neuronal. Todoelsistemadecontrolestádise ˜nadoen2partes:unaincluye un controlador cinemático yotra un controlador dinámico con sucompensadorneuronal.Estopresentacomoventaja,respecto de trabajosprevios, que lacompensación se hacesolo sobre la parteinciertadeladinámica.Elmétodopresentadoaquí mues-tra algunas ventajas: la primera es la aplicación a un sistema no linealmultiple input-multipleoutput (MIMO) en tiempo dis-creto;lasegundaeslagarantíadequeelerrorestáacotadoen presenciadeperturbaciones,ylaterceraesqueeldise ˜nopuede seraplicadoa diferentessistemas. Finalmente,estetrabajo pro-pone el uso de una red RBFentrenada porun EKF que ajusta lospesosdesalidadelasRBF,conelfin deaproximarlaleyde controldecompensación.Tambiénseincluyeunanálisisdelos erroresdecontroldetrayectoria paraelsistemarobóticoMIMO no linealen función de los errores de aproximación de la red neural.
Estetrabajoestáorganizadodelasiguientemanera:lasección2 presentaun panorama generaldelsistema ymuestra la repre-sentaciónmatemáticadetodoelmodelodeuniciclodelrobot.La cinemáticayladinámicadeloscontroladoresydelaredde com-pensaciónRBFseexaminan,respectivamente,enlassecciones3 y4,asícomoloscorrespondientesanálisisdeerrores.Enla sec-ción5 sepresentanalgunosresultadosdeexperimentaciónque muestranelrendimientodelcompensadoradaptable.Porúltimo, enlasección6sepresentanlasconclusiones.
2. Modelodelrobot
2.1. Visióngeneraldelsistema
En esta sección se describe el modelo delrobot móvil tipo uniciclocomoelquesemuestraenlafigura1,dondeseindican los parámetros y las variables de interés. Las variables
v
y ω representan las velocidades lineal y angular, respectivamente, desarrolladasporelrobot,Geselcentrodemasadelrobot,cesla posicióndelaruedacastor,Eeslaubicacióndelaherramienta,hFigura1. Parámetrosdelrobotmóviluniciclo.
eselpuntodeinterésconcoordenadasrx,ryenelplanoXY,es laorientacióndelrobot,aesladistanciaentreelpuntodeinterés yelpuntocentraldelejevirtualvinculadoalasruedasdetracción. Larepresentaciónmatemáticadelmodelocompleto[18]estádada por: Modelocinemático
⎡
⎢
⎣
˙ rx ˙ ry ˙⎤
⎥
⎦
=⎡
⎣
cossin −aacossin0 1
⎤
⎦
v
ω +⎡
⎢
⎣
ırx ıry 0⎤
⎥
⎦
(1) Modelodinámico ˙v
˙ ω =⎡
⎢
⎣
ϑ3 ϑ1 ω2−ϑ4 ϑ1v
−ϑ5 ϑ2v
ω−ϑ6 ϑ2 ω⎤
⎥
⎦
+⎡
⎢
⎣
1 ϑ1 0 0 1 ϑ2⎤
⎥
⎦
v
ref ωref + ıv ıω (2)Losparámetrosidentificadosϑ=
ϑ1 ϑ2 ϑ3 ϑ4 ϑ5 ϑ6 Tdel modelo dinámico del robot móvil están descritos por las siguientesrelaciones(validadasen[18]):
ϑ1=
Ra ka(mRtr+2Ie)+2rkDT 2rkPT ϑ2=⎛
⎝
R a ka Ied2+2Rtr Iz+mb2 +2rdkDR 2rdkPR⎞
⎠
ϑ3=⎛
⎝
Ra ka mbRt 2kPT⎞
⎠
;ϑ4=⎛
⎜
⎝
Ra ka k akb Ra +Be rkPT + 1⎞
⎟
⎠
ϑ5= R a kambRt dkPR ;ϑ6=⎛
⎝
Ra ka kakb Ra +Be d 2rkPR + 1⎞
⎠
Enestasrelacionesmeslamasadelrobot;reselradiodelas ruedasizquierdayderecha;kbesigualalaconstanteelectromotriz multiplicadaporlaconstantedereducción;Raeslaconstantede
resistenciaeléctrica;kaeslaconstantedetorquemultiplicadapor laconstantedereducción;kPR,kPT,ykDTsonconstantespositivas;
IeyBesonelmomentodeinerciayelcoeficientedefricciónviscosa delacombinaciónrotordelmotor,cajadereducciónyrueda,yRt eselradionominaldelneumático.
Elvalordelosparámetrosidentificadosdelosrobotsmóviles estáindicadoenlatabla1.
Elvectordeincertidumbres asociadosal robotmóviles,ı=
ırx ıry 0 ıv ıω
T,dondelasvariablesırxyırysonfunciones delavelocidaddedeslizamientoydelaorientacióndelrobot,ıvy
ıωsonfuncionesdelosparámetrosfísicoscomolamasa,la
iner-cia,diámetrosdelasruedas,delmotoryparámetrosdelosservos, fuerzasaplicadassobrelasruedas,yotrasvariables.Elvectorde incertidumbresesconsideradocomounaperturbaciónalsistema. Elmodelodelrobotpresentadoen(1)y(2)sedivideenunaparte cinemáticayunadinámica,respectivamente,talcomosemuestra enlafigura2.Porlotanto,seaplican2controladores,basadosen lalinealizaciónporrealimentación,paralacinemáticayladinámica delmodelodelrobot,respectivamente.
Elmodelodelrobotsediscretiza,alosfinesdesucontroldigital, conun intervalo demuestreo T0=0,1s. Estevalor es el mismo queusaelrobotinternamenteparaelmuestrodelasse ˜nalesde velocidadyposición.Elíndicekeselíndicedetiempodiscreto.El resultadodeladiscretizacióndirectadelmodelodelrobotresulta:
Modelocinemáticodiscretizado
⎡
⎢
⎣
rx(k+1) ry(k+1) (k+1)⎤
⎥
⎦
=T0⎡
⎣
cossin ((kk)) −aacossin (k(k))0 1
⎤
⎦
v
(k) ω(k) +⎡
⎢
⎣
rx(k) ry(k) (k)⎤
⎥
⎦
+⎡
⎢
⎣
ırx ıry 0⎤
⎥
⎦
(4)Modelodinámicodiscretizado
v
(k+1) ω(k+1) =⎡
⎢
⎢
⎣
˝3 ˝1 ω2(k)+˝4 ˝1v
( k) −˝5 ˝2v
(k)ω(k)+˝6 ˝2 ω(k)⎤
⎥
⎥
⎦
+⎡
⎢
⎣
1 ˝1 0 0 1 ˝2⎤
⎥
⎦
v
ref(k) ωref(k) + ıv ıω (5) Donde: ˝3 ˝1 = ϑ 3 ϑ1 .T0 ;˝4 ˝1 = 1−ϑ4 ϑ1 .T0 ; 1 ˝1 = 1 ϑ1 .T0 ˝5 ˝2 = −ϑ5 ϑ2 .T0 ;˝6 ˝2 = 1−ϑ6 ϑ2 .T0 ; 1 ˝2 = 1 ϑ2 .T0 (6) Tabla1Parámetrosidentificadosdelosrobotsmóviles
Pioneer3DX Pioneer2DX Pioneer2DX(c/cámara)
ϑ1 0,24089 0,3037 0,1992 ϑ2 0,2424 0,2768 0,13736 ϑ3 –0,00093603 –0,0004018 –0,001954 ϑ4 0,99629 0,9835 0,9907 ϑ5 –0,0037256 –0,003818 –0,01554 ϑ6 1,0915 1,0725 0,9866
Figura2. Estructuradecontroladaptable.
3. Controladorcinemáticodiscreto
Eldise ˜nodelcontroladorcinemáticosebasaenelmodelodela
cinemáticadelrobotmóvil(4).Seproponeelsiguientecontrolador
cinemático:
⎡
⎣
v
c ref(k) ωc ref(k)⎤
⎦
=⎡
⎢
⎣
cos (k) T0 sin (k) T0 −1asinT (k) 0 1 a cos (k) T0⎤
⎥
⎦
⎡
⎢
⎢
⎣
rxs(k+1)+lxtanh k x lx˜rx(k) rys(k+1)+lytanh ky ly ˜ ry(k)⎤
⎥
⎥
⎦
− r x(k) ry(k) (7) dondev
c ref(k),ω c ref(k) Teselvectordevaloresdeseadosde
velo-cidadlinealyangular,y
rxs(k),rys(k) Teselvectordeposición
deseadadelrobot.Considerandosololasvariablesdeposicióndel
robotenlatrayectoria[rx(k),ry(k)]Tybajolasuposiciónde
segui-mientoperfectodevelocidad,
v
c ref(k),ω c ref(k) T =[v
(k),ω(k)]T,puedesustituirse(7)en(4),resultandolaecuacióndelazocerrado:
˜ rx(k+1) ˜ ry(k+1) + lx 0 0 ly⎡
⎢
⎢
⎣
tanh k x lx ˜ rx(k) tanh ky ly ˜ ry(k)⎤
⎥
⎥
⎦
= 0 0 (8)Definiendoelvectordeerrordesalida ˜h(k)=
˜rx(k) r˜y(k) T = rxs(k) rys(k) T −rx(k) ry(k) T, la ecuación(8) puede ser
escritacomo: ˜ h(k+1)=
lxtanh k x lx ˜ rx(k) lytanh ky ly ˜ ry(k) T (9)locualimplicaque ˜h(k)→0cuandok→∞.Lasuposiciónde
segui-mientoperfectodevelocidadseráabandonadaluego,enelanálisis
deestabilidaddelcontroladordinámico.
4. Controladordinámicodiscreto
4.1. Formulacióndelproblema
El controlador dinámico recibe las referencias de velocidad
linearyangular,lascualessongeneradasporelcontrolador
cine-mático,yestegeneraotropardecomandosdevelocidadeslinear
yangularquesonenviadosalosservosdelrobotmóvil,comose
muestraenlafigura2.
Primeramente se dise ˜na el controlador dinámico principal basadosobreladinámicanominaldelrobot.Estadinámica nomi-nalrepresentaunaestimacióndeladinámicaprincipaldelrobot móvil.Ladinámicainversadelrobotesobtenidaenbasea(5),sin considerarlasincertidumbresdinámicas,yesparametrizadadela siguienteforma:
vref(k) ωref(k) = v(k+1) 0 −ω2(k) v(k) 0 0 0 ω(k+1) 0 0 v(k)ω(k) ω(k) (10)dondeeselvectordeparámetrosdiscretoyesiguala: =
˝1 ˝2 ˝3 ˝4 ˝5 ˝6 T(11) Laecuación(10)puedeserreescritacomo:
v
ref(k) ωref(k) = ˝1 0 0 ˝2v
(k+1) ω(k+1) + 0 0 −ω2(k)v
(k) 0 0 0 0 0 0v
(k)ω(k) ω(k) (12)Ennotacióncompactasepuedeexpresardelasiguienteforma:
vref(k)=Dv(k+1)+(k) (13) donde vref(k)=
v
ref(k) ωref(k) T v(k)=v
(k) ω(k)T, = 0 0 −ω2(k)v
(k) 0 0 0 0 0 0v
(k)ω(k) ω(k) dondeD=diag˝v,˝ω ,ysiendo˝v=˝1,˝ω=˝2. Laleydecontrolpropuestadeladinámicainversaes: vdref(k)=G
v
(k),ω(k),v
cref(k),ωcref(k),...
v
cref(k+1),ωc ref(k+1)
(14) donde G= 1(k) 0 −ω2(k)v
(k) 0 0 0 2(k) 0 0v
(k)ω(k) ω(k) 1(k)=v
cref(k+1)+vv
c ref(k)−v
(k) 2(k)=ωcref(k+1)+ω ωc ref(k)−ω(k) (15)Enformamatricialseexpresa: (k)=vc ref(k+1)+
vc ref(k)−v(k) (16) donde(k)=1(k) 2(k) T y=diag(v,ω)Laecuación(13)puedeserexpresadacomo:
vdref(k)=D(k)+(k) (17)
En(14), es elvector de parámetros,el cuales constante. Debidoalasincertidumbresenelmodelonominal (incertidum-bresparamétricas ˜ydinámicanoconsideradaenelmodelo␦), seproponeelusodeunacompensaciónneuronalRBF.Laleyde controlcompletapuedeserexpresadapor:
v
ref(k),ωref(k) =[D(k)+(k)]−... NNv
(k),ω(k),v
c ref(k),ω c ref(k),v
c ref(k+1),ω c ref(k+1) vref(k)=vdref(k)−vN(k) (18)dondeNN(.)esunafunciónqueindicalacompensaciónneuronal queaprendeladiferenciaentreenladinámicanominalyactualdel robotmóvil,yvref(k) eslaaccióndecontroldelrobotmóvil.
Laestructuracompletadecontrolpropuestasemuestraenla figura2,enlacuallaimplementaciónesexpresadaenfuncióndel tiempodiscretok.
4.2. Algoritmocompensadorneural
Uncompensadorneuronalpuedeserobtenidousandola infor-maciónpasadaypresentedelvectordesalidadelaredvN(k),y delvectordesalidadelsistemav.MuchasRNson implementa-dasporcomputadoresdigitalesylapartedinámicadeunsistema nolinealesobtenidautilizandooperadoresdeatrasodetiempo
(time-delays).UnaredneuronalRBFimplementadaenun compu-tadordigitalpuedeserconsideradacomounsistemadecontrolde tiempodiscreto.
ParaidentificarladinámicadelrobotseproponelasiguienteRN cuyaestructuraestábasadaenunaredneuraldebaseradial(RBF):
w∗(k+1)=w∗(k)
vN(k)=w∗T(k)
(k)+ (19)dondew*representalospesosóptimosdelcompensadorneuronal
w∗=
w∗v w∗ωy∈2x1esunvectordeperturbacionesacotado. ElvectordefuncionesRBFesindicadopor*,siendoelnúmero deestasfuncionesigualaM.
Enlafigura3semuestralaestructurainternadelcompensador neuronal,lacualestábasadaenunaredRBF,dondeta,tbsonenteros queestánrelacionadosconelordendelsistema,dondez–1esel operadordeatrasodetiempoy
v
cref(k+1)eselvectordesalida deseadodelsistemadinámicodelrobotmóvil.Elvectordesalida
v
N(k)deladereddecompensaciónneuronal esadicionadaalvectorvref
(k)paragenerarlaaccióndecontroltotal delrobotv
dref(k).DefinimoselvectordelpatróndeentradaalaRN: (k)=
vN(k),...,vN(k−a+1),v(k),v(k−1), ...,v(k−b+1),vc ref(k+1) (20) donde vc ref(k)=v
c ref(k),ωcref(k) T ,vN=v
N(k),ωN(k)T y v= [v
(k),ω(k)]TAquí, esla función debaseradialnolinealdela red,yse representapor: i
(k)=exp − (k)−ci T (k)−ci 2 2 (21)Figura3.EstructurainternadelaredneuronalRBF.
dondeceselvectordecentrosdecadafunción(.);esuna cons-tantedelafunción(.),ennuestrocasoesiguala1,yMeselnúmero deneuronasRBF.
Elvectordepesosidealesw*esunacantidadartificialrequerida soloparapropósitosanalíticos.Engeneralsesuponequeexisteun vectordepesosconstantesw*perodesconocidocuyaestimaes w(k).Definiendoelerrordepesos:
˜
w(k)=w(k)−w∗ (22)
dondelasalidadelaRN
v
N(k)quedaexpresadapor: vN(k)=wT(k)((k))−w˜T(k)((k))+ε (23)
4.3. AlgoritmodeentrenamientousandofiltrodeKalman extendido
ElfiltrodeKalmanestimademodoóptimolosestadosdeun sistemalinealqueestáafectadoconruidoblancosobrelos esta-dosylassalidas.ParaelentrenamientodelaRNbasadoenelfiltro deKalman,lospesosneuronalessonlosestadosaserestimados. Enestecaso,elerrorentrelasalidadelareferenciadevelocidad (vcref(k))ylasalidadeladinámicadelrobot(v(k))puedeser consi-deradocomounruidoblancoaditivo.Debidoaestehechoyaque elmapeodelaRNesnolinear,senecesitaunEKF[19].
Elobjetivodelentrenamientoesencontrarlosvaloresóptimos delospesosqueminimizanlaprediccióndelerror[20].Seaplica unalgoritmodeentrenamientobasadoenelfiltrodeKalman des-acopladodescritopor:
Kv,ω(k)=Pv,ω(k)Hv,ω(k)Mv,ω(k) wv,ω(k+1)=wv,ω(k)+Kv,ω(k)ev,ω(k) Pv,ω(k+1)=Pv,ω(k)−Kv,ω(k)HTv,ω(k)Pv,ω(k)+v,ω(k) (24) siendo Mv,ω(k)=
Rv,ω(k)+HTv,ω(k)Pv,ω(k)Hv,ω(k) e(k)= vc ref(k)−v(k) (25)dondeev,ω(k)sonloselementosdelvectordeerrordesalida,donde
el subíndice
v
yω indican sucorrespondencia conlavelocidad linealylavelocidadangular, respectivamente,Pv,ω(k)∈MxM eslamatrizdecovarianzadelerrordepredicción,wv,ω(k)∈Mx1esla
estimacióndelvectordepesosdesalidadelaredRBFpara
v
yω, res-pectivamente,␥eselfactordeaprendizaje(0<<1),Kv,ω(k)∈Mx1eselvectordegananciadeKalman,v,ω(k)∈MxMeslamatrizde
covarianzadelruidoqueafectalosestados(pesos),Rv,ω(k)∈1x1es
lamatrizdecovarianzadelruidodemedición.UsualmentePv,ω(k)
yv,ω(k)soninicializadascomomatricesdiagonales.Además,Hvω
∈Mx1eslamatrizdemedición,lacualpuedeobtenerseaplicando elmétododelaregladelacadenasobreelvectordesalidacon respectoalvectordepesos.Estamatrizpuedeexpresarsecomo:
Hv,ω(k)=
∂v(k) ∂w(k) = ∂v ∂vN. ∂vN ∂w (26)Lasmatrices(Hv,ω)puedenserexpresadaspor:
Hv,ω(k)= ∂v ∂w= ∂v(k) ∂vN(k).
(k) (27)Parautilizareficazmenteestamatriz(Hv,)esnecesarioconocer
∂
v
/∂
v
N,queesdifícildecalcularcuandoelmodelodelsistemaes desconocidoolosparámetrosdelmismovarían.Sinembargo,se puedeutilizarunaaproximación,siendoestaunafunciónacotada.∂v ∂vN =sign
v vN → ∂v ∂vN =1 (28)LaredRBFdecompensaciónneuralpuedeserentrenadaporel métodopresentadoconlasecuacionesprecedentesyproporciona unmapeonolinealexpresadopor(19).
Generalmentelasmatricesv,ω(k),Rv,ω(k)yPv,ω(k)son
iniciali-zadascomomatricesdiagonales.EsimportanteindicarqueHv,ω(k),
Kv,ω(k)yPv,ω(k)sonacotadas[21].
4.4. Entrenamientoyubicacióndeloscentrosenlasfunciones debaseradial
ElprocedimientodeentrenamientoparalasredesRBFsedivide en 2etapas: el ajuste de los centros de las funciones de base radialenlacapaoculta,seguidodelentrenamientodelospesos entrelasalidaylacapaocultaindicadapor(24b).Generalmenteen aplicacionesdecontrolsoloseentrenalospesosentrelasalidayla capaoculta,dondeloscentrossonajustadosfueradelínea.
Losalgoritmosdeajustedeloscentrosmásusadossonelfast k-means(métododeentrenamientoautorganizado)yelgradiente descendente(métodosupervisado)[19].Paraestaaplicaciónseusa elmétododelgradientedescendente.
Laposicióndeloscentros(capaoculta)puedeserexpresada:
c(k+1)=c(k)+∂J(k) ∂c(k)
J(k)=12
eT(k)e(k)= 12
vcref(k)−v(k)Tvcref(k)−v(k)(29)
dondeJ(k)esunafuncióndecosto.Parapoderusarelmétododel gradientedescendientedebemosaplicarlaregladelacadena a
∂
J(k)/∂
ci(k),yseobtiene: ∂J(k) ∂ci(k)= ∂J(k) ∂v(k) ∂v(k) ∂vN(k) ∂vN(k) ∂c(k) (30) donde ∂vN(k) ∂c(k) =− wT(k)+ (k)−c(k) (31) Parausarelmétododelgradientedebemosconocer∂
v
/∂
v
N,que fueaproximadopor(28).Sustituyendo(31)y(28)en(30): c(k+1)=c(k)+e(k)
sign v vN ... wT(k) (k)−c(k) (32)Esteresultadopermiteajustar loscentrosdelaredneuronal
RBF-NN,queparafinesprácticosnoesconsiderado.
4.5. Descripcióndelalgoritmocompensadorneuronal
Hayquetenerencuentaqueparaelvectordesalidadeseado
v
cref(k+1),elcompensadorproducirálase ˜nalv
N(k):vN(k)=NN
vN(k−1),...,vN(k−a+1),v(k),v(k−1),... ,v(k−b+1),vcref(k+1)
Elalgoritmodecompensacióndeestesistemaneuralesdescrito porlossiguientespasos:
a)Inicializaraleatoriamentelospesosycentrosdelaredde com-pensaciónRBFneuralwi(0),ci;einicializarlasmatricesv,ω(k),
Rv,ω(k)yPv,ω(k)comomatricesdiagonales.
b)Proporcionarelpatróndeentradadecompensaciónneuralenel momentodek:
(k)=
vN(k−1),...,vN(k−a+1),v(k),v(k−1),...,v(k−b+1),vc ref(k+1)
c) Calcularlasalidadelcompensaciónneural(19)comoacciónde controlenelmomentok.
d) TomarlasalidavN(k)yadicionarv
ref(k)alinstantek,calcularel errordesalidadelsistemacomo:
e(k+1)=vcref(k+1)−v(k+1);
e)Actualizarlospesospormediodelaecuación(24b)yloscentros por(32).
f)Hacemosk=k+1yretornamosalpasob)paracalcularelpróximo ciclo.
4.6. Análisisdeestabilidaddelcontrolador
Paralaleydecontrolpropuesta,laredneuronalRBF(19) entre-nadaconelalgoritmobasadoenelEKF(24)aseguraqueelerror deestimacióndelasalida(25b)esuniformementeacotado;por lotanto,lospesosdelaredneuronalRBFsemantienenacotados, siendo:
w˜i≤wMax (33)dondewMaxesunvalorconstante.
Pararealizarelanálisissedebedeterminarelerrordecontrol enelinstantek+1yteniendoencuentaquelaleydecontroldela dinámicainversarepresentadapor(14)seexpresacomo: vd
ref(k)=G(k)+G(k) ˜ (34)
Laleydecontrolcompletaqueincluyelacompensación neuro-nal(18)puedeserexpresadapor:
vref(k)=D(k)+G(k) ˜+−vN(k) (35)
De(13),elmodelodinámicoqueincluyelasincertidumbresestá representadopor:
vref(k)=Dv(k+1)++␦ (36)
Igualando(36)y(35),elsistemadelazocerradoresulta: D(v(k+1)−(k))−
G(k) ˜−␦=−vN(k) (37)Teniendo encuentala(25), que defineelerror control,(37) puedeserreescritapor:
D
e(k+1)+e(k)−G(k) ˜−␦=−vN(k) (38) Lacompensaciónneuronaltiende ahacerel errordecontrol igualacero,yreemplazandoelvalordevN(k)expresadopor(23):D
e(k+1)+e(k)−G(k) ˜−␦=−wT(k)((k))+w˜T(k)((k))− (39) eigualandoambosmiembrosen(39),queda:
D(e(k+1)+e(k))=w˜T(k)((k))−
G(k) ˜−␦=wT(k)((k)) (40)
Reescribiendo(39):
Expresando(41)enfuncióndesuscomponentes:
ev(k+1)=−vev(k)+˝−11 ˜ wTv(k)((k))−εv eω(k+1)=−ωeω(k)+˝−21 ˜ wTω(k)((k))−εω (42)ConsiderandolafuncióncandidatadeLyapunovparaelanálisis deestabilidad:
V(k)=eT(k)e(k)=
i=v,ω
e2i(k)=e2v(k)+e2ω(k) (43)
dondeelsubíndiceiindicasicorrespondealoselementosde
v
o deω.LaecuaciónendiferenciasdeLyapunovexpresadaenfunción deloscomponentesdeerrordevelocidadqueda:
V(k)=eT(k+1)e(k+1)−eT(k)e(k)= i=v,ω [e2 i(k+1)−e 2 i(k)] (44) Reemplazando(42)en(43): V(k)= i=v,ω
2 i −1 e2 i(k)−... −2ei(k)Ti˝−i1 ˜ wTi((k))−εi +˝−2 i ˜ wTi((k))−εi 2 (45)Calculandolasraícesdelaecuación(45)paradeterminarlacota deerrordecontrol,seobtiene:
− b 2a±
!
b2−4ac 2a =− T i˝− 1 i ˜ wTi((k))−εi 2 i −1 ±... ˝−i1"
2 i ˜ wTi((k))−εi 2 −2 i−1 ˜ wTi((k))−εi 2 2 i−1 (46)Elerrorquedaacotadopor:
##
ei(k)##≥2
w˜Ti((k))−εi ˝i(i+1)(47)
De(47)paragarantizarqueV(k) seanegativoydeestaforma elsistemadecontrolpropuestoseaasintóticamenteestablesedebe cumplir:
min##ev(k)##,
##
eω(k)##≥2
w˜Ti((k))−εimin(D) min(+I)
(48)
LocualimplicaV(k)≤0.Estoasegura quee(k)→Bı˜e está acotado.
Conesteresultadoseregresaal análisisdelcomportamiento delerrordecontroldetrayectoria ˜h(k).Abandonandolasuposición inicialdeunseguimientoperfectodevelocidaddeloscontroladores cinemáticosdelasección3,(8)sereescribeahoracomo:
˜ rx(k+1) ˜ ry(k+1) + lx 0 0 ly⎡
⎢
⎢
⎣
tanh k x lx ˜ rx(k) tanh ky lyr˜y(k)⎤
⎥
⎥
⎦
= ε1(k) ε2(k) (49)dondeelvectordeerrorε(k)=
ε1(k) ε2(k) Teselerrordela velocidaddeseguimiento previamentedefinidocomo(k)e(k). Siendolamatriz(k): (k)=T0
cos (k) −asin (k) sin (k) acos (k) (50) De(49)hacemos: Lh(˜ k)= lx 0 0 ly⎡
⎢
⎢
⎣
tanh k x lx ˜ rx(k) tanh ky ly ˜ ry(k)⎤
⎥
⎥
⎦
(51)Reescribiendo(49)en formacompacta, para peque ˜nos erro-resdecontrol,sepuedeaproximarL
h˜(k)≈Kxyh˜(k) conKxy=diag
kx,ky ˜h(k+1)+Kxyh(˜ k)=e(k) (52)
ConsiderandolafuncióncandidatadeLyapunov:
V(k)=1 2h˜
T
(k) ˜h(k)>0, (53)
Ladiferenciadiscretaes: V(k)=V(k+1)−V(k) =h˜T(k+1) ˜h(k+1)−h˜T(k) ˜h(k) =eT(k)T e(k)−2eT(k)T Kxyh˜(k)+ ˜ hT(k)KTxyKxyh˜(k)−h˜ T (k) ˜h(k) (54)
LacondiciónsuficienteparaqueVseanegativa:
I
−K2xyh(˜ k)2≥2e(
k)2+2K
xye(
k)h(˜ k)(55)
Calculandolaraícesdelaecuación(65):
h˜ >−2K
xye
(k) 2I
−Kxy2 ±"
42K
xy 2e
(k)2+4I
−Kxy2e(
k) 2 2 2I
−K2xy = −2K
xye
(k)±2e(k) 2I
−K2xy (56)La condición suficiente para estabilidad asintótica para que V≤0puedaserexpresadacomo:
h˜ ≥1−
K
xye(
k)I
−K2xy(57)
EstoimplicaqueV<0.Asegurandoque ˜h→Bıh˜.
Estoconstituyeunresultadoprácticoquepermiteafirmarqueel errordecontroldeposiciónquedafinalmenteacotadoentérminos delerrordeaproximacióndelalgoritmoneuronalde compensa-ción.
5. Resultadosexperimentales
ElrobotmóvilPioneer2-DXposeeabordounaPCPentiumIII con800MHzy512MbdememoriaRAM(fig.4),ylosalgoritmosde controlpropuestoseaplicaronenelrobotqueadmitevelocidades linealesyangulares,comolasse ˜nalesdeentradadereferencia.El controladorfueinicializadoconlosparámetrosdinámicosdelrobot Pioneer3-DXyseusaron5neuronasRBF(M=5).Losparámetros dinámicosfueronobtenidosatravésdelaidentificación,segúnlo propuestoporSongyGrizzle[21].
El objetivo del experimento es demostrar que para distin-tas velocidades y distintas trayectorias el robot móvil sigue la
trayectoriadereferencialomásfielmenteposibleconelmenor error.Elrobotdebeseguirunatrayectoriaindicadapor:
rxs=0,3sin(0,05kT0)
rys=1,5sin(0,025kT0)
(58)
En el experimento, el robot comienza en la posición (rx,ry)=(0,0)mysigueunatrayectoriadereferenciaenformade 8horizontal(58).Elexperimentoserealizóusandoelalgoritmo decompensación neuronalyse comparóconotroexperimento desactivandoelalgoritmodecompensaciónneuronal.Los resul-tadossedescribenacontinuación.
Lasfiguras5y6describenlasvelocidadesyaccionesde con-troldelcompensadorneuronalRBF,asícomolasreferenciasylas variablesdeposicióndelrobotmóvil,respectivamente.Lafigura7 muestralatrayectoriaseguidaporelrobotmóvil,sincompensación yconelcompensadorneuronaladaptableparaelseguimientodela trayectoriadeseada.Seobservaclaramenteendichafiguraqueel robotconcompensadorneuronalsiguemásfielmentelatrayectoria deseada.
Lafigura8muestralanormadelerrordetrayectoriadelos con-troladoresconysincompensación.Elerrordetrayectoriasedefine comoladistanciainstantáneaentrelareferenciaylaposicióndel robot.Tambiénmuestraqueelerrorconcompensadorneuronal discretoesmenorcuando losparámetrosdinámicos noson los correctos,debidoalamalasintoníadelcontroladoroporqueestos hanvariadoaconsecuenciadeperturbacionesexternas.
Figura4.RobotMóvilPioneer2DX.
0 20 40 60 80 100 120 140 160 180 200 -0,2 0 0,2 0,4 0,6 Tiempo (seg.) V e l. lin e a l (m ./ s e c .)
Accion Control C/Comp. Neural
νd ref ν 0 20 40 60 80 100 120 140 160 180 200 -0.5 0 0.5 1 Tiempo (seg.) V e l. a n g . (r a d ./s e g .)
Accion Control C/Comp. Neural
ωd ref
ω
Figura5.Velocidadeslinearyangulardelrobotyaccionesdecontroldel controla-dorconcompensadorneural.
0 20 40 60 80 100 120 140 160 180 200 -2 -1 0 1 2 Pos. Robot Ref. Pos. X 0 20 40 60 80 100 120 140 160 180 200 -0,4 -0,2 0 0,2 0,4 Pos. Robot Ref. Pos. Y
Figura6. Referenciadeposiciónyposicióninstantáneadelrobotmóvil.
-2 -1,5 -1 -0,5 0 0,5 1 1,5 2 -0,4 -0,3 -0,2 -0,1 0 0,1 0,2 0,3 0,4 Dist. X (m) Dist. Y (m) Ref. Tray. Comp Tray. S/Comp
Figura7. Trayectoriadereferenciayposicióninstantáneadelrobotenelplanode coordenadasX-Y. 0 20 40 60 80 100 120 140 160 180 200 0 0,05 0,1 0,15 0,2 0,25 Tiempo (seg.) Error de trayectoria (m)
Norma del Error
Err. Comp Err. S/Comp
Figura8. Normadelerrordedistanciaconcompensadorneuronal.Elerrorgraficado conlíneadetrazoindicasincompensación;enlíneacontinua,concompensación neuronal.
En el experimento no se utilizó un sistema de referencia absoluto. Se comparó el controlador sin compensación y con compensación, y se muestra que coneste último se mejora el seguimiento.Elmismoresultadoseesperaríaconunsistemade referenciaabsoluto.
6. Conclusiones
Enestetrabajosepropusounalgoritmodecompensación neu-ronaladaptableparaelseguimientodelatrayectoriadeunrobot móvildeltipouniciclo.Estecompensador,juntoalcontroladorno lineal,escapazdegenerarloscomandosdevelocidadconmínimo errorparaelmismo.Se demostróque loserroresdecontrolde seguimientoestánacotados, yque loslímitessoncalculadosen funcióndelerrordeaproximacióndelaredneuronalRBF.
ElalgoritmoneuronaladaptableRBFaprendeladiferenciaentre unadinámicanominalconocidayladinámicarealdelrobotparasu posteriorcompensación.Porlotanto,elesfuerzocomputacionales significativamentemenorqueunmodelocompletodeRNinversa quetuvieraqueaprendertodaladinámicadelrobot.Losresultados experimentalesmuestranelbuendesempe ˜nodelcontroladorde seguimientopropuestoysucapacidadparaadaptarsealadinámica derobotsreales.
Apéndice1. Listadodevariables
v
Velocidadlinealdelrobotmóvilω Velocidadangulardesarrolladaporelrobotmóvil
v
Vectordevelocidadesdelrobotmóvilrx,ry Coordenadasdelrobot(pto.h)enelplanoXY
h Vectordeinterésconcoordenadasrx,ryenelplanoXY
G Centrodemasadelrobot
C Posicióndelaruedacastor
E Ubicacióndelaherramienta
Orientacióndelrobot
a Distanciaentreelpuntodeinterésyelpuntocentraldel ejevirtualvinculadoalasruedasdetracción
␦ Vectordeincertidumbresdelrobot
Vectordeparámetrosdelrobot(tiempocontinuo) i Elementosdelvectordeparámetros(tiempocontinuo)
dondei=1,...,6
Vectordeparámetrosdelrobot(tiempodiscreto) ˝i Elementos delvector de parámetros(tiempodiscreto)
dondei=1,...,6
D Matrizdiagonaldiag(˝1,˝2)
T0 Periododemuestreo
k Índicedetiempodiscreto
M NúmerodeneuronasRBF
wv,ω(k) PesosdesalidadelaredneuronalRBF
˜
wv,ω(k) Errordepesosdesalida
w∗v,ω Pesosóptimosdesalida i(.) FuncionesRBF
T(.) VectordefuncionesRBF Constantedelafuncióni(.)
ci Vectordecentrosasociadosalafuncióni(.)
vN(k) VectordesalidadelaredRBF
vc
ref(k) Vectordesalidadelcontroladorcinemático
vd
ref(k) Vectordesalidadelcontroladordinámico
vref(k) Vectorde accióndecontroltotal para ladinámicadel
robot(
v
ref(k)=v
refd (k)−v
N(k))Pv,ω(k)∈MxM Matrizdecovarianzadelerrordepredicción
wv,ω(k)∈Mx1 Estimacióndelvectordepesosdesalida
Factordeaprendizaje(0<<1)
Kv,ω(k)∈Mx1 VectordegananciadeKalman.v,ω(k)∈MxMes
lamatrizdecovarianzadelruidoqueafectalosestados (pesos)
Rv,ω(k)∈1x1 Matrizdecovarianzadelruidodemedición
Hvω∈Mx1 Matrizdemedición
J(k)∈1x1 Funcionaldecostoqueesusadoparalalocalizaciónde centrosdelaRBF
e(k)∈2x1 Vector de error de velocidades de salida, siendo e(k)=[ev(k),eω(k)]T
ev,ω(k)∈1x1 Errordesalida,para
v
yωrespectivamente∈2x1 Vectordeperturbaciones(acotado) (k) MatrizT0
cos (k) −asin (k) ; sin (k) acos (k)
Bibliografía[1] W.Wu,H.Chen,Y.Wang,P.Woo,AdaptiveExponentialStabilizationofMobile RobotswithUncertainties,en:ProceedingsoftheIEEE38thConferenceon DecisionandControl,Phoenix,Arizona,EE.UU.,1999,pp.3484–3489. [2]F.Künhe,J.Gomes,W.Fetter,MobileRobotTrajectoryTrackingUsingModel
PredictiveControl,en:IIIEEELatin-AmericanRoboticsSymposium,SãoLuis, Brasil,2005.
[3]L.Gracia,J.Tornero,Kinematiccontrolofwheeledmobilerobots,Lat.Am.Appl. Res.38(2008)7–16.
[4]S.Liu,H.Zhang,S.X.Yang,J.Yu,DynamicControlofaMobileRobotUsingan AdaptiveNeurodynamicsandSlidingModeStrategy,en:Proceedingsofthe 5thWorldCongressonIntelligentControlandAutomation,Hangzhou,China, 2004,pp.5007–5011.
[5]W.Dong,Y.Guo,Dynamictrackingcontrolofuncertainmobilerobots,IEEE/RSJ InternationalConferenceonIntelligentRobotsandSystems(2005)2774–2779. [6] Y.Liyong,X.Wei,AnAdaptiveTrackingMethodforNon-holonomic Whee-ledMobileRobots,en:Proceedingsofthe26thChineseControlConference, Zhangjiajie,Hunan,China,July26-31,2007.
[7] V.S.K.Chaitanya,P.K.Sarkar,ANeuralNetworkAlgorithmfortheError Opti-mizationinthePathTrackingControlofaMobileRobot,en:International JointConferenceonNeuralNetworksSheratonVancouverWallCentreHotel, Vancouver,BC,Canada,July16-21,2006.
[8] T.Das,I.N.Kar,Designandimplementationofanadaptivefuzzylogic-based controller forwheeledmobilerobots,IEEETrans.ControlSyst.14(2006) 501–510.
[9]T.Fukao,H.Nakagawa,N.Adachi,AdaptiveTrackingControlofaMobileRobot, IEEERobot&Autom16(2000)609–615.
[10] J.Velagic,N.Osmic,B.Lacevic,Neuralnetworkcontrollerformobilerobot motioncontrol,WASETV47(2008)93–198.
[11]W.Dong,W.Huo,TrackingControlofWheeledMobileRobotswithUnknown Dynamics,en:ProceedingsoftheIEEEInternationalConferenceonRobotics& Automation,Detroit,Michigan,1999,pp.2645–2650.
[12]F.N.Martins,C.C.Wanderley,R.Carelli,M.SarcinelliFilho,T.F.BastosFilho,An adaptivedynamiccontrollerforautonomousmobilerobottrajectorytracking, ControlEng.Pract.16(2008)1354–1363.
[13]F.G.Rossomando,C.Soria,R.Carelli,Controlderobotsmóvilescon incertidum-bresdinámicasusandoredesdebaseradial,Rev.Iberoam.Autom.Inf.Ind.7 (2010)28–35.
[14] M.K.Bugeja,S.G.Fabri,L.Camilleri,Dualadaptivedynamiccontrolofmobile robotsusingneuralnetworks,IEEETrans.Syst.ManCybern.39(2009)129–141. [15]A.Fel’dbaum,OptimalControlSystems,AcademicPress,NewYork,NY,1965. [16]A.Y.Alanis,E.N.Sanchez,A.G.Loukianov,Discrete-timeadaptivebackstepping
nonlinearcontrolviahigh-orderneuralnetworks,IEEETrans.NeuralNetworks 18(2007)1185–1195.
[17]M.S.Kim,J.H.Shin,J.J.Lee,DesignofaRobustAdaptiveControllerforaMobile Robot,Proceedings oftheIEEE/RSJInternationalConferenceonIntelligent RobotsandSystems(2000)1816–1821.
[18]C.DelaCruz,R.Carelli,DynamicModelingandCentralizedFormationControl ofMobileRobots,en:32ndAnnualConferenceoftheIEEEIndustrialElectronics SocietyIECON,París,2006.
[19]S.Haykin,KalmanFilteringandNeuralNetworks,JohnWiley&Sons,Inc,2001. [20]S.Haykin,NeuralNetworks:AComprehensiveFoundation,2ndedition,
Pren-ticeHall,2001.
[21]Y.Song,J.W.Grizzle,TheextendedKalmanfilteraslocalasymptoticobserver fordiscrete-timenonlinearsystem,JMSEC5(1995)59–78.