• No se han encontrado resultados

Algoritmo compensador neuronal discreto de dinámica en robots móviles usando filtro de Kalman extendido

N/A
N/A
Protected

Academic year: 2021

Share "Algoritmo compensador neuronal discreto de dinámica en robots móviles usando filtro de Kalman extendido"

Copied!
9
0
0

Texto completo

(1)

Revista

Internacional

de

Métodos

Numéricos

para

Cálculo

y

Diseño

en

Ingeniería

w w w . e l s e v i e r . e s / r i m n i

Algoritmo

compensador

neuronal

discreto

de

dinámica

en

robots

móviles

usando

filtro

de

Kalman

extendido

F.G.

Rossomando

,

C.

Soria

y

R.

Carelli

InstitutodeAutomática,FacultaddeIngeniería,UniversidadNacionaldeSanJuan,Av.SanMartín1112Oeste,5400SanJuan,Argentina

i n f o r m a c i ó n

d e l

a r t í c u l o

Historiadelartículo:

Recibidoel10dejuniode2010 Aceptadoel28denoviembrede2011 On-lineel5demarzode2013 Palabrasclave: Robotsmóviles Redesneuronales FiltrodeKalmanextendido Controlnolineal

r

e

s

u

m

e

n

Esteartículopresentaeldise ˜nodeunalgoritmobasadoenredesneuronalesentiempodiscretoparasu aplicaciónenrobóticamóvil.Tambiénsemuestranlascondicionesdeestabilidadyunaevaluaciónde losresultados.

Elrobotmóvilenelcualseaplicóelalgoritmoneuralposee2controladoresencascada,unoparala cinemáticayotroparaladinámica;amboscontroladoresestánbasadosenlalinealizaciónpor realimen-tación.Elcontroladordeladinámicasoloposeelainformacióndeladinámicanominal(parámetros).La redneuronaldecompensaciónseadaptaparareducirlasperturbacionesocasionadasporlasvariaciones enladinámicaylasincertidumbresexistentesenelmodelo,yesasdiferenciasenladinámicaentreel modelonominalyelrealsonaprendidasporunaredneuronalRBF(funcionesdebaseradial)usando elfiltrodeKalmanextendidoparaelajustedelospesosdesalidadelasfuncionesdebaseradial.El algo-ritmodecompensaciónneuronaleseficiente,yaqueelcostocomputacionalesmenorqueelnecesario paraaprenderlatotalidaddeladinámicayalmismotiempoposeelarobustezquepodríaaprenderla totalidaddeladinámicaencasodefallodelcontroladordinámico.Enestetrabajosemuestraunanálisis deestabilidaddelalgoritmoneuronaladaptable,yademássecompruebaqueloserroresdecontrolestán acotadosenfuncióndelerrordeaproximacióndelaredneuronalRBF.Semuestranresultadosde expe-rimentaciónsobreunrobotmóvilquepruebanlaviabilidadprácticayelrendimientoparaelcontrolde losmismos.

©2010CIMNE(UniversitatPolitècnicadeCatalunya).PublicadoporElsevierEspaña,S.L.Todoslos derechosreservados.

Discrete

neural

compensator

algorithm

of

dynamic

in

mobile

robots

using

extended

Kalman

filter

Keywords: Mobilerobots Neuralnetworks ExtendedKalmanfilter Nonlinearcontrol

a

b

s

t

r

a

c

t

Thispaperpresentsthedesignofanalgorithmbasedonneuralnetworksindiscretetimeforitsapplication inmobilerobots.Inaddition,thesystemstabilityisanalyzedandanevaluationoftheexperimentalresults isshown.

Themobilerobothastwocontrollers,oneaddressedforthekinematicsandtheotheronedesigned forthedynamics.Bothcontrollersarebasedonthefeedbacklinearization.Thecontrollerofthe dyna-micsonlyhasinformationofthenominaldynamics(parameters).Theneuralalgorithmofcompensation adaptsitsbehaviourtoreducetheperturbationscausedbythevariationsinthedynamicsandthemodel uncertainties.Thus,thedifferencesinthedynamicsbetweenthenominalmodelandtherealoneare learnedbyaneuralnetworkRBF(radialbasisfunctions)wheretheoutputweightsaresetusingthe extendedKalmanfilter.Theneuralcompensationalgorithmisefficient,sincetheconsumedprocessing timeislowerthantheonerequiredtolearningthetotalityofthedynamics.Inaddition,theproposed algorithmisrobustwithrespecttofailuresofthedynamiccontroller.Inthiswork,astabilityanalysis oftheadaptableneuralalgorithmisshownanditisdemonstratedthatthecontrolerrorsarebounded dependingontheerrorofapproximationoftheneuralnetworkRBF.Finally,theresultsofexperiments performedbyusingamobilerobotareshowntotesttheviabilityinpracticeandtheperformanceforthe controlofrobots.

©2010CIMNE(UniversitatPolitècnicadeCatalunya).PublishedbyElsevierEspaña,S.L.Allrights reserved.

Autorparacorrespondencia.

Correoelectrónico:[email protected](F.G.Rossomando).

0213-1315/$–seefrontmatter©2010CIMNE(UniversitatPolitècnicadeCatalunya).PublicadoporElsevierEspaña,S.L.Todoslosderechosreservados. http://dx.doi.org/10.1016/j.rimni.2011.10.004

(2)

1. Introducción

Lasredesneuronales (RN)poseenunampliocampo de apli-cación,que incluyelaclasificación,laidentificaciónyelcontrol de sistemas. Eneste trabajose presenta el dise ˜node un algo-ritmobasadoenredesneuronalesRBF(funcionesdebaseradial) para su aplicación en robótica móvil,cuyo objetivo es mejorar elcontroldetrayectoriasentiemporeal,perodebidoa desliza-mientos,perturbaciones,ruidosyerroresdesensadoymedición (odometría)resultamuydifícilreducirloserroresentrelaposición deseadayla posiciónrealdelrobot.Asimismo,lograr controlar eficazmente un robot móvil para realizar el seguimiento pre-cisode unatrayectoria deseada esaúnunproblemaabiertoen robótica.

Sehanpublicadovariosestudiosenrelaciónconeldise ˜node controladoresparaelseguimientodetrayectoriaderobots móvi-les.Lamayoríadeloscontroladoresdise ˜nadoshastaelmomento sebasanúnicamenteenlacinemática,comoloscontroladores pre-sentadosenWuetal.[1],Künheetal.[2]yenGraciayTornero [3].

Sinembargo,pararealizartareasquerequierenmovimientosde altavelocidadotransportedecargaspesadasesimportantetener encuenta,ademásdelacinemática,ladinámicadelrobot.Másaún: elcontroladordeberíacontemplarlasincertidumbresolos even-tualescambiosenesadinámicasindegradareldesempe ˜no.Amodo deejemplo,enelcasodetransportedecarga,lascaracterísticas dinámicascomolamasa,elcentrodemasaylainerciavaríancon lacarga.Paramantenerunbuendesempe ˜no,elcontroladordebe sercapazdeadaptarseaestetipodecambios.Estacapacidadde adaptacióntambiénesimportantedebidoaladificultadde mode-larelsistemaconexactitud,auncuandonoseverifiquencambios dinámicosdetareaatarea.

Otroscontroladoresdeseguimientoquecontemplanla incerti-dumbreenladinámicadelrobotsondesarrolladosporLiuetal.[4] yDongyGuo[5],cuyodesempe ˜noesmostradoatravésde simula-ciones.OtrostrabajossimilaressepuedenverenLiyongyWei[6] yenChaitanyaySarkar[7].DasyKar[8]presentanun controla-dordelógicadifusaadaptabledondelaincertidumbredelsistema, queincluyevariacióndeparámetrosdelrobotmóvilyno linealida-desdesconocidas,seestimaporunsistemadelógicadifusacuyos parámetrossonsintonizadosenlínea.

EnFukaoetal.[9]seproponeeldise ˜nodeuncontroladorde seguimientodetrayectoriaadaptativoparagenerarpares moto-ressobrelabasedeunmodelodinámico cuyosparámetrosson desconocidos.

EnVelagicetal.[10]sepresentaeldise ˜nodeuncontrolador adaptabledirectoutilizandoRNrecurrentes.Laeficienciadela téc-nicadecontrolesinvestigadasobreelmodelocinemáticodelrobot móvil.

Otrostiposdecontroladoresdeseguimientodetrayectoriaque consideranlaincertidumbreenladinámicadelrobotsonlos de-sarrolladosenDongyGuo[5]yenDongyHuo[11],loscuales presentanresultadosdesimulación.

Martins et al. [12] y Rossomando et al. [13] utilizan un controladordedinámicainversaadaptableyneuraladaptable res-pectivamentequeidentificatodaladinámicarealdelrobot;estos trabajospresentantodoeldise ˜noeneldominiocontinuo.

Bugejaetal.[14]presentanelusodeunaredneuronalRBFen tiempodiscretoparalasestimacionesdelasincertidumbresenel dise ˜nodelcontrol,enlaqueseoptóporempleartécnicasdecontrol adaptableestocástico,másconcretamente,el principiodedoble control,quefueronintroducidasporFel’dbaum[15].

ParalograreseobjetivolaredRBFseentrenaporunalgoritmo basadoenelfiltrodeKalmanextendido(EKF).Estaredaproxima ladinámicadirectacompletadelosrobotsmóviles.Conesta esti-macióndeladinámicaseobtieneunfuncionaldecostepara el

desarrollodelcontrolador.Losautoressolomuestranresultados desimulaciónynopresentanunanálisisdeestabilidad.

Alanísetal.[16]presentanuncontroladorbacksteppingbasado enRN;elcontroladorestádise ˜nadoentiempodiscretosobrela dinámicacompleta,solomuestraunejemplodesimulaciónynoes aplicadoenrobóticamóvil.Enestetrabajoserealizaelajustede lospesosdelaRNdelcontroladoratravésdeunfiltrodeKalman extendido.

Kimetal.[17]hanpropuestouncontroladoradaptablerobusto para un robot móvil dividido en 2partes. El primero se basa enla cinemáticaderobotsyseencargadegenerarlas referen-ciasparalasegunda,quecompensaladinámicadelmodelo.Sin embargo,losparámetrosadaptadosnosonlosparámetrosreales delrobot,ynosepresentanresultadosexperimentales.Además, lasaccionesdecontrolsedanentérminosdeparesmotores,aun cuandousualmentelosrobotscomercialesaceptancomandosde velocidad.

EneltrabajodeDelaCruzyCarelli[18]sepresentauna para-metrización linealdeunrobotmóvilunicicloyel dise ˜nodeun controladordeseguimientodetrayectoriaquesebasaenelmodelo completoconocido.Unadelasventajasdesucontroladoresque susparámetrosestándirectamenterelacionadosconlos paráme-trosdelrobot.Sinembargo,silosparámetrosnosoncorrectamente identificadosocambianconeltiempo,debidoporejemploala variacióndelacarga,eldesempe ˜nodelcontroladorresulta afec-tado.

Lacontribucióndeestetrabajoeseldise ˜nodeuncontrolador deseguimiento detrayectoria adaptablebasado enla dinámica nominal del robot y en un algoritmo compensador neuronal. Todoelsistemadecontrolestádise ˜nadoen2partes:unaincluye un controlador cinemático yotra un controlador dinámico con sucompensadorneuronal.Estopresentacomoventaja,respecto de trabajosprevios, que lacompensación se hacesolo sobre la parteinciertadeladinámica.Elmétodopresentadoaquí mues-tra algunas ventajas: la primera es la aplicación a un sistema no linealmultiple input-multipleoutput (MIMO) en tiempo dis-creto;lasegundaeslagarantíadequeelerrorestáacotadoen presenciadeperturbaciones,ylaterceraesqueeldise ˜nopuede seraplicadoa diferentessistemas. Finalmente,estetrabajo pro-pone el uso de una red RBFentrenada porun EKF que ajusta lospesosdesalidadelasRBF,conelfin deaproximarlaleyde controldecompensación.Tambiénseincluyeunanálisisdelos erroresdecontroldetrayectoria paraelsistemarobóticoMIMO no linealen función de los errores de aproximación de la red neural.

Estetrabajoestáorganizadodelasiguientemanera:lasección2 presentaun panorama generaldelsistema ymuestra la repre-sentaciónmatemáticadetodoelmodelodeuniciclodelrobot.La cinemáticayladinámicadeloscontroladoresydelaredde com-pensaciónRBFseexaminan,respectivamente,enlassecciones3 y4,asícomoloscorrespondientesanálisisdeerrores.Enla sec-ción5 sepresentanalgunosresultadosdeexperimentaciónque muestranelrendimientodelcompensadoradaptable.Porúltimo, enlasección6sepresentanlasconclusiones.

2. Modelodelrobot

2.1. Visióngeneraldelsistema

En esta sección se describe el modelo delrobot móvil tipo uniciclocomoelquesemuestraenlafigura1,dondeseindican los parámetros y las variables de interés. Las variables

v

y ω representan las velocidades lineal y angular, respectivamente, desarrolladasporelrobot,Geselcentrodemasadelrobot,cesla posicióndelaruedacastor,Eeslaubicacióndelaherramienta,h

(3)

Figura1. Parámetrosdelrobotmóviluniciclo.

eselpuntodeinterésconcoordenadasrx,ryenelplanoXY,es laorientacióndelrobot,aesladistanciaentreelpuntodeinterés yelpuntocentraldelejevirtualvinculadoalasruedasdetracción. Larepresentaciónmatemáticadelmodelocompleto[18]estádada por: Modelocinemático

˙ rx ˙ ry ˙

=

cossin −aacossin

0 1

v

ω +

ırx ıry 0

(1) Modelodinámico

˙

v

˙ ω =

ϑ3 ϑ1 ω2ϑ4 ϑ1

v

−ϑ5 ϑ2

v

ω−ϑ6 ϑ2 ω

+

1 ϑ1 0 0 1 ϑ2

v

ref ωref

+

ıv ıω

(2)

Losparámetrosidentificadosϑ=

ϑ1 ϑ2 ϑ3 ϑ4 ϑ5 ϑ6

T

del modelo dinámico del robot móvil están descritos por las siguientesrelaciones(validadasen[18]):

ϑ1=

Ra ka(mRtr+2Ie)+2rkDT

2rkPT

ϑ2=

R a ka

Ied2+2Rtr

Iz+mb2

+2rdkDR

2rdkPR

ϑ3=

Ra ka mbRt 2kPT

;ϑ4=

Ra ka

k akb Ra +Be

rkPT + 1

ϑ5=

R a kambRt dkPR

;ϑ6=

Ra ka

kakb Ra +Be

d 2rkPR + 1

Enestasrelacionesmeslamasadelrobot;reselradiodelas ruedasizquierdayderecha;kbesigualalaconstanteelectromotriz multiplicadaporlaconstantedereducción;Raeslaconstantede

resistenciaeléctrica;kaeslaconstantedetorquemultiplicadapor laconstantedereducción;kPR,kPT,ykDTsonconstantespositivas;

IeyBesonelmomentodeinerciayelcoeficientedefricciónviscosa delacombinaciónrotordelmotor,cajadereducciónyrueda,yRt eselradionominaldelneumático.

Elvalordelosparámetrosidentificadosdelosrobotsmóviles estáindicadoenlatabla1.

Elvectordeincertidumbres asociadosal robotmóviles,ı=

ırx ıry 0 ıv ıω

T

,dondelasvariablesırxyırysonfunciones delavelocidaddedeslizamientoydelaorientacióndelrobot,ıvy

ıωsonfuncionesdelosparámetrosfísicoscomolamasa,la

iner-cia,diámetrosdelasruedas,delmotoryparámetrosdelosservos, fuerzasaplicadassobrelasruedas,yotrasvariables.Elvectorde incertidumbresesconsideradocomounaperturbaciónalsistema. Elmodelodelrobotpresentadoen(1)y(2)sedivideenunaparte cinemáticayunadinámica,respectivamente,talcomosemuestra enlafigura2.Porlotanto,seaplican2controladores,basadosen lalinealizaciónporrealimentación,paralacinemáticayladinámica delmodelodelrobot,respectivamente.

Elmodelodelrobotsediscretiza,alosfinesdesucontroldigital, conun intervalo demuestreo T0=0,1s. Estevalor es el mismo queusaelrobotinternamenteparaelmuestrodelasse ˜nalesde velocidadyposición.Elíndicekeselíndicedetiempodiscreto.El resultadodeladiscretizacióndirectadelmodelodelrobotresulta:

Modelocinemáticodiscretizado

rx(k+1) ry(k+1) (k+1)

=T0

cossin ((kk)) −aacossin (k(k))

0 1

v

(k) ω(k) +

rx(k) ry(k) (k)

+

ırx ıry 0

(4)

Modelodinámicodiscretizado

v

(k+1) ω(k+1) =

˝3 ˝1 ω2(k)+˝4 ˝1

v

( k) −˝5 ˝2

v

(k)ω(k)+˝6 ˝2 ω(k)

+

1 ˝1 0 0 1 ˝2

v

ref(k) ωref(k)

+

ıv ıω

(5) Donde: ˝3 ˝1 =

ϑ 3 ϑ1 .T0

;˝4 ˝1 =

1−ϑ4 ϑ1 .T0

; 1 ˝1 =

1 ϑ1 .T0

˝5 ˝2 =

−ϑ5 ϑ2 .T0

;˝6 ˝2 =

1−ϑ6 ϑ2 .T0

; 1 ˝2 =

1 ϑ2 .T0

(6) Tabla1

Parámetrosidentificadosdelosrobotsmóviles

Pioneer3DX Pioneer2DX Pioneer2DX(c/cámara)

ϑ1 0,24089 0,3037 0,1992 ϑ2 0,2424 0,2768 0,13736 ϑ3 –0,00093603 –0,0004018 –0,001954 ϑ4 0,99629 0,9835 0,9907 ϑ5 –0,0037256 –0,003818 –0,01554 ϑ6 1,0915 1,0725 0,9866

(4)

Figura2. Estructuradecontroladaptable.

3. Controladorcinemáticodiscreto

Eldise ˜nodelcontroladorcinemáticosebasaenelmodelodela

cinemáticadelrobotmóvil(4).Seproponeelsiguientecontrolador

cinemático:

v

c ref(k) ωc ref(k)

=

cos (k) T0 sin (k) T0 −1asinT (k) 0 1 a cos (k) T0

rxs(k+1)+lxtanh

k x lx˜rx(k)

rys(k+1)+lytanh

ky ly ˜ ry(k)

r x(k) ry(k)

(7) donde

v

c ref(k),ω c ref(k)

T

eselvectordevaloresdeseadosde

velo-cidadlinealyangular,y

rxs(k),rys(k)

T

eselvectordeposición

deseadadelrobot.Considerandosololasvariablesdeposicióndel

robotenlatrayectoria[rx(k),ry(k)]Tybajolasuposiciónde

segui-mientoperfectodevelocidad,

v

c ref(k),ω c ref(k)

T =[

v

(k),ω(k)]T,

puedesustituirse(7)en(4),resultandolaecuacióndelazocerrado:

˜ rx(k+1) ˜ ry(k+1)

+

lx 0 0 ly

tanh

k x lx ˜ rx(k)

tanh

ky ly ˜ ry(k)

=

0 0 (8)

Definiendoelvectordeerrordesalida ˜h(k)=

˜rx(k) r˜y(k)

T =

rxs(k) rys(k)

T −

rx(k) ry(k)

T

, la ecuación(8) puede ser

escritacomo: ˜ h(k+1)=

lxtanh

k x lx ˜ rx(k)

lytanh

ky ly ˜ ry(k)

T (9)

locualimplicaque ˜h(k)→0cuandok→∞.Lasuposiciónde

segui-mientoperfectodevelocidadseráabandonadaluego,enelanálisis

deestabilidaddelcontroladordinámico.

4. Controladordinámicodiscreto

4.1. Formulacióndelproblema

El controlador dinámico recibe las referencias de velocidad

linearyangular,lascualessongeneradasporelcontrolador

cine-mático,yestegeneraotropardecomandosdevelocidadeslinear

yangularquesonenviadosalosservosdelrobotmóvil,comose

muestraenlafigura2.

Primeramente se dise ˜na el controlador dinámico principal basadosobreladinámicanominaldelrobot.Estadinámica nomi-nalrepresentaunaestimacióndeladinámicaprincipaldelrobot móvil.Ladinámicainversadelrobotesobtenidaenbasea(5),sin considerarlasincertidumbresdinámicas,yesparametrizadadela siguienteforma:

vref(k) ωref(k) =

v(k+1) 0 −ω2(k) v(k) 0 0 0 ω(k+1) 0 0 v(k)ω(k) ω(k) (10)

dondeeselvectordeparámetrosdiscretoyesiguala: =

˝1 ˝2 ˝3 ˝4 ˝5 ˝6

T

(11) Laecuación(10)puedeserreescritacomo:

v

ref(k) ωref(k)

=

˝1 0 0 ˝2

v

(k+1) ω(k+1) +

0 0 −ω2(k)

v

(k) 0 0 0 0 0 0

v

(k)ω(k) ω(k)

(12)

Ennotacióncompactasepuedeexpresardelasiguienteforma:

vref(k)=Dv(k+1)+␩(k) (13) donde vref(k)=

v

ref(k) ωref(k)

T v(k)=

v

(k) ω(k)

T, =

0 0 −ω2(k)

v

(k) 0 0 0 0 0 0

v

(k)ω(k) ω(k)

dondeD=diag

˝v,˝ω

,ysiendo˝v=˝1,˝ω=˝2. Laleydecontrolpropuestadeladinámicainversaes: vd

ref(k)=G

v

(k),ω(k),

v

c

ref(k),ωcref(k),...

v

cref(k+1),

ωc ref(k+1)

(14) donde G=

1(k) 0 −ω2(k)

v

(k) 0 0 0 2(k) 0 0

v

(k)ω(k) ω(k)

1(k)=

v

cref(k+1)+v

v

c ref(k)−

v

(k)

2(k)=ωcref(k+1)+ω

ωc ref(k)−ω(k)

(15)

Enformamatricialseexpresa: ␴(k)=vc ref(k+1)+

vc ref(k)−v(k)

(16) donde␴(k)=

1(k) 2(k)

T y=diag(v,ω)

Laecuación(13)puedeserexpresadacomo:

vdref(k)=D(k)+␩(k) (17)

En(14), es elvector de parámetros,el cuales constante. Debidoalasincertidumbresenelmodelonominal (incertidum-bresparamétricas ˜ydinámicanoconsideradaenelmodelo␦), seproponeelusodeunacompensaciónneuronalRBF.Laleyde controlcompletapuedeserexpresadapor:

v

ref(k),ωref(k)

=[D␴(k)+␩(k)]−... NN

v

(k),ω(k),

v

c ref(k),ω c ref(k),

v

c ref(k+1),ω c ref(k+1)

vref(k)=vdref(k)−vN(k) (18)

(5)

dondeNN(.)esunafunciónqueindicalacompensaciónneuronal queaprendeladiferenciaentreenladinámicanominalyactualdel robotmóvil,yvref(k) eslaaccióndecontroldelrobotmóvil.

Laestructuracompletadecontrolpropuestasemuestraenla figura2,enlacuallaimplementaciónesexpresadaenfuncióndel tiempodiscretok.

4.2. Algoritmocompensadorneural

Uncompensadorneuronalpuedeserobtenidousandola infor-maciónpasadaypresentedelvectordesalidadelaredvN(k),y delvectordesalidadelsistemav.MuchasRNson implementa-dasporcomputadoresdigitalesylapartedinámicadeunsistema nolinealesobtenidautilizandooperadoresdeatrasodetiempo

(time-delays).UnaredneuronalRBFimplementadaenun compu-tadordigitalpuedeserconsideradacomounsistemadecontrolde tiempodiscreto.

ParaidentificarladinámicadelrobotseproponelasiguienteRN cuyaestructuraestábasadaenunaredneuraldebaseradial(RBF):

w∗(k+1)=w∗(k)

vN(k)=w∗T(k)

(k)

+ (19)

dondew*representalospesosóptimosdelcompensadorneuronal

w∗=

wv w∗ω

y␧∈2x1esunvectordeperturbacionesacotado. ElvectordefuncionesRBFesindicadopor*,siendoelnúmero deestasfuncionesigualaM.

Enlafigura3semuestralaestructurainternadelcompensador neuronal,lacualestábasadaenunaredRBF,dondeta,tbsonenteros queestánrelacionadosconelordendelsistema,dondez–1esel operadordeatrasodetiempoy

v

cref(k+1)eselvectordesalida deseadodelsistemadinámicodelrobotmóvil.

Elvectordesalida

v

N(k)deladereddecompensaciónneuronal esadicionadaalvector

vref

(k)paragenerarlaaccióndecontroltotal delrobot

v

d

ref(k).DefinimoselvectordelpatróndeentradaalaRN: ␨(k)=

vN(k),...,vN(ka+1),v(k),v(k1), ...,v(k−b+1),vc ref(k+1)

(20) donde vc ref(k)=

v

c ref(k),ωcref(k)

T ,vN=

v

N(k),ωN(k)

T y v= [

v

(k),ω(k)]T

Aquí,␰ esla función debaseradialnolinealdela red,yse representapor: i

␨(k)

=exp

␨(k)−ci

T

␨(k)−ci

2 2

(21)

Figura3.EstructurainternadelaredneuronalRBF.

dondeceselvectordecentrosdecadafunción(.);␭esuna cons-tantedelafunción(.),ennuestrocasoesiguala1,yMeselnúmero deneuronasRBF.

Elvectordepesosidealesw*esunacantidadartificialrequerida soloparapropósitosanalíticos.Engeneralsesuponequeexisteun vectordepesosconstantesw*perodesconocidocuyaestimaes w(k).Definiendoelerrordepesos:

˜

w(k)=w(k)−w∗ (22)

dondelasalidadelaRN

v

N(k)quedaexpresadapor: vN(k)=wT(k)((k))w˜T

(k)((k))+ε (23)

4.3. AlgoritmodeentrenamientousandofiltrodeKalman extendido

ElfiltrodeKalmanestimademodoóptimolosestadosdeun sistemalinealqueestáafectadoconruidoblancosobrelos esta-dosylassalidas.ParaelentrenamientodelaRNbasadoenelfiltro deKalman,lospesosneuronalessonlosestadosaserestimados. Enestecaso,elerrorentrelasalidadelareferenciadevelocidad (vcref(k))ylasalidadeladinámicadelrobot(v(k))puedeser consi-deradocomounruidoblancoaditivo.Debidoaestehechoyaque elmapeodelaRNesnolinear,senecesitaunEKF[19].

Elobjetivodelentrenamientoesencontrarlosvaloresóptimos delospesosqueminimizanlaprediccióndelerror[20].Seaplica unalgoritmodeentrenamientobasadoenelfiltrodeKalman des-acopladodescritopor:

Kv,ω(k)=Pv,ω(k)Hv,ω(k)Mv,ω(k) wv,ω(k+1)=wv,ω(k)+Kv,ω(k)ev,ω(k) Pv,ω(k+1)=Pv,ω(k)−Kv,ω(k)HTv,ω(k)Pv,ω(k)+v,ω(k) (24) siendo Mv,ω(k)=

Rv,ω(k)+HTv,ω(k)Pv,ω(k)Hv,ω(k)

e(k)=

vc ref(k)−v(k)

(25)

dondeev,ω(k)sonloselementosdelvectordeerrordesalida,donde

el subíndice

v

yω indican sucorrespondencia conlavelocidad linealylavelocidadangular, respectivamente,Pv,ω(k)∈MxM es

lamatrizdecovarianzadelerrordepredicción,wv,ω(k)∈Mx1esla

estimacióndelvectordepesosdesalidadelaredRBFpara

v

yω, res-pectivamente,␥eselfactordeaprendizaje(0<␩<1),Kv,ω(k)∈Mx1

eselvectordegananciadeKalman,v,ω(k)∈MxMeslamatrizde

covarianzadelruidoqueafectalosestados(pesos),Rv,ω(k)∈1x1es

lamatrizdecovarianzadelruidodemedición.UsualmentePv,ω(k)

yv,ω(k)soninicializadascomomatricesdiagonales.Además,Hvω

∈Mx1eslamatrizdemedición,lacualpuedeobtenerseaplicando elmétododelaregladelacadenasobreelvectordesalidacon respectoalvectordepesos.Estamatrizpuedeexpresarsecomo:

Hv,ω(k)=

v(k) ∂w(k) = ∂vvN. ∂vN ∂w (26)

Lasmatrices(Hv,ω)puedenserexpresadaspor:

Hv,ω(k)= ∂vw= ∂v(k) ∂vN(k).␰

␨(k)

(27)

Parautilizareficazmenteestamatriz(Hv,)esnecesarioconocer

v

/

v

N,queesdifícildecalcularcuandoelmodelodelsistemaes desconocidoolosparámetrosdelmismovarían.Sinembargo,se puedeutilizarunaaproximación,siendoestaunafunciónacotada.

vvN =sign

v vN

vvN

=1 (28)

(6)

LaredRBFdecompensaciónneuralpuedeserentrenadaporel métodopresentadoconlasecuacionesprecedentesyproporciona unmapeonolinealexpresadopor(19).

Generalmentelasmatricesv,ω(k),Rv,ω(k)yPv,ω(k)son

iniciali-zadascomomatricesdiagonales.EsimportanteindicarqueHv,ω(k),

Kv,ω(k)yPv,ω(k)sonacotadas[21].

4.4. Entrenamientoyubicacióndeloscentrosenlasfunciones debaseradial

ElprocedimientodeentrenamientoparalasredesRBFsedivide en 2etapas: el ajuste de los centros de las funciones de base radialenlacapaoculta,seguidodelentrenamientodelospesos entrelasalidaylacapaocultaindicadapor(24b).Generalmenteen aplicacionesdecontrolsoloseentrenalospesosentrelasalidayla capaoculta,dondeloscentrossonajustadosfueradelínea.

Losalgoritmosdeajustedeloscentrosmásusadossonelfast k-means(métododeentrenamientoautorganizado)yelgradiente descendente(métodosupervisado)[19].Paraestaaplicaciónseusa elmétododelgradientedescendente.

Laposicióndeloscentros(capaoculta)puedeserexpresada:

c(k+1)=c(k)+∂J(k) ∂c(k)

J(k)=12

eT(k)e(k)

= 12

vcref(k)−v(k)

T

vcref(k)−v(k)

(29)

dondeJ(k)esunafuncióndecosto.Parapoderusarelmétododel gradientedescendientedebemosaplicarlaregladelacadena a

J(k)/

ci(k),yseobtiene: ∂J(k) ∂ci(k)= ∂J(k) ∂v(k) ∂v(k) ∂vN(k)vN(k)c(k) (30) donde ∂vN(k)c(k) =−

wT␰

␨(k)

+␧ ␨(k)−c(k) (31) Parausarelmétododelgradientedebemosconocer

v

/

v

N,que fueaproximadopor(28).

Sustituyendo(31)y(28)en(30): c(k+1)=c(k)+e(k)

sign

v vN

...

wT

(k) (k)c(k) (32)

Esteresultadopermiteajustar loscentrosdelaredneuronal

RBF-NN,queparafinesprácticos␧noesconsiderado.

4.5. Descripcióndelalgoritmocompensadorneuronal

Hayquetenerencuentaqueparaelvectordesalidadeseado

v

cref(k+1),elcompensadorproducirálase ˜nal

v

N(k):

vN(k)=NN

vN(k1),...,vN(ka+1),v(k),v(k1),

... ,v(k−b+1),vcref(k+1)

Elalgoritmodecompensacióndeestesistemaneuralesdescrito porlossiguientespasos:

a)Inicializaraleatoriamentelospesosycentrosdelaredde com-pensaciónRBFneuralwi(0),ci;einicializarlasmatricesv,ω(k),

Rv,ω(k)yPv,ω(k)comomatricesdiagonales.

b)Proporcionarelpatróndeentradadecompensaciónneuralenel momentodek:

␨(k)=

vN(k1),...,vN(ka+1),v(k),v(k1),

...,v(k−b+1),vc ref(k+1)

c) Calcularlasalidadelcompensaciónneural(19)comoacciónde controlenelmomentok.

d) TomarlasalidavN(k)yadicionarv

ref(k)alinstantek,calcularel errordesalidadelsistemacomo:

e(k+1)=vcref(k+1)−v(k+1);

e)Actualizarlospesospormediodelaecuación(24b)yloscentros por(32).

f)Hacemosk=k+1yretornamosalpasob)paracalcularelpróximo ciclo.

4.6. Análisisdeestabilidaddelcontrolador

Paralaleydecontrolpropuesta,laredneuronalRBF(19) entre-nadaconelalgoritmobasadoenelEKF(24)aseguraqueelerror deestimacióndelasalida(25b)esuniformementeacotado;por lotanto,lospesosdelaredneuronalRBFsemantienenacotados, siendo:

w˜i

≤wMax (33)

dondewMaxesunvalorconstante.

Pararealizarelanálisissedebedeterminarelerrordecontrol enelinstantek+1yteniendoencuentaquelaleydecontroldela dinámicainversarepresentadapor(14)seexpresacomo: vd

ref(k)=G(k)+G(k) ˜ (34)

Laleydecontrolcompletaqueincluyelacompensación neuro-nal(18)puedeserexpresadapor:

vref(k)=D␴(k)+G(k) ˜+␩−vN(k) (35)

De(13),elmodelodinámicoqueincluyelasincertidumbresestá representadopor:

vref(k)=Dv(k+1)+␩+␦ (36)

Igualando(36)y(35),elsistemadelazocerradoresulta: D(v(k+1)−(k))−

G(k) ˜−␦

=−vN(k) (37)

Teniendo encuentala(25), que defineelerror control,(37) puedeserreescritapor:

D

e(k+1)+e(k)

G(k) ˜−␦

=−vN(k) (38) Lacompensaciónneuronaltiende ahacerel errordecontrol igualacero,yreemplazandoelvalordevN(k)expresadopor(23):

D

e(k+1)+e(k)

G(k) ˜−␦

=−wT(k)((k))

+w˜T(k)␰(␨(k))−␧ (39) eigualandoambosmiembrosen(39),queda:

D(e(k+1)+e(k))=w˜T(k)␰(␨(k))−␧

G(k) ˜−␦=wT(k)((k)) (40)

Reescribiendo(39):

(7)

Expresando(41)enfuncióndesuscomponentes:

ev(k+1)=−vev(k)+˝−11

˜ wTv(k)␰(␨(k))−εv

eω(k+1)=−ωeω(k)+˝−21

˜ wTω(k)␰(␨(k))−εω

(42)

ConsiderandolafuncióncandidatadeLyapunovparaelanálisis deestabilidad:

V(k)=eT(k)e(k)=

i=v,ω

e2i(k)=e2v(k)+e2ω(k) (43)

dondeelsubíndiceiindicasicorrespondealoselementosde

v

o deω.

LaecuaciónendiferenciasdeLyapunovexpresadaenfunción deloscomponentesdeerrordevelocidadqueda:

V(k)=eT(k+1)e(k+1)eT(k)e(k)= i=v,ω [e2 i(k+1)−e 2 i(k)] (44) Reemplazando(42)en(43): V(k)= i=v,ω

2 i −1

e2 i(k)−... −2ei(k)Ti˝−i1

˜ wTi␰((k))−εi

+˝−2 i

˜ wTi␰((k))−εi

2

(45)

Calculandolasraícesdelaecuación(45)paradeterminarlacota deerrordecontrol,seobtiene:

− b 2a±

!

b24ac 2a =− T i˝− 1 i

˜ wTi((k))−εi

2 i −1

±... ˝−i1

"

2 i

˜ wTi␰((k))−εi

2 −

2 i−1

˜ wTi␰((k))−εi

2

2 i−1

(46)

Elerrorquedaacotadopor:

##

ei(k)##≥

2

w˜Ti␰((k))−εi

˝i(i+1)

(47)

De(47)paragarantizarqueV(k) seanegativoydeestaforma elsistemadecontrolpropuestoseaasintóticamenteestablesedebe cumplir:

min##ev(k)##,

##

eω(k)##≥

2

w˜Ti␰((k))−εi

min(D) min(+I)

(48)

LocualimplicaV(k)0.Estoasegura quee(k)Bı˜e está acotado.

Conesteresultadoseregresaal análisisdelcomportamiento delerrordecontroldetrayectoria ˜h(k).Abandonandolasuposición inicialdeunseguimientoperfectodevelocidaddeloscontroladores cinemáticosdelasección3,(8)sereescribeahoracomo:

˜ rx(k+1) ˜ ry(k+1)

+

lx 0 0 ly

tanh

k x lx ˜ rx(k)

tanh

ky lyr˜y(k)

=

ε1(k) ε2(k)

(49)

dondeelvectordeerrorε(k)=

ε1(k) ε2(k)

T

eselerrordela velocidaddeseguimiento previamentedefinidocomo(k)e(k). Siendolamatriz(k): (k)=T0

cos (k) −asin (k) sin (k) acos (k) (50) De(49)hacemos: L

h(˜ k)

=

lx 0 0 ly

tanh

k x lx ˜ rx(k)

tanh

ky ly ˜ ry(k)

(51)

Reescribiendo(49)en formacompacta, para peque ˜nos erro-resdecontrol,sepuedeaproximarL

h˜(k)

Kxyh˜(k) conKxy=

diag

kx,ky

˜

h(k+1)+Kxyh(˜ k)=e(k) (52)

ConsiderandolafuncióncandidatadeLyapunov:

V(k)=1 2h˜

T

(k) ˜h(k)>0, (53)

Ladiferenciadiscretaes: V(k)=V(k+1)−V(k) =h˜T(k+1) ˜h(k+1)h˜T(k) ˜h(k) =eT(k)T e(k)−2eT(k)T Kxyh˜(k)+ ˜ hT(k)KTxyKxyh˜(k)−h˜ T (k) ˜h(k) (54)

LacondiciónsuficienteparaqueVseanegativa:

I

K2xy

h(˜ k)2≥

2

e(

k)2+2

K

xy

e(

k)h(˜ k)

(55)

Calculandolaraícesdelaecuación(65):

h˜ >−2

K

xy

e

(k) 2

I

Kxy2

±

"

4

2

K

xy

2

e

(k)2+4

I

Kxy2

e(

k) 2

2 2

I

K2xy

= −2

K

xy

e

(k)±2

e(k) 2

I

K2xy

(56)

La condición suficiente para estabilidad asintótica para que V≤0puedaserexpresadacomo:

h˜

1−

K

xy

e(

k)

I

K2xy

(57)

EstoimplicaqueV<0.Asegurandoque ˜h→Bıh˜.

Estoconstituyeunresultadoprácticoquepermiteafirmarqueel errordecontroldeposiciónquedafinalmenteacotadoentérminos delerrordeaproximacióndelalgoritmoneuronalde compensa-ción.

5. Resultadosexperimentales

ElrobotmóvilPioneer2-DXposeeabordounaPCPentiumIII con800MHzy512MbdememoriaRAM(fig.4),ylosalgoritmosde controlpropuestoseaplicaronenelrobotqueadmitevelocidades linealesyangulares,comolasse ˜nalesdeentradadereferencia.El controladorfueinicializadoconlosparámetrosdinámicosdelrobot Pioneer3-DXyseusaron5neuronasRBF(M=5).Losparámetros dinámicosfueronobtenidosatravésdelaidentificación,segúnlo propuestoporSongyGrizzle[21].

El objetivo del experimento es demostrar que para distin-tas velocidades y distintas trayectorias el robot móvil sigue la

(8)

trayectoriadereferencialomásfielmenteposibleconelmenor error.Elrobotdebeseguirunatrayectoriaindicadapor:

rxs=0,3sin(0,05kT0)

rys=1,5sin(0,025kT0)

(58)

En el experimento, el robot comienza en la posición (rx,ry)=(0,0)mysigueunatrayectoriadereferenciaenformade 8horizontal(58).Elexperimentoserealizóusandoelalgoritmo decompensación neuronalyse comparóconotroexperimento desactivandoelalgoritmodecompensaciónneuronal.Los resul-tadossedescribenacontinuación.

Lasfiguras5y6describenlasvelocidadesyaccionesde con-troldelcompensadorneuronalRBF,asícomolasreferenciasylas variablesdeposicióndelrobotmóvil,respectivamente.Lafigura7 muestralatrayectoriaseguidaporelrobotmóvil,sincompensación yconelcompensadorneuronaladaptableparaelseguimientodela trayectoriadeseada.Seobservaclaramenteendichafiguraqueel robotconcompensadorneuronalsiguemásfielmentelatrayectoria deseada.

Lafigura8muestralanormadelerrordetrayectoriadelos con-troladoresconysincompensación.Elerrordetrayectoriasedefine comoladistanciainstantáneaentrelareferenciaylaposicióndel robot.Tambiénmuestraqueelerrorconcompensadorneuronal discretoesmenorcuando losparámetrosdinámicos noson los correctos,debidoalamalasintoníadelcontroladoroporqueestos hanvariadoaconsecuenciadeperturbacionesexternas.

Figura4.RobotMóvilPioneer2DX.

0 20 40 60 80 100 120 140 160 180 200 -0,2 0 0,2 0,4 0,6 Tiempo (seg.) V e l. lin e a l (m ./ s e c .)

Accion Control C/Comp. Neural

νd ref ν 0 20 40 60 80 100 120 140 160 180 200 -0.5 0 0.5 1 Tiempo (seg.) V e l. a n g . (r a d ./s e g .)

Accion Control C/Comp. Neural

ωd ref

ω

Figura5.Velocidadeslinearyangulardelrobotyaccionesdecontroldel controla-dorconcompensadorneural.

0 20 40 60 80 100 120 140 160 180 200 -2 -1 0 1 2 Pos. Robot Ref. Pos. X 0 20 40 60 80 100 120 140 160 180 200 -0,4 -0,2 0 0,2 0,4 Pos. Robot Ref. Pos. Y

Figura6. Referenciadeposiciónyposicióninstantáneadelrobotmóvil.

-2 -1,5 -1 -0,5 0 0,5 1 1,5 2 -0,4 -0,3 -0,2 -0,1 0 0,1 0,2 0,3 0,4 Dist. X (m) Dist. Y (m) Ref. Tray. Comp Tray. S/Comp

Figura7. Trayectoriadereferenciayposicióninstantáneadelrobotenelplanode coordenadasX-Y. 0 20 40 60 80 100 120 140 160 180 200 0 0,05 0,1 0,15 0,2 0,25 Tiempo (seg.) Error de trayectoria (m)

Norma del Error

Err. Comp Err. S/Comp

Figura8. Normadelerrordedistanciaconcompensadorneuronal.Elerrorgraficado conlíneadetrazoindicasincompensación;enlíneacontinua,concompensación neuronal.

En el experimento no se utilizó un sistema de referencia absoluto. Se comparó el controlador sin compensación y con compensación, y se muestra que coneste último se mejora el seguimiento.Elmismoresultadoseesperaríaconunsistemade referenciaabsoluto.

(9)

6. Conclusiones

Enestetrabajosepropusounalgoritmodecompensación neu-ronaladaptableparaelseguimientodelatrayectoriadeunrobot móvildeltipouniciclo.Estecompensador,juntoalcontroladorno lineal,escapazdegenerarloscomandosdevelocidadconmínimo errorparaelmismo.Se demostróque loserroresdecontrolde seguimientoestánacotados, yque loslímitessoncalculadosen funcióndelerrordeaproximacióndelaredneuronalRBF.

ElalgoritmoneuronaladaptableRBFaprendeladiferenciaentre unadinámicanominalconocidayladinámicarealdelrobotparasu posteriorcompensación.Porlotanto,elesfuerzocomputacionales significativamentemenorqueunmodelocompletodeRNinversa quetuvieraqueaprendertodaladinámicadelrobot.Losresultados experimentalesmuestranelbuendesempe ˜nodelcontroladorde seguimientopropuestoysucapacidadparaadaptarsealadinámica derobotsreales.

Apéndice1. Listadodevariables

v

Velocidadlinealdelrobotmóvil

ω Velocidadangulardesarrolladaporelrobotmóvil

v

Vectordevelocidadesdelrobotmóvil

rx,ry Coordenadasdelrobot(pto.h)enelplanoXY

h Vectordeinterésconcoordenadasrx,ryenelplanoXY

G Centrodemasadelrobot

C Posicióndelaruedacastor

E Ubicacióndelaherramienta

␺ Orientacióndelrobot

a Distanciaentreelpuntodeinterésyelpuntocentraldel ejevirtualvinculadoalasruedasdetracción

␦ Vectordeincertidumbresdelrobot

␽ Vectordeparámetrosdelrobot(tiempocontinuo) ␽i Elementosdelvectordeparámetros(tiempocontinuo)

dondei=1,...,6

Vectordeparámetrosdelrobot(tiempodiscreto) ˝i Elementos delvector de parámetros(tiempodiscreto)

dondei=1,...,6

D Matrizdiagonaldiag(˝1,˝2)

T0 Periododemuestreo

k Índicedetiempodiscreto

M NúmerodeneuronasRBF

wv,ω(k) PesosdesalidadelaredneuronalRBF

˜

wv,ω(k) Errordepesosdesalida

wv Pesosóptimosdesalida i(.) FuncionesRBF

T(.) VectordefuncionesRBF ␭ Constantedelafuncióni(.)

ci Vectordecentrosasociadosalafuncióni(.)

vN(k) VectordesalidadelaredRBF

vc

ref(k) Vectordesalidadelcontroladorcinemático

vd

ref(k) Vectordesalidadelcontroladordinámico

vref(k) Vectorde accióndecontroltotal para ladinámicadel

robot(

v

ref(k)=

v

refd (k)−

v

N(k))

Pv,ω(k)∈MxM Matrizdecovarianzadelerrordepredicción

wv,ω(k)∈Mx1 Estimacióndelvectordepesosdesalida

Factordeaprendizaje(0<<1)

Kv,ω(k)∈Mx1 VectordegananciadeKalman.v,ω(k)∈MxMes

lamatrizdecovarianzadelruidoqueafectalosestados (pesos)

Rv,ω(k)∈1x1 Matrizdecovarianzadelruidodemedición

Hvω∈Mx1 Matrizdemedición

J(k)∈1x1 Funcionaldecostoqueesusadoparalalocalizaciónde centrosdelaRBF

e(k)2x1 Vector de error de velocidades de salida, siendo e(k)=[ev(k),eω(k)]T

ev,ω(k)∈1x1 Errordesalida,para

v

yωrespectivamente

␧∈2x1 Vectordeperturbaciones(acotado) (k) MatrizT0

cos (k) −asin (k) ; sin (k) acos (k)

Bibliografía

[1] W.Wu,H.Chen,Y.Wang,P.Woo,AdaptiveExponentialStabilizationofMobile RobotswithUncertainties,en:ProceedingsoftheIEEE38thConferenceon DecisionandControl,Phoenix,Arizona,EE.UU.,1999,pp.3484–3489. [2]F.Künhe,J.Gomes,W.Fetter,MobileRobotTrajectoryTrackingUsingModel

PredictiveControl,en:IIIEEELatin-AmericanRoboticsSymposium,SãoLuis, Brasil,2005.

[3]L.Gracia,J.Tornero,Kinematiccontrolofwheeledmobilerobots,Lat.Am.Appl. Res.38(2008)7–16.

[4]S.Liu,H.Zhang,S.X.Yang,J.Yu,DynamicControlofaMobileRobotUsingan AdaptiveNeurodynamicsandSlidingModeStrategy,en:Proceedingsofthe 5thWorldCongressonIntelligentControlandAutomation,Hangzhou,China, 2004,pp.5007–5011.

[5]W.Dong,Y.Guo,Dynamictrackingcontrolofuncertainmobilerobots,IEEE/RSJ InternationalConferenceonIntelligentRobotsandSystems(2005)2774–2779. [6] Y.Liyong,X.Wei,AnAdaptiveTrackingMethodforNon-holonomic Whee-ledMobileRobots,en:Proceedingsofthe26thChineseControlConference, Zhangjiajie,Hunan,China,July26-31,2007.

[7] V.S.K.Chaitanya,P.K.Sarkar,ANeuralNetworkAlgorithmfortheError Opti-mizationinthePathTrackingControlofaMobileRobot,en:International JointConferenceonNeuralNetworksSheratonVancouverWallCentreHotel, Vancouver,BC,Canada,July16-21,2006.

[8] T.Das,I.N.Kar,Designandimplementationofanadaptivefuzzylogic-based controller forwheeledmobilerobots,IEEETrans.ControlSyst.14(2006) 501–510.

[9]T.Fukao,H.Nakagawa,N.Adachi,AdaptiveTrackingControlofaMobileRobot, IEEERobot&Autom16(2000)609–615.

[10] J.Velagic,N.Osmic,B.Lacevic,Neuralnetworkcontrollerformobilerobot motioncontrol,WASETV47(2008)93–198.

[11]W.Dong,W.Huo,TrackingControlofWheeledMobileRobotswithUnknown Dynamics,en:ProceedingsoftheIEEEInternationalConferenceonRobotics& Automation,Detroit,Michigan,1999,pp.2645–2650.

[12]F.N.Martins,C.C.Wanderley,R.Carelli,M.SarcinelliFilho,T.F.BastosFilho,An adaptivedynamiccontrollerforautonomousmobilerobottrajectorytracking, ControlEng.Pract.16(2008)1354–1363.

[13]F.G.Rossomando,C.Soria,R.Carelli,Controlderobotsmóvilescon incertidum-bresdinámicasusandoredesdebaseradial,Rev.Iberoam.Autom.Inf.Ind.7 (2010)28–35.

[14] M.K.Bugeja,S.G.Fabri,L.Camilleri,Dualadaptivedynamiccontrolofmobile robotsusingneuralnetworks,IEEETrans.Syst.ManCybern.39(2009)129–141. [15]A.Fel’dbaum,OptimalControlSystems,AcademicPress,NewYork,NY,1965. [16]A.Y.Alanis,E.N.Sanchez,A.G.Loukianov,Discrete-timeadaptivebackstepping

nonlinearcontrolviahigh-orderneuralnetworks,IEEETrans.NeuralNetworks 18(2007)1185–1195.

[17]M.S.Kim,J.H.Shin,J.J.Lee,DesignofaRobustAdaptiveControllerforaMobile Robot,Proceedings oftheIEEE/RSJInternationalConferenceonIntelligent RobotsandSystems(2000)1816–1821.

[18]C.DelaCruz,R.Carelli,DynamicModelingandCentralizedFormationControl ofMobileRobots,en:32ndAnnualConferenceoftheIEEEIndustrialElectronics SocietyIECON,París,2006.

[19]S.Haykin,KalmanFilteringandNeuralNetworks,JohnWiley&Sons,Inc,2001. [20]S.Haykin,NeuralNetworks:AComprehensiveFoundation,2ndedition,

Pren-ticeHall,2001.

[21]Y.Song,J.W.Grizzle,TheextendedKalmanfilteraslocalasymptoticobserver fordiscrete-timenonlinearsystem,JMSEC5(1995)59–78.

Referencias

Documento similar