• No se han encontrado resultados

Parte V AP´ ENDICES Y REFERENCIAS

A.3. Adaptaci´ on, Evoluci´ on y Aprendizaje

¿Qu´e entendemos por adaptaci´on?

El t´ermino adaptaci´on surge principalmente en el ´ambito biol´ogico como un inten- to por estudiar la relaci´on que hay entre las caracter´ısticas (estructura anat´omica, procesos fisiol´ogicos o rasgos del comportamiento) de los seres vivos y su medio ambiente. Observando que existe una correlaci´on fuerte fue necesario atribuir este hecho a un proceso. A este proceso se le atribuy´o una finalidad u objetivo que no era otro sino el principio Teleol´ogico de la generaci´on de caracter´ısticas ´optimas para desenvolverse en su ambiente. Con la llegada de la teor´ıa de la selecci´on natural la finalidad pas´o a ser casi una met´afora. Sin embargo a´un metaf´oricamente puede decirse que hay un objetivo y ´este es la supervivencia mediante la reproducci´on. As´ı, el proceso adaptativo es una tendencia a mantener esta correlaci´on y ´esta es controlada por las condiciones ambientales.

Actualmente en biolog´ıa el t´ermino adaptaci´on tiene un significado claro y conci- so: una adaptaci´on biol´ogica es una estructura anat´omica, un proceso fisiol´ogico o un rasgo del comportamiento de un organismo que ha evolucionado durante un per´ıodo de tiempo mediante selecci´on natural de manera tal que incrementa sus expectativas a largo plazo para reproducirse con ´exito. Pero esto no es todo, tambi´en se utiliza el t´ermino adaptaci´on no como una caracter´ıstica sino como un proceso por medio del cual los seres vivos adquieren mayor eficacia en t´erminos de supervivencia y repro- ducci´on en su medio ambiente. La adaptaci´on como proceso es tambi´en confundida con el t´ermino evoluci´on.

Aqu´ı, en la presente investigaci´on se utilizar´a la definici´on de adaptaci´on como proceso. Se utilizar´a el t´ermino evoluci´on como un mecanismo formal por el cual

se produce un tipo espec´ıfico de adaptaci´on y se denominar´a a las adaptaciones biol´ogicas simplemente caracter´ısticas (estructura anat´omica, procesos fisiol´ogicos o rasgos del comportamiento) adaptadas.

Tomando esto como punto de partida se procede a formalizar las siguientes defi- niciones:

Definici´on A.9 (Adaptaci´on Biol´ogica).

Todo proceso por medio del cual un ser vivo incrementa la correlaci´on entre su estructura y el ambiente resultando en un incremento de sus probabilidades de su- pervivencia y reproducci´on.

Podr´ıa decirse a manera de cr´ıtica a esta definici´on lo siguiente: ¿que sucede si ocurre un proceso fortuito ajeno al ser vivo y como resultado de este proceso el sistema incrementa sus probabilidades de supervivencia y reproducci´on?

Pues bien, es precisamente esto la clave para entender el proceso de Adaptaci´on en su forma m´as general. La adaptaci´on no es necesariamente un proceso cuyo motor es el ser vivo, puede ser tanto un proceso fortuito ambiental como un proceso realizado por el propio ser vivo.

Definici´on A.10 (Adaptaci´on).

Todo proceso mediante el cual un sistema incrementa la correlaci´on entre su estruc- tura y su ambiente.

Es aqu´ı donde precisamente se puede introducir el concepto de sistema adapta- tivo.

Definici´on A.11 (Sistema Adaptativo).

Un sistema adaptativo es un conjunto de elementos interrelacionados que inter- act´uan entre s´ı, y que posee al menos un proceso interno (propio del sistema) que controla la adaptaci´on del sistema, es decir, la correlaci´on entre estructura, funci´on o conducta y su ambiente para incrementar su eficiencia en el cumplimiento de sus objetivos. Este proceso interno se denominar´a con el t´ermino de proceso adaptativo.

En el caso de los sistemas biol´ogicos evolutivos los procesos de adaptaci´on son la reproducci´on y la extinci´on y su objetivo es la no extinci´on. En el caso de los sistemas adaptativos artificiales por ejemplo, lo que se define primero es el objetivo y luego se dise˜nan los procesos de adaptaci´on de manera tal que el sistema pueda incrementar su efectividad para cumplir sus objetivos. El aprendizaje, por ejemplo, es un tipo de proceso adaptativo que se da en los seres vivos y en los sistemas con cierto nivel de complejidad.

Se definir´a el aprendizaje de tal forma que sea aplicable a un sistema en general. Para ello es necesario primero definir otro concepto fundamental: “La Memoria”.

Definici´on A.12 (Memoria).

La memoria es un proceso adaptativo cuya caracter´ıstica principal es que por medio de este, los sistemas pueden almacenar informaci´on sobre los est´ımulos que han experimentado y reproducir esta informaci´on posteriormente.

La forma en la cual es almacenada esta informaci´on es el “soporte f´ısico” de la memoria, que algunas veces es confundido con el proceso en s´ı.

Definici´on A.13 (Aprendizaje).

El aprendizaje es un tipo de proceso adaptativo cuya principal caracter´ıstica es el uso de alg´un proceso de memoria con el fin de incrementar la eficacia del sistema para cumplir sus objetivos.

Hay muchos tipos de aprendizaje, sin embargo ´estos suelen estar catalogados en dos ramas principales, el aprendizaje inductivo y el aprendizaje deductivo, aqu´ı estas ramas no molestan, as´ı que es mejor dejarlas tranquilas y enfocarse m´as bien en otras divisiones m´as ´utiles para esta investigaci´on.

Se podr´ıa dividir el aprendizaje nuevamente en 2 categor´ıas, el aprendizaje su- pervisado y el no supervisado.

El aprendizaje supervisado consiste en que, dado un problema de aprendizaje determinado, existe un supervisor que le dice al sistema de forma expl´ıcita como comportarse ante un conjunto significativo de situaciones y el sistema, mediante alg´un proceso o algoritmo de aprendizaje, se adapta y responde dentro de alg´un margen suficiente de error de forma correcta con las acciones proporcionadas por el supervisor o acciones parecidas a las introducidas por el supervisor ante est´ımulos parecidos a la situaciones presentadas por el supervisor.

El aprendizaje no supervisado consiste en que, dado un problema de aprendizaje determinado, se espera que el sistema act´ue de la forma esperada sin que exista un supervisor que le indique que acciones debe tomar. Algunas formas comunes de aprendizaje no supervisado la representan algunos modelos de redes neuronales que forman categor´ıas de forma autom´atica.

Otro ejemplo de aprendizaje no supervisado es el aprendizaje por medio del ensayo y el error. Esta forma de aprendizaje puede ser mixta en el sentido de que al sistema no se le instruye cu´ales acciones tomar, sino por el contrario se le dice qu´e tan bien lo est´a haciendo o qu´e tan buena ha sido su ´ultima acci´on y el sistema siguiendo la ley del efecto (Thorndike, 1927) modifica su estructura. Esta ´ultima idea es el germen de lo que hoy conocemos como Aprendizaje por Refuerzo.

El Aprendizaje por Refuerzo es un tipo especial de Aprendizaje que utiliza los est´ımulos experimentados por un sistema para modificar su conducta tendiendo a incrementar o decrementar ciertas conductas como consecuencia de un tipo especial de est´ımulo llamado Reforzador.

Definici´on A.14 (Reforzador).

Dado un sistemaS y su conducta (a) posterior a un est´ımulo (E), un Reforzador (R) es todo est´ımulo que afecta al sistema S de forma tal que la probabilidad P(a|E) de que el sistema exhiba la conducta (a) cuando el sistema es afectado por el est´ımu- lo precedente (E) se incrementa o decrementa. Cuando la probabilidad P(a|E) se incrementa decimos que el est´ımulo (R) es un Reforzador positivo y lo denotamos por (R+) y cuando se decrementa decimos que el est´ımulo (R) es un Reforzador negativo y lo denotamos por (R).

La Probabilidad de Error Bayesiano y el M´etodo

k-NN

El criterio de selecci´on de Bayes minimiza la probabilidad de una clasificaci´on incorrecta. Esto es llevado a cabo mediante la clasificaci´on de una observaci´onx en su clase m´as probable siguiendo la teor´ıa bayesiana.

As´ı, para un conjunto C = [w1, w2, w3, ..., wn] de clases, podemos describir la

m´axima probabilidad condicional como: P(wm|x) = m´ax

i P(wi|x), (B.1)

de esta forma se denotar´a la probabilidad condicional bayesiana (eb) de una clasifi-

caci´on err´onea como:

P∗(eb|x) = 1−P(wm|x), (B.2)

dondeeb es la probabilidad de error de clasificaci´on.

As´ı, mediante el average sobre la distribuci´on a priori de una observaci´on x te- nemos que: P∗ = Z P∗(eb|x)p(x)dx = Z [1P(wm|x)]p(x)dx (B.3)

B.0.1. An´alisis de la Probabilidad de Error en el M´etodo de los

Vecinos m´as Pr´oximos (k-NN)

Se denotar´a comoθa la clase correcta dexy comoθnla etiqueta de clase asignada

axn, dondexn es el vecino m´as cercano a xpara una m´etrica definida.

Est´a claro que x y θ son par´ametros aleatorios introducidos al sistema. Es sig- nificativo tambi´en, que la estad´ıstica subyacente del espacio etiquetado es tambi´en aleatoria.

Como punto final se hace ´enfasis en que la probabilidad de que x pertenezca a la clase θ y la probabilidad de que xn sea etiquetado con la clase θn son indepen-

dientes. As´ı, se puede escribir la siguiente expresi´on acerca de las probabilidades de clasificaci´on de x y xn:

P(θ, θn|x, xn) =P(θ|x)P(θn|xn) (B.4)

As´ı, para un conjuntoC = [w1, w2, w3, ..., wn] de clases se definir´a la probabilidad de que el m´etodo del vecino m´as cercano produzca una clasificaci´on correcta cuando θ y θn coinciden en una cierta clase wi, donde 1≤i≤ |C| de la siguiente forma:

P(θ =wi, θn =wi |x, xn), (B.5)

y as´ı la probabilidad condicional del error de clasificaci´on e puede ser expresada como: Pn(e|x, xn) = 1− |C| X i=1 P(θ =wi, θn =wi |x, xn) = 1 |C| X i=1 P(wi|x)P(wi|xn) (B.6)

Ahora es posible seguir un procedimiento para estimar las cotas del error de cla- sificaci´on para el m´etodo del vecino m´as cercano suponiendo quentiende al infinito. Se puede observar que a medida que n se aproxima al infinito el espacio de ob- jetos etiquetados comienza a ser cubierto por completo y de esta forma el vecino m´as pr´oximo dex tender´a a ser xi con probabilidad1.

De esta forma se puede escribir: l´ım

x→∞P(e|x, xn) = l´ımx→∞P(e|x, x) = l´ımx→∞P(e|x) (B.7) Tomando el l´ımite a la probabilidad condicional P(e|x, xn) en la ecuaci´on (B.7) tenemos que: l´ım x→∞P(e|x) = 1− |C| X i=1 P2(wi|x), (B.8)

y dividiendo el sumatorio en dos partes convenientes tenemos que: |C| X i=1 P2(wi|x) =P2(wm|x) + X i6=m P2(wi|x) (B.9)

P∗(eb|x) = 1P(wm|x) error bayesiano (B.10) X i6=m P2(wi|x) = 1−P(wm|x) = P∗(eb|x) (B.11) X i6=m

P2(wi|x) es m´ınimo para probabilidades a posteriori iguales, (B.12)

podemos escribir: |C| X i=1 P2(wi|x)[1P∗(eb|x)]2+P ∗2(e b|x) c1 (B.13) P(e|x)[1P∗(eb|x)]2+ P∗2(eb|x) c1 (B.14)

Y finalmente, luego de algunas simplificaciones: P(e|x)2P∗(eb|x)−

c c1P

∗2(e

b|x) (B.15)

Entonces, puede verse que la cota superior de la probabilidad de error para la regla del vecino m´as cercano P(e|x) es menor o igual que dos veces el error bayesiano. As´ı, se establece la cota de la probabilidad de error del m´etodo del vecino m´as cercano con el siguiente resultado fundamental:

P∗(eb|x)≤P(e|x)≤2P∗(eb|x) (B.16)

De esta forma se observa que la regla del m´etodo k-NN es una aproximaci´on emp´ırica que se ajusta a los m´etodos de toma de decisiones ´optimas seg´un la teor´ıa bayesiana y que garantiza una cota de error controlada sobre ´esta.

Albus, J. (1975). A new approach to manipulator control: The cerebellar model articulation controller (CMAC). ASM J. of Dyanmic Systems, Measurement, and Control, 97:220–227.

Ashby, W. R. (1948). The homeostat. Electronic Engineering, 20:380ff. Aubin, J.-P. (1991). Viability Theory. Birkh¨auser.

Barto, A. G., Sutton, R. S., y Watkins, C. (1990). Learning and sequential decision making, pp. 539–602. MIT Press.

Borenstein, J. y Koren, Y. (1989). Real-time obstacle avoidance for fast mobile robots. IEEE Transactions on Systems, Man, and Cybernetics, 19(5):1179–1187. Borenstein, J. y Koren, Y. (1991). The vector field histogram - fast obstacle avoidan- ce for mobile robots. IEEE Transactions on Robotics and Automation, 7(3):278–288. Brooks, R. A. (1990). Elephants don’t play chess. Robotics and Autonomous Sys- tems, 6(1&2):3–15.

Brooks, R. A. (1991a). Intelligence without reason. En Proc. 12th Int. Joint Conf. on Artificial Intelligence (IJCAI-91), pp. 569–595, Sydney, Australia.

Brooks, R. A. (1991b). Intelligence without representation. Artificial Intelligence Journal, 47:139–159.

Butz, M., Sigaud, O., y G´erard, P., editores (2003). Anticipatory Behavior in Adap- tive Learning Systems, Foundations, Theories, and Systems, volume 2684 ofLNCS. Springer.

Cannon, W. (1932). The wisdom of the body. W.W. Norton & Company, Inc. Cliff, D. y Miller, G. F. (1996). Co-evolution of pursuit and evasion II: Simulation methods and results. En Maes, P., Mataric, M. J., Meyer, J.-A., Pollack, J. B., y Wilson, S. W., editores, From animals to animats 4, pp. 506–515, Cambridge, MA. MIT Press. Proc. of the Fourth Int. Conf. on Simulation of Adaptive Behaviour. Connel, J. y Mahadevan, S., editores (1993). Robot Learning. Kluwer Academic, Boston, 1 edici´on.

Cover, T. M. y Hart, P. E. (1967). Nearest neighbor pattern classification. IEEE Transactions on Information Theory, IT-13(1):21–7.

Davidsson, P. (1997). Linearly anticipatory autonomous agents. En Agents, pp. 490–491.

de Castro, L. N. y Timmis, J. (2002). Artificial Immune Systems: A New Compu- tational Intelligence Paradigm. Springer Verlag.

de Lope Asia´ın, J. (1998). Modelado de entornos con t´ecnicas de basadas en Redes de Petri Borrosas para la exploraci´on y planificaci´on de robots autonomos. PhD thesis, Facultad de Inform´atica, Universidad Polit´ecnica de Madrid.

Demiris, J. (1995). Book review: Robot learning by jonathan h. connell and sridhar mahadevan (kluwer academic publishers, 1993). SIGART Bull., 6(4):18–19.

Der, R. (2000). Self-organized robot behavior from the principle of homeokinesis. Der, R. (2003). Homeokinesis and the moderation of complexity in neural systems. Driver, P. y Humphries, D. (1988). Protean behavior: The biology of unpredictability.

Oxford University Press.

Duda, R. O. y Hart, P. E. (1973). Pattern Classification and Scene Analysis. Wiley. Dudani, S. A. (1976). The distance-weighted k-nearest-neighbor rule. IEEE Tran- sactions on Systems, Man and Cybernetics, SMC-6, 4:325–327.

Edelman, G. M. (1987). Neural Darwinism – The Theory of Neuronal Group Selec- tion. Basic Books.

Documento similar