Adaptaci´ on, Evoluci´ on y Aprendizaje - AP´ ENDICES Y REFERENCIAS

Parte V AP´ ENDICES Y REFERENCIAS

A.3. Adaptaci´ on, Evoluci´ on y Aprendizaje

¿Qu´e entendemos por adaptaci´on?

El término adaptación surge principalmente en el ámbito biológico como un inten- to por estudiar la relación que hay entre las caracter´ısticas (estructura anatómica, procesos fisiológicos o rasgos del comportamiento) de los seres vivos y su medio ambiente. Observando que existe una correlación fuerte fue necesario atribuir este hecho a un proceso. A este proceso se le atribuyó una finalidad u objetivo que no era otro sino el principio Teleológico de la generación de caracter´ısticas óptimas para desenvolverse en su ambiente. Con la llegada de la teor´ıa de la selección natural la finalidad pasó a ser casi una metáfora. Sin embargo aún metafóricamente puede decirse que hay un objetivo y éste es la supervivencia mediante la reproducción. As´ı, el proceso adaptativo es una tendencia a mantener esta correlación y ésta es controlada por las condiciones ambientales.

Actualmente en biolog´ıa el término adaptación tiene un significado claro y conci- so: una adaptación biológica es una estructura anatómica, un proceso fisiológico o un rasgo del comportamiento de un organismo que ha evolucionado durante un per´ıodo de tiempo mediante selección natural de manera tal que incrementa sus expectativas a largo plazo para reproducirse con éxito. Pero esto no es todo, también se utiliza el término adaptación no como una caracter´ıstica sino como un proceso por medio del cual los seres vivos adquieren mayor eficacia en términos de supervivencia y repro- ducción en su medio ambiente. La adaptación como proceso es también confundida con el término evolución.

Aqu´ı, en la presente investigación se utilizará la definición de adaptación como proceso. Se utilizará el término evolución como un mecanismo formal por el cual

se produce un tipo espec´ıfico de adaptación y se denominará a las adaptaciones biológicas simplemente caracter´ısticas (estructura anatómica, procesos fisiológicos o rasgos del comportamiento) adaptadas.

Tomando esto como punto de partida se procede a formalizar las siguientes defi- niciones:

Definición A.9 (Adaptación Biológica).

Todo proceso por medio del cual un ser vivo incrementa la correlaci´on entre su estructura y el ambiente resultando en un incremento de sus probabilidades de supervivencia y reproducci´on.

Podr´ıa decirse a manera de cr´ıtica a esta definici´on lo siguiente: ¿que sucede si ocurre un proceso fortuito ajeno al ser vivo y como resultado de este proceso el sistema incrementa sus probabilidades de supervivencia y reproducci´on?

Pues bien, es precisamente esto la clave para entender el proceso de Adaptación en su forma más general. La adaptación no es necesariamente un proceso cuyo motor es el ser vivo, puede ser tanto un proceso fortuito ambiental como un proceso realizado por el propio ser vivo.

Definici´on A.10 (Adaptaci´on).

Todo proceso mediante el cual un sistema incrementa la correlaci´on entre su estructura y su ambiente.

Es aqu´ı donde precisamente se puede introducir el concepto de sistema adaptativo.

Definici´on A.11 (Sistema Adaptativo).

Un sistema adaptativo es un conjunto de elementos interrelacionados que inter- actúan entre s´ı, y que posee al menos un proceso interno (propio del sistema) que controla la adaptación del sistema, es decir, la correlación entre estructura, función o conducta y su ambiente para incrementar su eficiencia en el cumplimiento de sus objetivos. Este proceso interno se denominará con el término de proceso adaptativo.

En el caso de los sistemas biológicos evolutivos los procesos de adaptación son la reproducción y la extinción y su objetivo es la no extinción. En el caso de los sistemas adaptativos artificiales por ejemplo, lo que se define primero es el objetivo y luego se diseñan los procesos de adaptación de manera tal que el sistema pueda incrementar su efectividad para cumplir sus objetivos. El aprendizaje, por ejemplo, es un tipo de proceso adaptativo que se da en los seres vivos y en los sistemas con cierto nivel de complejidad.

Se definir´a el aprendizaje de tal forma que sea aplicable a un sistema en general. Para ello es necesario primero definir otro concepto fundamental: “La Memoria”.

Definici´on A.12 (Memoria).

La memoria es un proceso adaptativo cuya caracter´ıstica principal es que por medio de este, los sistemas pueden almacenar informaci´on sobre los est´ımulos que han experimentado y reproducir esta informaci´on posteriormente.

La forma en la cual es almacenada esta informaci´on es el “soporte f´ısico” de la memoria, que algunas veces es confundido con el proceso en s´ı.

Definici´on A.13 (Aprendizaje).

El aprendizaje es un tipo de proceso adaptativo cuya principal caracter´ıstica es el uso de alg´un proceso de memoria con el fin de incrementar la eficacia del sistema para cumplir sus objetivos.

Hay muchos tipos de aprendizaje, sin embargo éstos suelen estar catalogados en dos ramas principales, el aprendizaje inductivo y el aprendizaje deductivo, aqu´ı estas ramas no molestan, as´ı que es mejor dejarlas tranquilas y enfocarse más bien en otras divisiones más útiles para esta investigación.

Se podr´ıa dividir el aprendizaje nuevamente en 2 categor´ıas, el aprendizaje supervisado y el no supervisado.

El aprendizaje supervisado consiste en que, dado un problema de aprendizaje determinado, existe un supervisor que le dice al sistema de forma expl´ıcita como comportarse ante un conjunto significativo de situaciones y el sistema, mediante alg´un proceso o algoritmo de aprendizaje, se adapta y responde dentro de alg´un margen suficiente de error de forma correcta con las acciones proporcionadas por el supervisor o acciones parecidas a las introducidas por el supervisor ante est´ımulos parecidos a la situaciones presentadas por el supervisor.

El aprendizaje no supervisado consiste en que, dado un problema de aprendizaje determinado, se espera que el sistema act´ue de la forma esperada sin que exista un supervisor que le indique que acciones debe tomar. Algunas formas comunes de aprendizaje no supervisado la representan algunos modelos de redes neuronales que forman categor´ıas de forma autom´atica.

Otro ejemplo de aprendizaje no supervisado es el aprendizaje por medio del ensayo y el error. Esta forma de aprendizaje puede ser mixta en el sentido de que al sistema no se le instruye cuáles acciones tomar, sino por el contrario se le dice qué tan bien lo está haciendo o qué tan buena ha sido su última acción y el sistema siguiendo la ley del efecto (Thorndike, 1927) modifica su estructura. Esta última idea es el germen de lo que hoy conocemos como Aprendizaje por Refuerzo.

El Aprendizaje por Refuerzo es un tipo especial de Aprendizaje que utiliza los est´ımulos experimentados por un sistema para modificar su conducta tendiendo a incrementar o decrementar ciertas conductas como consecuencia de un tipo especial de est´ımulo llamado Reforzador.

Definici´on A.14 (Reforzador).

Dado un sistemaS y su conducta (a) posterior a un est´ımulo (E), un Reforzador (R) es todo est´ımulo que afecta al sistema S de forma tal que la probabilidad P(a_|E) de que el sistema exhiba la conducta (a) cuando el sistema es afectado por el est´ımu- lo precedente (E) se incrementa o decrementa. Cuando la probabilidad P(a_|E) se incrementa decimos que el est´ımulo (R) es un Reforzador positivo y lo denotamos por (R+) y cuando se decrementa decimos que el est´ımulo (R) es un Reforzador negativo y lo denotamos por (R₋).

La Probabilidad de Error Bayesiano y el M´etodo

k-NN

El criterio de selección de Bayes minimiza la probabilidad de una clasificación incorrecta. Esto es llevado a cabo mediante la clasificación de una observaciónx en su clase más probable siguiendo la teor´ıa bayesiana.

As´ı, para un conjunto C = [w1, w2, w3, ..., wn] de clases, podemos describir la

m´axima probabilidad condicional como: P(w_m_|x) = m´ax

i P(wi|x), (B.1)

de esta forma se denotar´a la probabilidad condicional bayesiana (eb) de una clasifi-

caci´on err´onea como:

P∗(eb|x) = 1−P(wm|x), (B.2)

dondeeb es la probabilidad de error de clasificaci´on.

As´ı, mediante el average sobre la distribuci´on a priori de una observaci´on x tenemos que: P∗ = Z P∗(eb|x)p(x)dx = Z [1₋P(wm|x)]p(x)dx (B.3)

B.0.1. An´alisis de la Probabilidad de Error en el M´etodo de los

Vecinos m´as Pr´oximos (k-NN)

Se denotar´a comoθa la clase correcta dexy comoθnla etiqueta de clase asignada

ax_n, dondex_n es el vecino m´as cercano a xpara una m´etrica definida.

Está claro que x y θ son parámetros aleatorios introducidos al sistema. Es significativo también, que la estad´ıstica subyacente del espacio etiquetado es también aleatoria.

Como punto final se hace ´enfasis en que la probabilidad de que x pertenezca a la clase θ y la probabilidad de que xn sea etiquetado con la clase θn son indepen-

dientes. As´ı, se puede escribir la siguiente expresi´on acerca de las probabilidades de clasificaci´on de x y xn:

P(θ, θn|x, xn) =P(θ|x)P(θn|xn) (B.4)

As´ı, para un conjuntoC = [w₁, w₂, w₃, ..., w_n] de clases se definirá la probabilidad de que el método del vecino más cercano produzca una clasificación correcta cuando θ y θn coinciden en una cierta clase wi, donde 1≤i≤ |C| de la siguiente forma:

P(θ =wi, θn =wi |x, xn), (B.5)

y as´ı la probabilidad condicional del error de clasificaci´on e puede ser expresada como: Pn(e|x, xn) = 1− |C| X i=1 P(θ =wi, θn =wi |x, xn) = 1₋ |C| X i=1 P(wi|x)P(wi|xn) (B.6)

Ahora es posible seguir un procedimiento para estimar las cotas del error de cla- sificación para el método del vecino más cercano suponiendo quentiende al infinito. Se puede observar que a medida que n se aproxima al infinito el espacio de ob- jetos etiquetados comienza a ser cubierto por completo y de esta forma el vecino más próximo dex tenderá a ser xi con probabilidad1.

De esta forma se puede escribir: l´ım

x→∞P(e|x, xn) = l´ımx→∞P(e|x, x) = l´ımx→∞P(e|x) (B.7) Tomando el l´ımite a la probabilidad condicional P(e_|x, x_n) en la ecuaci´on (B.7) tenemos que: l´ım x→∞P(e|x) = 1− |C| X i=1 P2(wi|x), (B.8)

P2(wi|x) es m´ınimo para probabilidades a posteriori iguales, (B.12)

Y finalmente, luego de algunas simplificaciones: P(e_|x)_≤2P∗(eb|x)−

c c₋1P

∗2₍_e

b|x) (B.15)

Entonces, puede verse que la cota superior de la probabilidad de error para la regla del vecino más cercano P(e_|x) es menor o igual que dos veces el error bayesiano. As´ı, se establece la cota de la probabilidad de error del método del vecino más cercano con el siguiente resultado fundamental:

P∗(eb|x)≤P(e|x)≤2P∗(eb|x) (B.16)

De esta forma se observa que la regla del método k-NN es una aproximación emp´ırica que se ajusta a los métodos de toma de decisiones óptimas según la teor´ıa bayesiana y que garantiza una cota de error controlada sobre ésta.

Albus, J. (1975). A new approach to manipulator control: The cerebellar model articulation controller (CMAC). ASM J. of Dyanmic Systems, Measurement, and Control, 97:220–227.

Ashby, W. R. (1948). The homeostat. Electronic Engineering, 20:380ff. Aubin, J.-P. (1991). Viability Theory. Birkh¨auser.

Barto, A. G., Sutton, R. S., y Watkins, C. (1990). Learning and sequential decision making, pp. 539–602. MIT Press.

Borenstein, J. y Koren, Y. (1989). Real-time obstacle avoidance for fast mobile robots. IEEE Transactions on Systems, Man, and Cybernetics, 19(5):1179–1187. Borenstein, J. y Koren, Y. (1991). The vector field histogram - fast obstacle avoidance for mobile robots. IEEE Transactions on Robotics and Automation, 7(3):278–288. Brooks, R. A. (1990). Elephants don’t play chess. Robotics and Autonomous Sys- tems, 6(1&2):3–15.

Brooks, R. A. (1991a). Intelligence without reason. En Proc. 12th Int. Joint Conf. on Artificial Intelligence (IJCAI-91), pp. 569–595, Sydney, Australia.

Brooks, R. A. (1991b). Intelligence without representation. Artificial Intelligence Journal, 47:139–159.

Butz, M., Sigaud, O., y G´erard, P., editores (2003). Anticipatory Behavior in Adap- tive Learning Systems, Foundations, Theories, and Systems, volume 2684 ofLNCS. Springer.

Cannon, W. (1932). The wisdom of the body. W.W. Norton & Company, Inc. Cliff, D. y Miller, G. F. (1996). Co-evolution of pursuit and evasion II: Simulation methods and results. En Maes, P., Mataric, M. J., Meyer, J.-A., Pollack, J. B., y Wilson, S. W., editores, From animals to animats 4, pp. 506–515, Cambridge, MA. MIT Press. Proc. of the Fourth Int. Conf. on Simulation of Adaptive Behaviour. Connel, J. y Mahadevan, S., editores (1993). Robot Learning. Kluwer Academic, Boston, 1 edici´on.

Cover, T. M. y Hart, P. E. (1967). Nearest neighbor pattern classification. IEEE Transactions on Information Theory, IT-13(1):21–7.

Davidsson, P. (1997). Linearly anticipatory autonomous agents. En Agents, pp. 490–491.

de Castro, L. N. y Timmis, J. (2002). Artificial Immune Systems: A New Compu- tational Intelligence Paradigm. Springer Verlag.

de Lope Asia´ın, J. (1998). Modelado de entornos con técnicas de basadas en Redes de Petri Borrosas para la exploración y planificación de robots autonomos. PhD thesis, Facultad de Informática, Universidad Politécnica de Madrid.

Demiris, J. (1995). Book review: Robot learning by jonathan h. connell and sridhar mahadevan (kluwer academic publishers, 1993). SIGART Bull., 6(4):18–19.

Der, R. (2000). Self-organized robot behavior from the principle of homeokinesis. Der, R. (2003). Homeokinesis and the moderation of complexity in neural systems. Driver, P. y Humphries, D. (1988). Protean behavior: The biology of unpredictability.

Oxford University Press.

Duda, R. O. y Hart, P. E. (1973). Pattern Classification and Scene Analysis. Wiley. Dudani, S. A. (1976). The distance-weighted k-nearest-neighbor rule. IEEE Tran- sactions on Systems, Man and Cybernetics, SMC-6, 4:325–327.

Edelman, G. M. (1987). Neural Darwinism – The Theory of Neuronal Group Selec- tion. Basic Books.

In document Estudios sobre sistemas adaptativos con aplicaciones en la robótica autónoma y los agentes inteligentes (página 190-200)