cap2.pdf

(1)

Capítulo 2

(2)

Agentes Inteligentes

Un

agente

es cualquier cosa capaz de percibir

su medioambiente con la ayuda de

sensores

y

actuar en ese medio por medio de

actuadores

.

Podríamos hacer la analogía siguiente:

Los sensores son entradas

(3)

Agente sensores

?

Actuadores

medio

ambiente

(4)

Algunas definiciones

● Percepción

○ Cualquier tipo de evento sensado

● Secuencia de percepciones

○ El

historial

de todas las percepciones

● Función del agente

○ Define

el comportamiento del agente

○ Se implementa mediante el

programa del

agente

(5)

El mundo de la aspiradora

A B A B A B A B A B A B A B A B Acciones: ● Izquierda ● Derecha ● Aspirar ● HacerNada Percepciones ● [A, Limpio] ● [A, Sucio] ● [B, Limpio] ● [B, Sucio]

(6)

El mundo de la aspiradora

A B A B A B A B A B A B A B A B 1 2 3 4 5 7 8 6

¿Como sería la función del agente? Secuencia de

percepciones

(7)

Buen comportamiento:

Racionalidad

Un agente racional es aquel que hace lo correcto.

¿Cómo sabemos qué es lo correcto?

Las medidas de rendimiento incluyen los criterios que determinan el éxito en el comportamiento de un agente.

No hay una medida adecuada para todos los agentes

Como regla general, es mejor diseñar medidas de utilidad de acuerdo con lo que se quiere para el entorno, más que de acuerdo con cómo se cree que el agente debe

(8)

Racionalidad

Se puede determinar con 4 factores

1. La

medida de rendimiento

que define el

criterio de éxito

2. El

conocimiento del medio

en el que habita

acumulado por el agente

3. Las

acciones

que el agente puede llevar a

cabo

4. La

secuencia de percepciones

del agente

(9)

Agente racional

En cada posible secuencia de percepciones, un agente racional deberá emprender aquella acción que

supuestamente maximice su medida de rendimiento,

basándose en las evidencias aportadas por la secuencia de percepciones y en el conocimiento que el agente

mantiene almacenado.

(10)

Notas:

● Racionalidad no es omnisciencia

● Un agente debería aprender, según la

definición anterior

● Autonomía. Un agente carece de autonomía

cuando se apoya más en el conocimiento

(11)

Naturaleza del entorno

Son

problemas

para los que los agentes

racionales son las

soluciones

Entorno de trabajo:

1. Medida de rendimiento 2. Entorno

(12)

Agente taxista

1. Medidas de rendimiento

: seguro, rápido,

legal, viaje confiable, confortable,

maximización del beneficio

2. Entorno

: Carreteras, otros autos, peatones,

clientes

3. Actuadores

: Dirección, acelerador, freno,

señal, bocina, visualizador

4. Sensores

: Cámaras, sonar, velocímetro,

GPS, tacómetro, visualizador de la

(13)

Agente sistema de

diagnóstico médico

1. Medidas de rendimiento

: pacientes sanos,

reducir costos, reducir demandas

2. Entorno

: Pacientes, hospital, personal

3. Actuadores

: Visualizar preguntas, pruebas,

diagnósticos, tratamientos, casos

(14)

Agente sistema de análisis

de imágenes satélitales

1. Medidas de rendimiento

: Categorización

correcta de las imágenes

2. Entorno

: Conexión con el satélite en órbita

3. Actuadores

: Visualizar la categorización de

una escena

(15)

Propiedades de los entornos

de trabajo

1. Totalmente observable vs parcialmente

observable

2. Determinista vs Estocástico

3. Episódico vs secuencial

4. Estático vs dinámico

5. Discreto vs continuo

6. Agente individual vs multiagente

a. Competitivo

(16)

Ejemplos

● Crucigrama

● Ajedrez contra reloj

● Póker

● Taxi circulando

● Diagnóstico médico

● Análisis de imagen

● Robot clasificador

1. Totalmente observable vs parcialmente observable 2. Determinista vs Estocástico 3. Episódico vs secuencial 4. Estático vs dinámico 5. Discreto vs continuo

6. Agente individual vs multiagente a. Competitivo

(17)

Estructura de los agentes

Agente = arquitectura + programa

No siempre un agente puede ser el agente óptimo, por múltiples factores

(tiempo y costo de desarrollo, complejidad del problema, especificaciones parciales, etc)

(18)

Tipos de agentes

● Agentes reactivos simples

● Agentes reactivos basados en modelos

● Agentes basados en objetivos

(19)

Agente reactivo simple

Estos son los más sencillos, seleccionan las

acciones sobre la base de percepciones

actuales

, ignorando el resto de la historia.

Generalmente se aplican con reglas de tipo

condicional para construir el programa del

agente

(20)

Agente reactivo simple

Agente sensores

como es el mundo ahora

Actuadores

medio

ambiente

qué acción debo tomar ahora

Reglas de condición -

(21)

Programa agente reactivo

simple

function Agente_Reactivo_Simple Input: percepción

Output: una acción Static variables:

reglas, un conjunto de reglas condición - acción

estado ← Interpretar_Entrada(percepción) regla ← Regla_Coincidencia (estado, reglas) acción ← Regla_Acción[regla]

(22)

Agentes reactivos basados

en modelos

La forma más efectiva de manejar la visibilidad parcial es almacenar información de las partes del mundo que no pueden ver, esto es, almacenar un estado interno.

El estado interno dependerá de la historia percibida y que de este modo refleje al menos alguno de los aspectos no observables del estado actual.

El estado interno puede usarse para conocer como

(23)

Agentes reactivos basados

en modelos

Agente

sensores

Actuadores

medio

ambiente

(24)

Agentes reactivos basados

en modelos

function Agente_Reactivo_Con_Estado Input: percepción

Output: una acción Static variables:

estado, una descripción actual del estado del mundo reglas, un conjunto de reglas condición-acción

acción, la acción más reciente, inicialmente ninguna

estado ← Actualizar_Estado (estado, acción, percepción) regla ← Regla_Coincidencia (estado, reglas)

(25)

Agentes basados en

objetivos

El conocimiento sobre el estado actual no siempre es

suficiente. Una acción puede no tener sentido si no hay un objetivo a conseguir. Entonces, el agente necesita conocer algún tipo de información sobre su meta que describa las situaciones que son deseables.

Para llegar a estos estados deseables, el agente debe realizar Búsquedas (se verán más adelante) o

planificaciones.

(26)

Agentes basados en

objetivos

Agente _sensores

Actuadores

medio

ambiente

qué acción debo tomar ahora Reglas de condición - acción estado cómo evoluciona el mundo qué efectos causan mis acciones

(27)

Agentes basados en utilidad

Las metas por sí solas no son realmente suficientes para generar comportamiento de gran calidad en la mayoría de los entornos.

Las metas anteriores son binarias: éxito o fracaso. Es

(28)

Agentes basados en utilidad

Agente

sensores

Actuadores

medio

ambiente

Estaré contento en este estado Reglas de condición -

acción estado cómo evoluciona el mundo qué efectos causan mis acciones

qué pasará si realizo la acción A

(29)

Agentes que aprenden

Enseñar a un agente a realizar trabajos muy complejos puede ser muy laborioso si una persona programa a mano

al agente. Es por eso, que existen agentes que aprenden.

El agente que aprende se divide en

- Elemento de aprendizaje. Es el responsable de hacer mejoras.

- Elemento de actuación. Se responsabiliza de las acciones externas

- Crítica. El elemento de aprendizaje se retroalimenta por medio de críticas

(30)

Agentes que aprenden

sensores

Actuadores

medio

ambiente

Reglas de condición - acción

cómo evoluciona el mundo

elemento de aprendizaje

qué pasará si realizo la acción A

cambios conocimiento retroali-mentación objetivos a aprender