Capítulo 2
Agentes Inteligentes
Un
agente
es cualquier cosa capaz de percibir
su medioambiente con la ayuda de
sensores
y
actuar en ese medio por medio de
actuadores
.
Podríamos hacer la analogía siguiente:
Los sensores son entradas
Agente sensores
?
Actuadores
medio
ambiente
Algunas definiciones
● Percepción
○ Cualquier tipo de evento sensado
● Secuencia de percepciones
○ El
historial
de todas las percepciones
● Función del agente
○
Define
el comportamiento del agente
○ Se implementa mediante el
programa del
agente
El mundo de la aspiradora
A B A B A B A B A B A B A B A B Acciones: ● Izquierda ● Derecha ● Aspirar ● HacerNada Percepciones ● [A, Limpio] ● [A, Sucio] ● [B, Limpio] ● [B, Sucio]El mundo de la aspiradora
A B A B A B A B A B A B A B A B 1 2 3 4 5 7 8 6¿Como sería la función del agente? Secuencia de
percepciones
Buen comportamiento:
Racionalidad
Un agente racional es aquel que hace lo correcto.
¿Cómo sabemos qué es lo correcto?
Las medidas de rendimiento incluyen los criterios que determinan el éxito en el comportamiento de un agente.
No hay una medida adecuada para todos los agentes
Como regla general, es mejor diseñar medidas de utilidad de acuerdo con lo que se quiere para el entorno, más que de acuerdo con cómo se cree que el agente debe
Racionalidad
Se puede determinar con 4 factores
1. La
medida de rendimiento
que define el
criterio de éxito
2. El
conocimiento del medio
en el que habita
acumulado por el agente
3. Las
acciones
que el agente puede llevar a
cabo
4. La
secuencia de percepciones
del agente
Agente racional
En cada posible secuencia de percepciones, un agente racional deberá emprender aquella acción que
supuestamente maximice su medida de rendimiento,
basándose en las evidencias aportadas por la secuencia de percepciones y en el conocimiento que el agente
mantiene almacenado.
Notas:
● Racionalidad no es omnisciencia
● Un agente debería aprender, según la
definición anterior
● Autonomía. Un agente carece de autonomía
cuando se apoya más en el conocimiento
Naturaleza del entorno
Son
problemas
para los que los agentes
racionales son las
soluciones
Entorno de trabajo:
1. Medida de rendimiento 2. Entorno
Agente taxista
1.
Medidas de rendimiento
: seguro, rápido,
legal, viaje confiable, confortable,
maximización del beneficio
2.
Entorno
: Carreteras, otros autos, peatones,
clientes
3.
Actuadores
: Dirección, acelerador, freno,
señal, bocina, visualizador
4.
Sensores
: Cámaras, sonar, velocímetro,
GPS, tacómetro, visualizador de la
Agente sistema de
diagnóstico médico
1.
Medidas de rendimiento
: pacientes sanos,
reducir costos, reducir demandas
2.
Entorno
: Pacientes, hospital, personal
3.
Actuadores
: Visualizar preguntas, pruebas,
diagnósticos, tratamientos, casos
Agente sistema de análisis
de imágenes satélitales
1.
Medidas de rendimiento
: Categorización
correcta de las imágenes
2.
Entorno
: Conexión con el satélite en órbita
3.
Actuadores
: Visualizar la categorización de
una escena
Propiedades de los entornos
de trabajo
1. Totalmente observable vs parcialmente
observable
2. Determinista vs Estocástico
3. Episódico vs secuencial
4. Estático vs dinámico
5. Discreto vs continuo
6. Agente individual vs multiagente
a. Competitivo
Ejemplos
● Crucigrama
● Ajedrez contra reloj
● Póker
● Taxi circulando
● Diagnóstico médico
● Análisis de imagen
● Robot clasificador
1. Totalmente observable vs parcialmente observable 2. Determinista vs Estocástico 3. Episódico vs secuencial 4. Estático vs dinámico 5. Discreto vs continuo
6. Agente individual vs multiagente a. Competitivo
Estructura de los agentes
Agente = arquitectura + programa
No siempre un agente puede ser el agente óptimo, por múltiples factores
(tiempo y costo de desarrollo, complejidad del problema, especificaciones parciales, etc)
Tipos de agentes
● Agentes reactivos simples
● Agentes reactivos basados en modelos
● Agentes basados en objetivos
Agente reactivo simple
Estos son los más sencillos, seleccionan las
acciones sobre la base de percepciones
actuales
, ignorando el resto de la historia.
Generalmente se aplican con reglas de tipo
condicional para construir el programa del
agente
Agente reactivo simple
Agente sensores
como es el mundo ahora
Actuadores
medio
ambiente
qué acción debo tomar ahora
Reglas de condición -
Programa agente reactivo
simple
function Agente_Reactivo_Simple Input: percepción
Output: una acción Static variables:
reglas, un conjunto de reglas condición - acción
estado ← Interpretar_Entrada(percepción) regla ← Regla_Coincidencia (estado, reglas) acción ← Regla_Acción[regla]
Agentes reactivos basados
en modelos
La forma más efectiva de manejar la visibilidad parcial es almacenar información de las partes del mundo que no pueden ver, esto es, almacenar un estado interno.
El estado interno dependerá de la historia percibida y que de este modo refleje al menos alguno de los aspectos no observables del estado actual.
El estado interno puede usarse para conocer como
Agentes reactivos basados
en modelos
Agente
sensores
como es el mundo ahora
Actuadores
medio
ambiente
Agentes reactivos basados
en modelos
function Agente_Reactivo_Con_Estado Input: percepción
Output: una acción Static variables:
estado, una descripción actual del estado del mundo reglas, un conjunto de reglas condición-acción
acción, la acción más reciente, inicialmente ninguna
estado ← Actualizar_Estado (estado, acción, percepción) regla ← Regla_Coincidencia (estado, reglas)
Agentes basados en
objetivos
El conocimiento sobre el estado actual no siempre es
suficiente. Una acción puede no tener sentido si no hay un objetivo a conseguir. Entonces, el agente necesita conocer algún tipo de información sobre su meta que describa las situaciones que son deseables.
Para llegar a estos estados deseables, el agente debe realizar Búsquedas (se verán más adelante) o
planificaciones.
Agentes basados en
objetivos
Agente sensores
como es el mundo ahora
Actuadores
medio
ambiente
qué acción debo tomar ahora Reglas de condición - acción estado cómo evoluciona el mundo qué efectos causan mis acciones
Agentes basados en utilidad
Las metas por sí solas no son realmente suficientes para generar comportamiento de gran calidad en la mayoría de los entornos.
Las metas anteriores son binarias: éxito o fracaso. Es
Agentes basados en utilidad
Agente
sensores
como es el mundo ahora
Actuadores
medio
ambiente
Estaré contento en este estado Reglas de condición -
acción estado cómo evoluciona el mundo qué efectos causan mis acciones
qué pasará si realizo la acción A
Agentes que aprenden
Enseñar a un agente a realizar trabajos muy complejos puede ser muy laborioso si una persona programa a mano
al agente. Es por eso, que existen agentes que aprenden.
El agente que aprende se divide en
- Elemento de aprendizaje. Es el responsable de hacer mejoras.
- Elemento de actuación. Se responsabiliza de las acciones externas
- Crítica. El elemento de aprendizaje se retroalimenta por medio de críticas
Agentes que aprenden
sensores
Actuadores
medio
ambiente
Reglas de condición - acción
cómo evoluciona el mundo
elemento de aprendizaje
qué pasará si realizo la acción A
cambios conocimiento retroali-mentación objetivos a aprender