• No se han encontrado resultados

cap2.pdf

N/A
N/A
Protected

Academic year: 2020

Share "cap2.pdf"

Copied!
30
0
0

Texto completo

(1)

Capítulo 2

(2)

Agentes Inteligentes

Un

agente

es cualquier cosa capaz de percibir

su medioambiente con la ayuda de

sensores

y

actuar en ese medio por medio de

actuadores

.

Podríamos hacer la analogía siguiente:

Los sensores son entradas

(3)

Agente sensores

?

Actuadores

medio

ambiente

(4)

Algunas definiciones

● Percepción

○ Cualquier tipo de evento sensado

● Secuencia de percepciones

○ El

historial

de todas las percepciones

● Función del agente

Define

el comportamiento del agente

○ Se implementa mediante el

programa del

agente

(5)

El mundo de la aspiradora

A B A B A B A B A B A B A B A B Acciones: ● Izquierda ● Derecha ● Aspirar ● HacerNada Percepciones ● [A, Limpio] ● [A, Sucio] ● [B, Limpio] ● [B, Sucio]

(6)

El mundo de la aspiradora

A B A B A B A B A B A B A B A B 1 2 3 4 5 7 8 6

¿Como sería la función del agente? Secuencia de

percepciones

(7)

Buen comportamiento:

Racionalidad

Un agente racional es aquel que hace lo correcto.

¿Cómo sabemos qué es lo correcto?

Las medidas de rendimiento incluyen los criterios que determinan el éxito en el comportamiento de un agente.

No hay una medida adecuada para todos los agentes

Como regla general, es mejor diseñar medidas de utilidad de acuerdo con lo que se quiere para el entorno, más que de acuerdo con cómo se cree que el agente debe

(8)

Racionalidad

Se puede determinar con 4 factores

1. La

medida de rendimiento

que define el

criterio de éxito

2. El

conocimiento del medio

en el que habita

acumulado por el agente

3. Las

acciones

que el agente puede llevar a

cabo

4. La

secuencia de percepciones

del agente

(9)

Agente racional

En cada posible secuencia de percepciones, un agente racional deberá emprender aquella acción que

supuestamente maximice su medida de rendimiento,

basándose en las evidencias aportadas por la secuencia de percepciones y en el conocimiento que el agente

mantiene almacenado.

(10)

Notas:

● Racionalidad no es omnisciencia

● Un agente debería aprender, según la

definición anterior

● Autonomía. Un agente carece de autonomía

cuando se apoya más en el conocimiento

(11)

Naturaleza del entorno

Son

problemas

para los que los agentes

racionales son las

soluciones

Entorno de trabajo:

1. Medida de rendimiento 2. Entorno

(12)

Agente taxista

1.

Medidas de rendimiento

: seguro, rápido,

legal, viaje confiable, confortable,

maximización del beneficio

2.

Entorno

: Carreteras, otros autos, peatones,

clientes

3.

Actuadores

: Dirección, acelerador, freno,

señal, bocina, visualizador

4.

Sensores

: Cámaras, sonar, velocímetro,

GPS, tacómetro, visualizador de la

(13)

Agente sistema de

diagnóstico médico

1.

Medidas de rendimiento

: pacientes sanos,

reducir costos, reducir demandas

2.

Entorno

: Pacientes, hospital, personal

3.

Actuadores

: Visualizar preguntas, pruebas,

diagnósticos, tratamientos, casos

(14)

Agente sistema de análisis

de imágenes satélitales

1.

Medidas de rendimiento

: Categorización

correcta de las imágenes

2.

Entorno

: Conexión con el satélite en órbita

3.

Actuadores

: Visualizar la categorización de

una escena

(15)

Propiedades de los entornos

de trabajo

1. Totalmente observable vs parcialmente

observable

2. Determinista vs Estocástico

3. Episódico vs secuencial

4. Estático vs dinámico

5. Discreto vs continuo

6. Agente individual vs multiagente

a. Competitivo

(16)

Ejemplos

● Crucigrama

● Ajedrez contra reloj

● Póker

● Taxi circulando

● Diagnóstico médico

● Análisis de imagen

● Robot clasificador

1. Totalmente observable vs parcialmente observable 2. Determinista vs Estocástico 3. Episódico vs secuencial 4. Estático vs dinámico 5. Discreto vs continuo

6. Agente individual vs multiagente a. Competitivo

(17)

Estructura de los agentes

Agente = arquitectura + programa

No siempre un agente puede ser el agente óptimo, por múltiples factores

(tiempo y costo de desarrollo, complejidad del problema, especificaciones parciales, etc)

(18)

Tipos de agentes

● Agentes reactivos simples

● Agentes reactivos basados en modelos

● Agentes basados en objetivos

(19)

Agente reactivo simple

Estos son los más sencillos, seleccionan las

acciones sobre la base de percepciones

actuales

, ignorando el resto de la historia.

Generalmente se aplican con reglas de tipo

condicional para construir el programa del

agente

(20)

Agente reactivo simple

Agente sensores

como es el mundo ahora

Actuadores

medio

ambiente

qué acción debo tomar ahora

Reglas de condición -

(21)

Programa agente reactivo

simple

function Agente_Reactivo_Simple Input: percepción

Output: una acción Static variables:

reglas, un conjunto de reglas condición - acción

estado ← Interpretar_Entrada(percepción) regla ← Regla_Coincidencia (estado, reglas) acción ← Regla_Acción[regla]

(22)

Agentes reactivos basados

en modelos

La forma más efectiva de manejar la visibilidad parcial es almacenar información de las partes del mundo que no pueden ver, esto es, almacenar un estado interno.

El estado interno dependerá de la historia percibida y que de este modo refleje al menos alguno de los aspectos no observables del estado actual.

El estado interno puede usarse para conocer como

(23)

Agentes reactivos basados

en modelos

Agente

sensores

como es el mundo ahora

Actuadores

medio

ambiente

(24)

Agentes reactivos basados

en modelos

function Agente_Reactivo_Con_Estado Input: percepción

Output: una acción Static variables:

estado, una descripción actual del estado del mundo reglas, un conjunto de reglas condición-acción

acción, la acción más reciente, inicialmente ninguna

estado ← Actualizar_Estado (estado, acción, percepción) regla ← Regla_Coincidencia (estado, reglas)

(25)

Agentes basados en

objetivos

El conocimiento sobre el estado actual no siempre es

suficiente. Una acción puede no tener sentido si no hay un objetivo a conseguir. Entonces, el agente necesita conocer algún tipo de información sobre su meta que describa las situaciones que son deseables.

Para llegar a estos estados deseables, el agente debe realizar Búsquedas (se verán más adelante) o

planificaciones.

(26)

Agentes basados en

objetivos

Agente sensores

como es el mundo ahora

Actuadores

medio

ambiente

qué acción debo tomar ahora Reglas de condición - acción estado cómo evoluciona el mundo qué efectos causan mis acciones

(27)

Agentes basados en utilidad

Las metas por sí solas no son realmente suficientes para generar comportamiento de gran calidad en la mayoría de los entornos.

Las metas anteriores son binarias: éxito o fracaso. Es

(28)

Agentes basados en utilidad

Agente

sensores

como es el mundo ahora

Actuadores

medio

ambiente

Estaré contento en este estado Reglas de condición -

acción estado cómo evoluciona el mundo qué efectos causan mis acciones

qué pasará si realizo la acción A

(29)

Agentes que aprenden

Enseñar a un agente a realizar trabajos muy complejos puede ser muy laborioso si una persona programa a mano

al agente. Es por eso, que existen agentes que aprenden.

El agente que aprende se divide en

- Elemento de aprendizaje. Es el responsable de hacer mejoras.

- Elemento de actuación. Se responsabiliza de las acciones externas

- Crítica. El elemento de aprendizaje se retroalimenta por medio de críticas

(30)

Agentes que aprenden

sensores

Actuadores

medio

ambiente

Reglas de condición - acción

cómo evoluciona el mundo

elemento de aprendizaje

qué pasará si realizo la acción A

cambios conocimiento retroali-mentación objetivos a aprender

Referencias

Documento similar

mecánico del coche que se encarga de transmitir el movimiento del motor a las ruedas, a través de la caja de Mecánica básica: ¿cómo funciona el embrague de un coche?May 6, 2016 —

Sieyès basó su escrito en la idea de que el Tercer Estado merecía una representación política porque el Tercer Estado era responsable de la mayor parte del trabajo en Francia..

Sin embargo, una revisión Cochrane publicada en 2014 no encuentra beneficios ni des- ventajas en la introducción de alimentos distintos de la leche materna en este periodo,

Infantil, Pedagogía y Educador Social será imprescindible que dicha asignación coincida con la asignación docente del Prácticum del 4º curso, de forma que para cada

Según el punto de vista expresado, un agente percibe un objeto como un artefacto cuando se percata del factum siguiente: el objeto es una herramienta, esto es, está intencional-

La aporía de cómo la política sobre la vida se convierte en acción de muerte, parece haber cedido paso a la cuestión más general de cómo el mundo es objeto de conocimiento y al

Dicha resolución autorizará el funcionamiento de su planta, el uso de las aguas que solicitó y el sistema de vertimientos de los líquidos industriales y domésticos. Finalmente,

El objetivo de un Programa de Monitoreo de Condición es reconocer estados de deterioro con el tiempo suficiente para tomar acciones antes de que los defectos en la