Aprendizaje por refuerzo

Top PDF Aprendizaje por refuerzo:

Aprendizaje por Refuerzo

Aprendizaje por Refuerzo

... El aprendizaje autom´ atico es un ´ area que en los ´ ultimos 20 a˜ nos ha atra´ıdo a una gran cantidad de investigadores y que ha contribuido a lograr enormes avances en otras ´ areas como son el desarrollo de ...

12

Aprendizaje por Refuerzo

Aprendizaje por Refuerzo

... por Refuerzo Aprendizaje Q para sistemas difusos Algoritmo Final Inicializaci´ on: Sea t + 1 el instante de tiempo actual, el aprendedor ha llevado acabo la acci´ on U t escogida mediante la estrategia ...

60

Aprendizaje por Refuerzo

Aprendizaje por Refuerzo

... ~e t = γλ~e t−1 + ∇ Θ ~ t V t (s t ) con ~e 0 = 0. 12.6 Aplicaciones a Juegos y Control La primera aplicaci´on en aprendizaje por refuerzo fu´e el programa para jugar damas de Samuel. Us´o una funci´on ...

24

Resumen de las Sesiones de Aprendizaje por Refuerzo

Resumen de las Sesiones de Aprendizaje por Refuerzo

... Aprender las funciones de valor directamente: m´ etodos libres de modelo o Aprendizaje por Refuerzo. Fernando Fern´ andez Rebollo Aprendizaje por Refuerzo.[r] ...

34

Aprendizaje por Refuerzo en Robótica Autónoma

Aprendizaje por Refuerzo en Robótica Autónoma

... Aprendizaje por Refuerzo vs. M´ etodos Evolutivos Tambi´en pueden utilizarse m´etodos evolutivos tales como algoritmos gen´eticos, programaci´ on gen´etica, etc. para resolver problemas de ...

43

Plataforma de recomendación con aprendizaje por refuerzo

Plataforma de recomendación con aprendizaje por refuerzo

... de aprendizaje por refuerzo consiste en que, para cada iteración, se escoge uno de los brazos en base a la recompensa de la iteración anterior (la cual varía según si ha sido acertada o no la ...

55

Aprendizaje por refuerzo en espacios de estados continuos

Aprendizaje por refuerzo en espacios de estados continuos

... Los objetivos de esta tesis doctoral (que se detallan en la sección 3) se centran en la obtención de métodos de aprendizaje por refuerzo libre de mo delo que se[r] ...

112

PQ-learning: aprendizaje por refuerzo multiobjetivo

PQ-learning: aprendizaje por refuerzo multiobjetivo

... {mruiz,lawrence,perez}@lcc.uma.es Resumen En este art´ıculo describimos y analizamos PQ-learning, un algoritmo para problemas de aprendizaje por refuerzo multiobjetivo. El algoritmo es una extensi´ on de ...

10

Aprendizaje por refuerzo aplicado a los videojuegos cooperativos

Aprendizaje por refuerzo aplicado a los videojuegos cooperativos

... Con el fin de obtener el valor Q(s,a), es necesario realizar una predicci´ on del estado s, y obtener la recompensa correspondiente a la acci´ on a. El hecho de que sea una predicci´ on y no el valor real previamente ...

108

Aprendizaje por Refuerzo. Elementos básicos y algoritmos

Aprendizaje por Refuerzo. Elementos básicos y algoritmos

... el aprendizaje tienen el objetivo de encontrar la política óptima y maximizar los valores de las funciones ...Este aprendizaje puede enfocarse de dos maneras diferentes dependiendo de la información que se ...

52

Aproximación Funcional en Aprendizaje por Refuerzo Multi-Objetivo

Aproximación Funcional en Aprendizaje por Refuerzo Multi-Objetivo

... Keywords: Aprendizaje por Refuerzo, Aproximaci´ on Funcional, Opti- mizaci´ on Multi-Objetivo, Escalarizaci´ on ...El aprendizaje por refuerzo [1] (AR) es un ´ area del aprendizaje ...

10

Aplicación de aprendizaje por refuerzo adversario en juegos de Atari

Aplicación de aprendizaje por refuerzo adversario en juegos de Atari

... mediante aprendizaje por refuerzo, destacan la disminución que hay en número de ataques frente al número de ataques que se realizan al aplicar estos en cada observación, y también, el efecto que causa este ...

106

Aprendizaje por refuerzo mediante transferencia de conocimiento cualitativo

Aprendizaje por refuerzo mediante transferencia de conocimiento cualitativo

... por refuerzo, as´ı como los algoritmos para transferencia de conoci- miento en tareas de aprendizaje por ...de aprendizaje y transferencia, en la mayor´ıa de las propuestas se trabaja sobre tareas ...

118

Introducción al aprendizaje por refuerzo Problema bandido multibrazo

Introducción al aprendizaje por refuerzo Problema bandido multibrazo

... al aprendizaje por refuerzo: problema bandido multibrazo la superior izquierda muestra los resultados obtenidos con tres bandidos Bernuilli con proba- bilidades ...de aprendizaje son más grandes esto ...

77

Aprendizaje por refuerzo aplicado a personajes no controlables en Minetest

Aprendizaje por refuerzo aplicado a personajes no controlables en Minetest

... Resumen La inteligencia artificial avanza con pasos de gigante una gran variedad de campos que jamás esperaríamos, pero hay uno de ellos con el cual tiene una larga historia y jamás abandonará: el mundo de los ...

112

Balance procedimental de videojuegos usando aprendizaje por refuerzo

Balance procedimental de videojuegos usando aprendizaje por refuerzo

... de aprendizaje utilice un algoritmo de aprendizaje por re- ...del aprendizaje supervisado, en el aprendizaje por refuerzo no se tiene un conjunto de datos de entrenamiento con entradas ...

38

Comparación de técnicas de aprendizaje por refuerzo jugando a un videojuego de tenis

Comparación de técnicas de aprendizaje por refuerzo jugando a un videojuego de tenis

... integra aprendizaje por refuerzo con redes ...de aprendizaje para crear agentes que aprendiesen a jugar a juegos de Atari desde cero sin tener ninguna informaci´ on acerca de ellos, ni siquiera las ...

53

Aprendizaje por refuerzo y control difuso para generar comportamiento de robots

Aprendizaje por refuerzo y control difuso para generar comportamiento de robots

... Resumen: La utilización de RL para generar comportamientos en sistemas de control y en robótica ha ganado un espacio significativo en las últimas décadas. La maldición de la dimensionalidad se hace presente y es ...

6

Control de intersecciones semaforizadas aplicando aprendizaje por refuerzo multiagente

Control de intersecciones semaforizadas aplicando aprendizaje por refuerzo multiagente

... de aprendizaje por refuerzo para so- lucionar un problema de control multiagente, como lo es la semaforizaci´ on en una red de ...de aprendizaje por refuerzo multiagente coordinado no suele ...

76

Show all 10000 documents...