• No se han encontrado resultados

Aprendizaje por refuerzo (Aprendizaje automático)

Resumen de las Sesiones de Aprendizaje por Refuerzo

Resumen de las Sesiones de Aprendizaje por Refuerzo

... Aprender las funciones de valor directamente: m´ etodos libres de modelo o Aprendizaje por Refuerzo. Fernando Fern´ andez Rebollo Aprendizaje por Refuerzo.[r] ...

34

Control de intersecciones semaforizadas aplicando aprendizaje por refuerzo multiagente

Control de intersecciones semaforizadas aplicando aprendizaje por refuerzo multiagente

... de aprendizaje por refuerzo multi- agente para el control adaptativo de la semaforizaci´ on, con el objetivo de reducir el tiempo de espera de los veh´ıculos y la longitud de cola en las ...de ...

76

Metodología de sintonización de sistemas de inferencia difusos mediante algoritmos híbridos, para la aproximación de la función de valor en el problema de aprendizaje por refuerzo

Metodología de sintonización de sistemas de inferencia difusos mediante algoritmos híbridos, para la aproximación de la función de valor en el problema de aprendizaje por refuerzo

... de aprendizaje por refuerzo se puede decir que una señal de estado cumple con la propiedad de Markov si la respuesta siguiente del ambiente depende únicamente de la acción del agente y de la señal de ...el ...

60

Optimización de energía al controlar ventilación y aire acondicionado por medio de un algoritmo de aprendizaje por refuerzo profundo, implementado en el departamento de Ingeniería Mecánica, Universidad Nacional Chiao Tun, Hsinchu, Taiwán

Optimización de energía al controlar ventilación y aire acondicionado por medio de un algoritmo de aprendizaje por refuerzo profundo, implementado en el departamento de Ingeniería Mecánica, Universidad Nacional Chiao Tun, Hsinchu, Taiwán

... El Aprendizaje por Refuerzo Profundo («Deep Reinforcement Learning» o DRL) es el resultado de combinar el RL convencional con el aprendizaje profundo, donde se utilizan modelos neuronales para ...

125

Comparación de técnicas de aprendizaje por refuerzo jugando a un videojuego de tenis

Comparación de técnicas de aprendizaje por refuerzo jugando a un videojuego de tenis

... integra aprendizaje por refuerzo con redes ...de aprendizaje para crear agentes que aprendiesen a jugar a juegos de Atari desde cero sin tener ninguna informaci´ on acerca de ellos, ni siquiera las ...

53

Balance procedimental de videojuegos usando aprendizaje por refuerzo

Balance procedimental de videojuegos usando aprendizaje por refuerzo

... de aprendizaje utilice un algoritmo de aprendizaje por re- ...del aprendizaje supervisado, en el aprendizaje por refuerzo no se tiene un conjunto de datos de entrenamiento con entradas ...

38

Aproximación Funcional en Aprendizaje por Refuerzo Multi-Objetivo

Aproximación Funcional en Aprendizaje por Refuerzo Multi-Objetivo

... Existen dos enfoques para tratar problemas con m´ ultiples objetivos mediante t´ ecnicas de aprendizaje por refuerzo: (1) pol´ıtica ´ unica y (2) pol´ıticas m´ ultiples [2]. En el primer paradigma se ...

10

Desarrollo de un programa de computador capaz de jugar Starcraft - Brood War usando técnicas de aprendizaje por refuerzo

Desarrollo de un programa de computador capaz de jugar Starcraft - Brood War usando técnicas de aprendizaje por refuerzo

... de aprendizaje por refuerzo que permite a un agente desarrollar comportamiento autónomo en un ambiente desconocido a partir de recompensas sencillas [12], en la literatura existen varios ejemplos de ésta ...

45

Estimación de distribuciones de probabilidad para problemas de aprendizaje por refuerzo con espacios de acciones continuos

Estimación de distribuciones de probabilidad para problemas de aprendizaje por refuerzo con espacios de acciones continuos

... Los resultados obtenidos se consideran un buen primer paso en el ´ area de investigaci´ on del problema de aprendizaje por refuerzo en espacios continuos. Ya que se encuentra que las reglas de ...

44

Generación de Comportamientos Colaborativos Utilizando Aprendizaje por Refuerzo en un Medio de Agentes de Fútbol-Edición Única

Generación de Comportamientos Colaborativos Utilizando Aprendizaje por Refuerzo en un Medio de Agentes de Fútbol-Edición Única

... el aprendizaje por refuerzo para lograr este objetivo 24 ...por aprendizaje por refuerzo logra anotar más goles que uno aleatorio [Figura ...

117

PQ-learning: aprendizaje por refuerzo multiobjetivo

PQ-learning: aprendizaje por refuerzo multiobjetivo

... Resumen En este art´ıculo describimos y analizamos PQ-learning, un algoritmo para problemas de aprendizaje por refuerzo multiobjetivo. El algoritmo es una extensi´ on de Q-learning, un algoritmo para ...

10

Desarrollo del juego del Backgammon con integración de técnicas de aprendizaje por refuerzo

Desarrollo del juego del Backgammon con integración de técnicas de aprendizaje por refuerzo

... [16] Sutton, R. 2º), Reinforcement Learning: An Introduction. London: The MIT Press. [17] IEEE Computer Society. IEEE Recommended Practice for Software Requirements Specifications. In[r] ...

175

Cooperación emergente mediante aprendizaje profundo por refuerzo

Cooperación emergente mediante aprendizaje profundo por refuerzo

... de aprendizaje profundo para complementar los algoritmos que requieren un estimado de las funciones de valor y/o de la pol´ıtica, dado que las redes neuronales se adaptan bien a entradas de alta-dimensi´ on ...

87

CO TROL I TELIGE TE Introducción a las Redes neuronales artificiales

CO TROL I TELIGE TE Introducción a las Redes neuronales artificiales

... • Tipos mas comunes de aprendizaje supervisado – Aprendizaje por corrección de error. – Aprendizaje por refuerzo – Aprendizaje estocástico.[r] ...

53

Reconstrucción de rompecabezas mediante técnicas de aprendizaje computacional por refuerzo

Reconstrucción de rompecabezas mediante técnicas de aprendizaje computacional por refuerzo

... Evidentemente, el proceso de reconstrucción global de rompecabezas se puede entender y describir como un proceso de decisión de Markov en el que los estados corresponden a la parte resuelta –o, como en la simulación, a ...

88

Instrucción de tareas a un robot con retroalimentación en línea proporcionada por voz

Instrucción de tareas a un robot con retroalimentación en línea proporcionada por voz

... de aprendizaje (la descripción de estados y ...El aprendizaje por refuerzo se basa en el algoritmo Q-learning modicado por un parámetro de amnesia, que permite 'olvidar' estados o ac- ciones según el ...

154

Unidad 15. Primaria Religión 1 Programación

Unidad 15. Primaria Religión 1 Programación

... Los estándares de aprendizaje muestran el grado de consecución de los criterios de evaluación desde la propia descripción y concreción del criterio. Para facilitar el seguimiento del desarrollo de cada estándar, ...

7

07 0631

07 0631

... mejor aprendizaje de sus estudiantes con ejercicios fáciles y prácticos, los que llevarán al alumno(a) a la corrección de su escritura y al mejoramiento de su ...

145

Show all 10000 documents...

Related subjects