• No se han encontrado resultados

Q-learning

Una implementación paralela del algoritmo de Q-Learning basada en un esquema de comunicación con caché

Una implementación paralela del algoritmo de Q-Learning basada en un esquema de comunicación con caché

... de Q-Learning y otros en los cuales la experiencia se divide en episodios, normalmente toman como referencia los resultados obtenidos en cada uno de los ...

12

Pruning dominated policies in multiobjective Pareto Q-learning

Pruning dominated policies in multiobjective Pareto Q-learning

... with Q-learning, which is a model-free ...once learning is over, the model can be used to recover the actions associated to a particular Pareto- optimal policy chosen by the ...estimate q ∈ ...

11

Seguimiento Visual en Mecanismos Robóticos con Q Learning Edición Única

Seguimiento Visual en Mecanismos Robóticos con Q Learning Edición Única

... Con las matrices definidas y los valores numéricos de los factores podemos computar el algoritmo de la tabla 3.2. Una vez hecho el aprendizaje Q-Learning, las acciones óptimas resultantes se muestran en la ...

75

Autonomous Driving in Roundabout Maneuvers Using Reinforcement Learning with Q-Learning

Autonomous Driving in Roundabout Maneuvers Using Reinforcement Learning with Q-Learning

... supervised learning techniques label the information and predict more or less accurately the variables to be treated in the problem of autonomous driving in a ...unsupervised learning methods are not useful ...

13

SARSA BB: Un algoritmo on policy para Sistemas Clasificadores

SARSA BB: Un algoritmo on policy para Sistemas Clasificadores

... como Q-Learning, en problemas donde la exploraci´on que efectivamente realiza el agente impacta significativamente en las recompensas recibidas desde el ...con Q-Learning en un problema con ...

12

Aprendizaje por reforzamiento para sistemas multiagentes utilizando Aproximación No Paramétrica

Aprendizaje por reforzamiento para sistemas multiagentes utilizando Aproximación No Paramétrica

... reinforcement learning and nonparametric functions are ...the Q-learning algorithm is used which will provide data training for a Kernel, this approach will provide a sub optimal set of actions to be ...

9

Un modelo híbrido para la asignación redundante de fragmentos en el diseño de bases de datos distribuidas

Un modelo híbrido para la asignación redundante de fragmentos en el diseño de bases de datos distribuidas

... colocada en un catálogo en etapas previas del diseño de la BDD. Uno de los agentes se basa en un algoritmo genético generacional (Cheng et al., 2002; Pérez et al., 2004a; Pérez et al., 2004b; Du et al., 2006). El otro ...

97

Estudio y desarrollo de algoritmos de aprendizaje por refuerzo a partir de la teoría de optimización dual

Estudio y desarrollo de algoritmos de aprendizaje por refuerzo a partir de la teoría de optimización dual

... Antes de comenzar la explicación, recalcar que ambos métodos permitirán resolver el problema de control que se plantee. No obstante, DP se emplea cuando el modelo es conocido y por tanto el agente puede planificar las ...

183

PQ-learning: aprendizaje por refuerzo multiobjetivo

PQ-learning: aprendizaje por refuerzo multiobjetivo

... algoritmo Q-learning [1], ampliamente usado en la literatura, donde el agen- te va optimizando los valores Q(s, a) : S × A → R ...estos Q-valores representan la calidad de una combinaci´ on s, ...

10

Generación de Comportamientos Colaborativos Utilizando Aprendizaje por Refuerzo en un Medio de Agentes de Fútbol-Edición Única

Generación de Comportamientos Colaborativos Utilizando Aprendizaje por Refuerzo en un Medio de Agentes de Fútbol-Edición Única

... algoritmo Q- Learning no es capaz de llegar a lograr y generar comportamientos ...que Q-Learning al ser un algoritmo de diferencia temporal, va cambiando sus estados internos de acuerdo a las ...

117

Metodología innovadora para el aprendizaje de informática en la convergencia europea

Metodología innovadora para el aprendizaje de informática en la convergencia europea

... blended learning se ha aprovechado que la UCM ha dispuesto en su Campus Virtual un modelo multiplataforma integrado (WebCT, Moodle y Sakai), lo que ha permitido que se utilizaran los recursos de los distintos ...

14

q Algoritmos de búsqueda

q Algoritmos de búsqueda

... El algoritmo de Deutsch ayudar´ a a saber si una funci´ on de un qubit es una funci´ on constante o una funci´ on balanceada, tal algoritmo hace uso de los siguientes ele- mentos: compue[r] ...

88

Busqueda anticipada : predice lo q va necesitar el proceso y antes de q lo

Busqueda anticipada : predice lo q va necesitar el proceso y antes de q lo

... ■ no hay fragmentacion externa ( segmento vacio, hueco al q se le puede meter otro proceso), pero si fragmentacion interna.(( los segmentos pueden tener distinto tamaño, pero como dentro de cada segmento esta ...

11

tema 01

El paso deZa Q

... Uno de ellos tomó solo un refresco, otro tomó dos y el resto toma- ron 3 refrescos cada uno. Para aumentar la producción de huevos, se aumenta el número de gallinas a 200 y se compran 80[r] ...

34

Opcional II Q

Opcional II Q

... Dentro de las expectativas que la modernización pretende cubrir en los futuros docentes de educación secundaria, y como un avance constante en el conocimiento de las ciencias químicas [r] ...

28

UNIDAD DIDÁCTICA 1

El paso deZa Q

... 30 Efectúa y da el resultado en notación científica con tres cifras significativas.. 53 Halla con la calculadora y comprueba el resultado con la potenciación.. c) Todo número irracional [r] ...

34

Experiencia y recursos para mejorar la docencia en la Universidad

Experiencia y recursos para mejorar la docencia en la Universidad

... A nuestro modo de ver, la conclusión es bastante obvia: La educación tal y como la conocemos está herida de muerte y el e-learning forma parte de este escenario. La irrupción de una generación nueva (digital) y la ...

22

Q UE ES UNO SCILOSCOPIO

Q UE ES UNO SCILOSCOPIO

... Para verificar la “paridad” de capacitores el prin- cipio es simple: si los dos capacitores tienen el mis- mo valor, las señales senoidales aplicadas en las entradas vertical y horizonta[r] ...

24

Q UÉ ES EL TELETRABAJO

Q UÉ ES EL TELETRABAJO

... Pero existe el riesgo de que las autopistas de la información vuelvan a agrandar las diferencias entre los países y regiones industrializados (en este caso, informatizados y [r] ...

7

Show all 9367 documents...

Related subjects