PDF superior Un método de regresión bayesiana para selección genómica.

Un método de regresión bayesiana para selección genómica.

Un método de regresión bayesiana para selección genómica.

mo una cantidad desconocida a la que se asigna una distribuci´on a priori para representar la incertidumbre sobre su valor verdadero. As´ı, la inferencia bayesiana se basa en π(θ | x); esto es, en la distribuci´on del par´ametro dados los datos. Los m´etodos Bayesianos de inferencia reciben este nombre por que son capaces de sintetizar la informaci´on muestral y la llamada informaci´on a priori (no muestral) utilizando el Teorema de Bayes. As´ı, dado que el objetivo es relacionar probabil´ısti- camente a un par´ametro θ con los datos, el teorema de Bayes puede presentarse en t´erminos de densidades:
Mostrar más

75 Lee mas

Modelos de selección genómica para caracteres cuantitativos basados en marcadores moleculares aplicados al mejoramiento de maíz

Modelos de selección genómica para caracteres cuantitativos basados en marcadores moleculares aplicados al mejoramiento de maíz

La regresión LASSO en su enfoque bayesiano (BLR) se considera como un método de estimación penalizada ya que no asigna valores nulos a los coeficientes, es decir, no realiza selección de variables. Se encontró que la habilidad predictiva del método BLR, no difiere significativamente de la habilidad predictiva hallada para RR y RR‐BLUP ( 0,51 ± 0,16) . Este resultado se contrapone con la conclusión a la que arriban Crossa et al. (2010) en líneas de trigo donde encuentran que el método BLR muestra mayor habilidad predictiva que el RR‐BLUP, al igual que en el trabajo de Pérez et al. (2010) con datos simulados. Ambos trabajos establecen que el motivo por el cual se espera que BLR se desempeñe mejor que RR‐BLUP es porque BLR no produce una penalización homogénea a través de todos los MM, sino que permite cierta flexibilidad. Por otro lado, Endelman (2011) establece que la capacidad predictiva del método BLR (implementado con la función BLR de R) es equivalente a la encontrada con RR‐BLUP (usando la función mixed.solve) en 7 fenotipos de datos de líneas de trigo; lo cual soporta no solo la metodología empleada en el presente trabajo sino también los resultados hallados. Es importante notar que el enfoque BLR tiene similar complejidad que BRR, en términos de selección de parámetro de penalización, tiempo computacional y estudio de convergencia de la componente de varianza del residual, y que entre estos dos métodos la habilidad predictiva de BLR fue significativamente superior.
Mostrar más

94 Lee mas

Selección Genética y Genómica en Agricultura, Ganadería, Silvicultura y Acuicultura : Informe de Vigilancia Tecnológica

Selección Genética y Genómica en Agricultura, Ganadería, Silvicultura y Acuicultura : Informe de Vigilancia Tecnológica

Para la identificación de QTL se utiliza la cartografía por intervalos (IM, Interval Mapping), que evalúa la significación estadística de cada intervalo (constituido por un par de marcadores) a lo largo de todo el mapa para proponer la existencia de un QTL en una región particular del genoma utilizando métodos de máxima verosimili- tud o técnicas de regresión. El rastreo por intervalos es necesario, dada la incerti- dumbre que produce el manejo de dos variables simultáneamente cuando se traba- ja con marcadores individuales (distancia entre el marcador y el QTL, y peso del QTL sobre el carácter). Para cuantificar la evidencia de un QTL suele aplicarse el método de las puntuaciones LOD, calculado como el log10 de la razón de las proba- bilidades de la obtención de los datos fenotípicos observados asumiendo la exis - tencia del QTL y sin el QTL. La significación estadística se obtiene a partir de la distribución de probabilidades generada mediante simulación, permutando alea - toriamente los marcadores un número elevado de veces. El tipo de cruzamiento más potente para la detección de QTL son los retrocruzamientos o cruzamiento F2 obtenidos a partir de líneas homocigóticas de fenotipos extremos para el carácter bajo estudio. Este esquema es altamente informativo, ya que es de esperar la se- gregación simultánea de varios QTL y además, una gran parte de marcadores mos- trarán asociaciones específicas con los alelos alternativos de los QTL en su proximi- dad. Esta estrategia es factible en las especies domésticas tradicionales en las que existen este tipo de líneas, pero no son frecuentes en especies de acuicultura. En éstas, sin embargo, es posible la obtención de líneas puras en una generación me- diante técnicas de manipulación cromosómica (mitoginogenéticos o mitoandrogené- ticos). La opción aplicada más frecuentemente en acuicultura es la de los cruza- mientos entre hermanos, estrategia favorecida por la elevada prolificidad de ambos sexos. La diversidad interfamiliar, tanto en el número de QTL segregantes como en las asociaciones con los marcadores adyacentes, determina una pérdida de potencia respecto de los cruzamientos entre líneas homocigóticas descritos anteriormente (Pérez-Enciso y Toro, 2007).
Mostrar más

90 Lee mas

Regresión lasso bayesiana  Ajuste de modelos lineales penalizados mediante la asignación de priores normales con mezcla de escala

Regresión lasso bayesiana Ajuste de modelos lineales penalizados mediante la asignación de priores normales con mezcla de escala

En este caso interesa conocer los parámetros de regresión (𝛽 1 , 𝛽 2 , … , 𝛽 𝑝 ), el objetivo es es- timarlo como la moda a posteriori de la distribución de los mismos (𝜷 ̂ 𝐿𝑎𝑠𝑠𝑜 ) pero la distribu- ción 𝑓(𝜷|𝒚, 𝜎 2 , 𝜆) es desconocida, o bien, la integración que debería realizarse para su cálculo es demasiado compleja. Como éste método realiza simultáneamente estimación y selección de variables, se aplica la noción propuesta por George & McCulloch (1993) para la selección vía GS, en la cual el modelo de regresión canónico se rescribe a través de un mo- delo jerárquico.
Mostrar más

7 Lee mas

Bayes006A

Bayes006A

Este enfoque de la probabilidad es ampliamente aprovechado por la metodolog´ıa bayesiana y es por ello que podemos decir que la estad´ıstica bayesiana va m´ as all´ a que la estad´ıstica frecuentista al buscar aprovechar toda la informaci´ on disponible, as´ı se trate de datos observados o de informaci´ on de otro tipo que nos ayude a disminuir de manera coherente nuestra incertidumbre en torno a un fen´ omeno aleatorio de inter´ es. Un buen ejemplo para ilustrar que efectivamente la pura experiencia de las personas puede contener informaci´ on muy valiosa consiste en el siguiente ejercicio. En un sal´ on de clase se solicita a cada estudiante que anote en un papel tres cosas: su estatura y las estaturas m´ axima y m´ınima que ´ el (o ella) creen que hay en el sal´ on. A´ un cuando no se hayan practicado mediciones de es- tatura en el sal´ on es sorprendente corroborar que en general los alumnos tendr´ an una idea de las estaturas m´ axima y m´ınima bastante cercana a la realidad, lo que nos da idea de la cantidad de informaci´ on valiosa que puede llegar a tener una apreciaci´ on subjetiva.
Mostrar más

104 Lee mas

ALGEBRA

ALGEBRA

Sea X variable independiente e Y la variable dependiente; vamos a intentar encontrar la ecuación de la recta que mejor se ajuste a la nube. Para ello vamos a utilizar el método de los mínimos cuadrados que consiste en hacer mínima la suma de los cuadrados de las diferencias entre los valores observados experimentalmente y los teóricos que se obtengan mediante la recta. De la aplicación de este método se deduce que la recta de regresión pasa por ( x , y ) .

185 Lee mas

Lynch2007

Lynch2007

Trace plot for 5000 iterations of an MH algorithm sampling parameters from planar density for GSS free speech and political participation data: Bivariate normal proposal density with cor[r]

385 Lee mas

FormulBT

FormulBT

In particular, it records the appropriate likelihood function, the sufficient statistics, the conjugate prior and correspond- ing posterior and predictive distributions, the reference pr[r]

16 Lee mas

Introduccion

Introduccion

acumulando conocimiento y ha propuesto modelos para tratar de explicar los fen´ omenos reales en los que se ve involucrado?. Modelos o Leyes f´ısicas del Movimiento de los Cuerpos.[r]

69 Lee mas

a first course in statistical bayesian methods

a first course in statistical bayesian methods

In these situations we can combine Gibbs and Metropolis-type proposal distributions to generate a Markov chain to approximate the joint posterior distribution of all of the parameters. I[r]

270 Lee mas

Luis Rodríguez Ojeda

Luis Rodríguez Ojeda

Regresión lineal múltiple 12.1 Método de mínimos cuadrados 12.2 Método de mínimos cuadrados para k = 2 12.3 Regresión lineal múltiple en notación matricial 12.4 Análisis de varianza 12.5[r]

311 Lee mas

Marchionni, M. et al (2005).pdf

Marchionni, M. et al (2005).pdf

La Tabla 1 presenta estimaciones de los coeficientes β 0 (τ) y β 1 (τ) para al- gunos valores seleccionados de τ: 0.10, 0.30, 0.50, 0.70 y 0.90. La informa- ción contenida en cada par de filas es similar a la información relevante dispo- nible cuando se estima un modelo simple de regresión: la primer fila contiene los coeficientes estimados y debajo se presentan estimaciones de un estadísti- co “ τ ” correspondiente a la hipótesis nula de que el coeficiente poblacional es cero, los cuales fueron obtenidos con los métodos discutidos en el Apéndice, las filas tres y cuatro contienen información similar para los coeficientes β 1 (τ) . Nótese que la Tabla contiene información para una familia de modelos de regresión, uno para cada uno de los cuantiles seleccionados en cada columna. La última columna presenta los resultados de estimar por el método de míni- mos cuadrados ordinarios (MCO), que en este caso son muy similares a las obtenidas para el cuantil 0.50. Las rectas de regresión contenidas en la Figura 3 se corresponden a las estimaciones de esta Tabla. La elección de los valores τ: 0.10, 0.30, 0.50, 0.70 y 0.90. fue completamente arbitraria, en realidad po- dríamos haber elegido cualquier conjunto de valores del intervalo (0,1) y por razones de simplicidad en la presentación es habitual concentrar el análisis en un subconjunto relevante de valores 3 .
Mostrar más

153 Lee mas

Aplicación del Elastic Net LASSO y modelos relacionados en selección genómica basados en marcadores moleculares.

Aplicación del Elastic Net LASSO y modelos relacionados en selección genómica basados en marcadores moleculares.

modelo puede ser usado exitosamente cuando el tama˜ no de muestra es mucho menor que el n´ umero de predictores (n << p). En este trabajo se muestra c´omo utilizar este modelo para incluir de forma conjunta Marcadores Moleculares (MM) y Pedigree, ampliamente utilizados en gen´etica cuantitativa en la llamada selecci´on asistida por MM. Por medio de validaci´on cruzada, el poder predictivo del BEN se compara con el de otros modelos: LASSO Bayesiano y Regresi´on Ridge Bayesiana, usando datos reales de rendimiento de cultivares de trigo y cebada, y tiempos de floraci´on de ma´ız. Los resultados muestran que el BEN tiene un poder predictivo igual o superior que el resto de los modelos mencionados.
Mostrar más

68 Lee mas

El frijol en la Era Genómica

El frijol en la Era Genómica

Hoy en día existen diferentes herramientas e información genómica del frijol, disponibles para estudiar la diversidad presente en la especie, tales como mapas de liga- miento, colecciones de marcadores, bibliotecas de cromosomas artificiales bacterianos (BAC, Bacterial Artificial Chromosome), un mapa físico y la secuencia del genoma com- pleto (McCLEAN et al., 2008; GEPTS et al., 2008). Recientemente, se han secuenciado dos genomas, uno de una variedad criolla del acervo Andino (BeanCap, http://www.phyto- zome.net/commonbean.php; SCHMUTZ et al., 2014) y otro de una línea mejorada del acervo Mesoamericano (PhasIbeAm, http://mazorka.langebio.cinvestav.mx/phaseolus/; manuscrito en preparación). Para el genoma del frijol Andino se reportó un genoma en- samblado de 473 Mb y cerca de 27197 genes, mientras que para la línea Mesoamericana se tiene un ensamblado de 550 Mb y 28520 genes.
Mostrar más

16 Lee mas

Universidad Tecnológica de la Mixteca Selección bayesiana de modelos aplicada al ANOVA usando distribuciones a priori intrínsecas

Universidad Tecnológica de la Mixteca Selección bayesiana de modelos aplicada al ANOVA usando distribuciones a priori intrínsecas

alternativas tales como: la aproximación asintótica de Schwarz (1978), llama- do también “Criterio de Información Bayesiana” (CIB); el factor de Bayes frac- cional (FBF) y el factor de Bayes intrínseco (FBI) propuesto por O’Hagan (1994) y Berger y Pericchi (1996), respectivamente. Críticas y comparaciones de estos métodos relevantes son incluidos en Berger y Pericchi (1998), De Santis y Spez- zaferri (1999), Moreno (1997), Moreno, Bertolino y Racugno (1998) y O’Hagan (1995,1997). Debemos enfatizar que aunque el factor de Bayes fraccional o el factor de Bayes intrínseco no son factores de Bayes verdaderos, son asintótica- mente consistentes. Esto permite, bajo ligeras condiciones, hallar distribuciones a priori intrínsecas y fraccionales, para obtener un factor de Bayes verdadero. Motivaciones y justificaciones para el uso de distribuciones a priori intrínsecas en problemas de selección de modelos han sido dadas por Berger y Pericchi (1997), Moreno (1997), Moreno, Bertolino y Racugno (1998). En este capítulo se cons- truyen y se calculan los correspondientes factores de Bayes del modelo M 2 frente
Mostrar más

116 Lee mas

Infectología en la era de la genómica

Infectología en la era de la genómica

La nueva generación de secuenciadores (NGS) ha llegado para cambiar el modo de realizar investigación. Particularmente en Infectología, estas tecnologías mo- dernas la han dirigido a una próxima era, denominada la “era de la genómica”. En países desarrollados, las NGS se están utilizando en un gran número de aplicaciones, las que incluyen diagnóstico clínico, epidemiología y microbiología. En la actualidad, secuenciar el genoma de un microorganismo completo, ya sea bacteriano o viral, cuesta aproximadamente $100 dólares, precio bastante asequible en comparación a los precios de las tecnologías más antiguas. En esta revisión se describen algunas pu- blicaciones recientes que han utilizado la secuenciación de genomas completos para, (i) rastrear brotes de enfer- medades transmitidas por alimentos, (ii) la preparación de base de datos de genomas para los Gobiernos (iii) investigación de enfermedades nosocomiales, y (iv) en diagnóstico clínico. La era de la genómica está aquí, y llegó para quedarse, por lo cual se debe enfocar todos los esfuerzos en aprender a utilizar la gran cantidad de “datos masivos” generados por estas tecnologías, para reducir el impacto de las enfermedades infecciosas y así, mejorar la salud de personas y animales.
Mostrar más

6 Lee mas

Actividad antioxidante de flavonoides de las hojas de Chromolaena tacotana (Klatt) R. M. King & H. Rob

Actividad antioxidante de flavonoides de las hojas de Chromolaena tacotana (Klatt) R. M. King & H. Rob

Regresión lineal de porcentaje de actividad antioxidante vs concentración para el flavonoide Ct1 por el método ABTS ●+... Regresión lineal de porcentaje de actividad antioxidante vs co[r]

66 Lee mas

Transparencias 6.pdf

Transparencias 6.pdf

Weinschelbaum Universidad de San Andres () Microeconomía Avanzada 1er Trimestre 2017 45 / 54.. Racionalidad bayesiana. Podemos de…nir lo que se conoce como racionalidad bayesiana :[r]

54 Lee mas

Modelos lineales para Regresi ´on

Modelos lineales para Regresi ´on

MATLAB: regresi ´on lineal Bayesiana..[r]

37 Lee mas

Estimación de tarifas de fletes a través del uso del método de la regresión cuantílica

Estimación de tarifas de fletes a través del uso del método de la regresión cuantílica

El presente trabajo se articula como Trabajo Final de Aplicación correspondiente a la Maestría en Dirección de Negocios de la Escuela de Graduados de la Facultad de Ciencias Económicas de la Universidad Nacional de Córdoba. El mismo, tiene por objeto estimar tarifas de fletes a través del uso del método de la Regresión Cuantílica, utilizando información correspondiente a Estados Unidos de América. Es importante resaltar que durante la realización del trabajo no fue posible acceder a fuentes confiables de la República Argentina en materia de transporte, que fueran capaces de proveer una base de datos con el nivel de detalle requerido. Es por este motivo que se utilizó como ambiente de prueba la base de datos correspondiente a los Estados Unidos de América.
Mostrar más

73 Lee mas

Show all 10000 documents...