datos/modelos

Top PDF datos/modelos:

Modelos de madurez para la mejora de calidad de los datos de los indicadores de desarrollo sostenible

Modelos de madurez para la mejora de calidad de los datos de los indicadores de desarrollo sostenible

El primer conjunto de preguntas tenía por objetivo investigar si la solución propuesta (es decir, la utilización de CMMs para mejorar la calidad de los datos estadísticos producidos por las NSOs para los indicadores de los SDGs) podía resultar de utilidad. La gran mayoría de los entrevistados contestó afirmativamente con excepción de uno de ellos – perteneciente a una NSO – quien consideró que la solución no resultaría útil ya que el rol de las NSOs en general, y en la producción de datos estadísticos para la Agenda 2030 en particular, varía significativamente entre los distintos países. Entre quienes respondieron de manera afirmativa, las respuestas resaltaron la importancia y la utilidad del trabajo (“Actually, I think it’s very important, especially [for] ensuring the capacity gap at the NSOs”, “I think it’s good”, “I think this is a very nice initiative”, “That’s why I say, this is very good”). Resultó de gran utilidad además observar posibles aplicaciones que no fueron consideradas en su concepción; por ejemplo, uno de los entrevistados señaló que el modelo se podría utilizar como herramienta para determinar la capacidad de las NSOs para producir datos para ciertos indicadores (“I think through that process of assessment you can say, OK, maybe this has this available capacity to produce for some social indicators but not for some indicators because of one, two, three. That’s the way I think about it.”), lo que introduce un nivel de granularidad de análisis que no había sido considerado previamente. Otro indicador positivo fue que uno de los entrevistados asoció este trabajo como un posible complemento al trabajo que está realizando Paris21 [183] para desarrollar las capacidades de las NSOs (“So, it’s related to the work you are doing, but for you it’s more like broader.”). Debe considerarse en este ejercicio, sin embargo, la limitación de tiempo de análisis y comprensión del problema que tuvieron los entrevistados, especialmente quienes no estaban familiarizados con el concepto de modelos de madurez de capacidad.
Mostrar más

132 Lee mas

Estimación bayesiana de modelos lineales generalizados en datos funcionales

Estimación bayesiana de modelos lineales generalizados en datos funcionales

En el transcurso de los años se han elaborado significativos estudios en el análisis funcional, estudios hechos por Silverman, Ramsay, Horváth, kokoszka, Möller, entre otros. Los datos funcionales han evolucionado de tal forma que cada uno de los temas de la estadística clásica se puede explicar y manejar en el análisis funcional, desde lo descriptivo hasta modelos o manejo de multivariada para curvas o procesos estocásticos. La teoría propia de lo funcional proviene de series temporales, y así mismo como tema de la estadística usual se puede implantar series de tiempo funcionales son incluidas dentro del entorno de procesos Hilbertvaluados. En este ámbito, existen re- sultados recientes sobre estimación para-métrica funcional, así como sobre extrapolación (ver Bosq[18], Guillas [42], Ruiz-Medina y Salmerón [82], Salmerón y Ruiz-Medina [84], entre otros). La estimación del modelo gene- ralizado bayesiano aplicado a los procesos estocásticos, depende de la distribución de la familia exponencial de los datos a escoger y la determinación de la función de verosimilitud, para luego aplicar un algoritmo.
Mostrar más

40 Lee mas

Metodología econométrica para el análisis económico del delito. Los modelos de datos de panel

Metodología econométrica para el análisis económico del delito. Los modelos de datos de panel

Pero además, otra de las virtualidades de los modelos de datos de panel, concretamente del de efectos fijos, sería que nos permitiría hacer comparaciones entre datos transversales (por ejemplo CCAA, o provincias), calculando sus índices de eficiencia relativa. Su fundamentación teórica se encuentra, a grandes rasgos, en el método que desarrolló Farrell (1957) para el cálculo empírico de la eficiencia técnica de las empresas y que, como se explica en Álvarez (2001:24), se basa en la idea de comparar la actuación real de la empresa con respecto a un óptimo. Pero como normalmente el investigador no tiene un conocimiento exacto del mundo que rodea a la empresa, ni de las restricciones que afectan a la obtención del máximo beneficio, entonces, en lugar de comparar lo que hace la empresa con lo que debería de hacer para obtener el máximo beneficio, se compara con lo que hacen otras empresas parecidas, calculando de esta forma una “frontera” empírica que sería el estándar de referencia, por lo que las desviaciones a dicha medida serían indicadores de ineficiencia.
Mostrar más

12 Lee mas

Base de datos y teoría de modelos finitos

Base de datos y teoría de modelos finitos

Desde el año 1999 está vigente el nuevo plan de la carrera, en el cual estas tres asignaturas sufrieron cambios de contenidos buscando adaptarse a la realidad contemporánea, dados los cambios existentes en la última década en lo que a computación se refiere. En el tópico Bases de Datos, prácticamente se han respetado los contenidos del plan anterior, agregándole la vinculación más estrecha a Teoría de Modelos Finitos. También, la incorporación de nuevas asignaturas al Plan nuevo tales como Lógica, Complejidad y Computabilidad, permiten establecer una conexión más clara con la Teoría de Base de Datos.
Mostrar más

9 Lee mas

MANTICA: una herramienta de métricas para modelos de datos

MANTICA: una herramienta de métricas para modelos de datos

Dado el panorama existente nos vimos en la necesidad definir y validar métricas para modelos de datos conceptuales (Genero, et al, 2000a; Genero et al, 2000b). Específicamente, nos centramos en los diagramas entidad interrelación (E/R), ya que, en el mundo de los SI, sigue siendo aún el método de modelado más utilizado (Muller, 1999). Nuestro objetivo al definir métricas es poder medir la complejidad estructural de los diagramas E/R, considerando que tal complejidad puede influir considerablemente en el esfuerzo de desarrollo y mantenimiento de los SI que serán finalmente implementados. Además, estas medidas pueden ayudar a los profesionales e investigadores a tomar las mejores decisiones (Pfleeger, 1997), y a los diseñadores a elegir entre distintos modelos de datos alternativos.
Mostrar más

12 Lee mas

Elaboración de modelos predictivos con datos multimodales

Elaboración de modelos predictivos con datos multimodales

Actualmente el número de datos ómicos analizados en las mismas muestras puede ser muy elevado. Se puede dar el caso, que en unas mismas muestras se hayan analizado la transcriptómica, la expresión de los miRNAs, epigenómica y que también se hayan recogido datos clínicos. La integración de todos estos datos ómicos y su posible utilización en la creación de modelos predictivos para evaluar su posible utilización para la clasificación de pacientes, plantea una serie de dificultades debido a la propia naturaleza de las técnicas utilizadas. Algunos de los problemas que uno se puede encontrar es por ejemplo que los resultados tengan una escala diferente, que se traten de tipos de variables diferentes o que el número de variables a integrar o estudiar conjuntamente pueda ser muy diferente. Otro tipo de problema que se puede contabilizar es el hecho de que cuando se utilizan para crear modelos predictivos, en el modelo final unos datos ómicos tienden a estar sobre representados en detrimento de otros. Por todos estos problemas creemos que es muy interesante el estudio de diferentes métodos de integración de datos ómicos multimodales que permitan un obtener un mejor conocimiento y así poder diseñar una estrategia de análisis conjunta más eficiente.
Mostrar más

70 Lee mas

Consultas en nuevos modelos de bases de datos

Consultas en nuevos modelos de bases de datos

Por la capacidad de almacenar datos estruc- turados que poseen las bases de datos tradi- cionales se aplica en este modelo el concepto de b´usqueda exacta, es decir consultas por ex- actitud o por rango de valores suceptibles de ser ordenados, sobre los datos almacenados en registros de tama˜no fijo compuestos por cam- pos comparables. Al surgir la posibilidad de al- macenar en una base otros tipos de datos tales como los objetos multimediales (im´agenes, video, texto) y el hecho de que estos datos no puedan estructurarse, hace necesaria la defini- cion de nuevas operaciones y capacidad de al- macenamiento en las bases de datos. Se espera poder realizar en estos modelos b´usquedas efi- cientemente, teniendo en cuenta cuestiones co- mo que la b´usqueda exacta no resulta de in- ter´es y que en ciertas ocasiones se requiere mantener los distintos estados de la base de datos a trav´es de tiempo y no s´olo el m´as re-
Mostrar más

5 Lee mas

Modelos de clasificación para incidencias en entornos industriales con datos no balanceados

Modelos de clasificación para incidencias en entornos industriales con datos no balanceados

Hacer especial mención a los modelos, no tan conocidos, como son los de aprendizaje por refuerzo (Reinforcement learning) o también denominados semisupervisados. Estos modelos aprenden de la experiencia y son una combinación de los modelos supervisados y no supervisados. El sistema recibe entradas mientras interactúa con los procesos de fabricación y toma decisiones para maximizar las recompensas futuras. La idea es que en lugar de un conjunto de datos de entrenamiento que indica el resultado correcto para una entrada determinada, solo se hará una indicación de si una acción es correcta o no. Si una acción no es correcta, entonces habrá que continuar hasta encontrarla [25].
Mostrar más

78 Lee mas

Modelos alternativos para el análisis de datos de conteo con exceso de ceros

Modelos alternativos para el análisis de datos de conteo con exceso de ceros

Esta discrepancia en los resultados favorece la idea de intentar comparar mediante otros métodos los modelos NB2 y “Zero-inflated” antes de concluir definitivamente que no existen dos procesos diferentes que den origen al exceso de ceros observados. Además resta la alternativa de probar el ajuste del denominado modelo “Hurdle”, que también consi- dera dos procesos diferentes para la generación de datos pero donde los ceros son sólo generados por uno de ellos.

11 Lee mas

Modelos de regresión para datos de duración en estudios multicéntricos

Modelos de regresión para datos de duración en estudios multicéntricos

Como era de esperar, el tratamiento ingenuo de los datos conduce en general a probabilida- des asociadas menores que bajo los otros enfoques. En el ajuste del modelo marginal, si bien hay variaciones en las probabilidades asociadas, no alcanzan a alterar prácticamente la significación de las variables si se toma como criterio un nivel del 5%. Sólo se observa que la probabilidad asociada al efecto de los países México y Guatemala, en comparación con Argentina, pasa de 0.0836 a 0.0527, valor muy cercano al nivel de significación elegido. En cambio, en los modelos estratificado y el de efectos aleatorios, presencia de fotosensibi- lidad pierde su significación estadística, de manera más contundente en el enfoque condi- cional. El efecto de las variables edad al comienzo de síntomas, hipertensión, SLEDAI al diagnóstico y consumo de antimaláricos permanece significativo en todos los modelos.
Mostrar más

9 Lee mas

El diagnóstico de la sobredispersión en modelos de análisis de datos de recuento

El diagnóstico de la sobredispersión en modelos de análisis de datos de recuento

En este sentido, es importante recordar que el objetivo del análisis de datos es, en palabras de Bartholomew (1995, p. 13), identificar «las estructuras comunes que subyacen a diferencias superficiales», es decir, capturar las invariancias de los datos para de esta forma poder inferir el mecanismo generador de datos subyacente (Lindsey, 1995a). Sin embargo, difícilmente se podrá inferir el mecanismo generador de unos datos cuya naturaleza ha sido modificada. Dos de los principales problemas con los que topa dicho proceso de inferencia es que, por un lado, no existe un conjunto de soluciones cerradas y únicas que especifiquen, a modo de algoritmo, los pasos a seguir ante cualquier patrón de datos para identificar su correspondiente mecanismo generador; y por otro lado, tampoco existe una herramienta estadística multipropósito aplicable a cualquier tipo de datos. No obstante, es imprescindible contar con a) un procedimiento de análisis de datos, así como b) herramientas específicas, es decir, modelos basados en distribuciones que representen adecuadamente los datos:
Mostrar más

187 Lee mas

Asimilación de datos GPS por los modelos de predicción numérica

Asimilación de datos GPS por los modelos de predicción numérica

Una correcta descripción de las condiciones atmosféricas, y en concreto, de la distribución de vapor de agua, es fundamental para la pericia de las predicciones de los modelos de predicción numérica del tiempo. Uno de los sistemas últimamente utilizados para conocer la humedad de la atmósfera es el sistema GPS (Global Positioning System) ya que los retrasos de la señal recibida por los sensores de tierra (ZTD), dan información directa de esta variable. E l INM participa actualmente en el proyecto TOUGH, cuyo objetivo es desarrollar los métodos necesarios para la inclusión de datos de GPS de todas las estaciones europeas disponibles en los modelos numéricos. Se muestran aquí los primeros resultados de la utilización de estos datos por el sistema de "asimilación variacional" del modelo HIRLAM, así como el impacto de los mismos en la calidad de las predicciones en un caso de estudio.
Mostrar más

10 Lee mas

Introducción a modelos de datos de panel

Introducción a modelos de datos de panel

Este trabajo abordará varios tipos de modelos lineales y estáticos adecuados pa- ra datos de panel. En primer lugar, vamos a plantear un modelo de datos de panel, señalando sus principales características y, en función de éstas, clasicar los distin- tos modelos que pueden aparecer. Asimismo, presentaremos la principales ventajas e inconvenientes de este tipo de modelo. Seguidamente, trabajaremos con el modelo de datos panel más sencillo, aquel en el que aparecen dos periodos temporales, para presentar la principal ventaja de dichos modelos, a saber, controlar la heterogenei- dad individual inobservable. A continuación, estudiaremos los dos tipos de modelos lineales y estáticos más importantes: el modelo de efectos jos y el modelo de efectos aleatorios. Además, aplicaremos toda esta teoría, mediante el programa informático E-views, a los datos utilizados en el trabajo seminal de Baltagi y Grin (1982) sobre la demanda de gasolina en la OCDE.
Mostrar más

27 Lee mas

Modelos basados en datos GPS para determinar la no detención de buses en paraderos

Modelos basados en datos GPS para determinar la no detención de buses en paraderos

De igual forma, sería interesante desarrollar modelos para distintos escenarios, alguno que funcione en horarios y zonas congestionadas, mientras que otros calibrados con otros datos logren representar a los buses en horarios nocturnos o calles descongestionadas. Esto puede sugerir un modelo de Big Data, donde el modelo de predicción no funcione igual para todas las observaciones, sino que sea definido para cada paradero. Es más, su detalle puede ser aún más, mejorando la predicción haciendo diferenciación por horario y día de la semana. Sin embargo, el costo de esto es alto, ya que hoy en día no se cuenta con la información para generar este tipo de modelo.
Mostrar más

106 Lee mas

Modelos de datos espaciales

Modelos de datos espaciales

• Una componente espacial, también denominado objeto espacial o extensión espacial, puede incluir geometría (ubicación en el espacio geométrico subyacente, forma, etc.) y topología (relaciones espaciales con otros objetos). Por ejemplo, una ciudad puede tener como valor geométrico un polígono en el espacio 2D. La componente espacial aislada de un objeto geométrico se denomina objeto espacial. Puede darse el caso que se considere separadamente. El atributo espacial de un objeto geográfico no tiene una correspondencia con los tipos de datos tradicionales. La representación geometría y topología requiere de modelos poderosos, que lleva a los modelos de datos espaciales. Los tipos de datos básicos que usualmente se utilizan en los modelos de datos espaciales incluyen: punto, línea y región.
Mostrar más

5 Lee mas

Modelos gráficos en datos discretos

Modelos gráficos en datos discretos

A partir del modelo gr´afico ajustado y su conjunto generador pode- mos obtener la gr´afica correspondiente y determinar las independencias condicionales y marginales que existen en los datos. Adem´as, a trav´es de la gr´afica, podemos identificar las asociaciones que existen entre las variables. Para poder hacer inferencia y as´ı determinar si las indepen- dencias obtenidas son genuinas, es necesario determinar que tan bien se ajusta el modelo a los datos. Para ello se utiliza un estad´ıstico, es decir una funci´on de los datos y de los valores estimados, conocido como de- vianza residual. Con esto se prueba la hip´otesis nula de que el modelo se ajusta bien a los datos contra la alternativa de que no. La devianza residual corresponde a una funci´on del cociente de las funciones de ve- rosimilitudes del modelo que se quiere ajustar y un modelo con ajuste perfecto, o sea un modelo bajo el cual los valores estimados correspon- den con los valores reales, llamado modelo saturado. Cuando el valor obtenido es grande quiere decir que el modelo saturado y el de inter´es difieren mucho entre s´ı y conforme disminuye implica que no es as´ı, por lo anterior cuando el valor es grande se rechaza la hip´otesis nula. En realidad todo esto aplica a modelos loglineales en general y se adapta a los modelos gr´aficos loglineales, obteniendo expresiones particulares, por ejemplo se puede obtener la expresi´on de la devianza resultante al quitar una arista (devianza que resulta de comparar el modelo con y sin la arista) y as´ı probar si conviene o no quitarla del modelo.
Mostrar más

12 Lee mas

Modelos de encriptación en base de datos MS-SQL Server.

Modelos de encriptación en base de datos MS-SQL Server.

Esto quiere decir, que hasta la fecha en materia de seguridad de información enfocada hacia bases de datos la protección más efectiva es la criptografía asimétrica, sin lugar a dudas es un concepto muy trabajado y mejorado a lo largo del tiempo, se puede decir que es la evolución de aprendizaje múltiple en prevención de vulnerabilidades, ya que hoy en día es usado por bancos, grandes empresas, compañías de comercio electrónico, es decir todos aquellos que buscan la defensa de su información se ven abocados al uso de este método de protección.

70 Lee mas

Comparación del rendimiento de los modelos de base de datos para un software

Comparación del rendimiento de los modelos de base de datos para un software

También se partió de la búsqueda de respuesta a la pregunta: ¿Puede una empresa pequeña utilizar bases de datos no relacionales de forma óptima? Existen grandes empresas como Google o Facebook, que han conseguido adaptar este tipo de bases de datos a sus necesidades. En el caso de Facebook, es obvio que para mostrar un “muro” les resulta mucho más cómodo que la base de datos devuelva un documento con toda la información. Mientras que, en el caso de Google, más similar al nuestro, han desarrollado una base de datos específica, conocida como “BigTable”, totalmente adaptada a sus necesidades de minería de datos. Pero volviendo a la pregunta planteada, ¿Seremos capaces de adaptar los sistemas no relacionales que actualmente se encuentran en el mercado ofreciendo un mejor rendimiento del que se puede conseguir con una base de datos tradicional? ¿O, por el contrario, este auge de las bases de datos no relacionales es producto del bombo que han recibido de los mismos usuarios/desarrolladores?
Mostrar más

138 Lee mas

Aplicación y comparativa de cuatro modelos de clustering para datos GTEx

Aplicación y comparativa de cuatro modelos de clustering para datos GTEx

Para entender la estructura y función de los genes no sólo es necesario el análisis aislado de las se- cuencias genómicas (genómica) sino también el análisis de la expresión génica de una célula o tejido (transcriptómica) y la caracterización de la presencia de proteínas, sus asociaciones y/o modificaciones post-traduccionales en células normales, enfermas o sujetas a diversos estímulos (proteómica). La genó- mica, transcriptómica y proteómica se ha ido perfeccionando notoriamente en estos últimos años gracias al desarrollo de metodologías de secuenciación masiva de alto rendimiento (next-generation sequencing, NGS) generandose grandes bancos de secuencias de ADN, ARN o peptídicas, las cuales se almacenan en bases de datos construidas por grandes consorcios como por ejemplo GenBank, UCSC (University of California, Santa Cruz) o GTEx (Genotype-Tissue Expression). La extraordinaria gran cantidad de in- formación genómica, transcriptómica y proteómica da lugar al desarrollo de herramientas bioinformáticas capaces de analizar, integrar y manipular dicha información en un corto periodo de tiempo [2].
Mostrar más

85 Lee mas

Modelos de datos para datos espaciales

Modelos de datos para datos espaciales

En estos tiempos el ´area de bases de datos recibe siempre nuevos desaf´ ıos. Hoy d´ ıa, una base de datos puede mantener p´aginas web, dise˜ no de chips, video, im´agenes satelitales, m´ usica o mapas. Las funciones b´asicas que debe ofrecer un sistema de base de datos son siempre las mismas: almacenamiento eficiente y posibilidades de acceso y consultas sobre los datos. Sin embargo, se requiere de una amplia variedad de t´ecnicas, integrando aproximaciones cl´asicas y especializadas para cada uno de los varios tipos de datos que debe manejar [RSV02]. Entre los datos especializados manejados por las bases de datos est´an los datos espaciales. Los datos espaciales son un tipo de dato que tiene asociado informaci´on geogr´a fi ca. Estos datos son centrales en diferentes tipos de aplicaciones, como son los Sistemas de Informaci´on Geogr´afica(GIS), sistemas para Dise˜ no Asistido por Computadora (CAD), rob´otica, procesamiento de im´agenes e Integraci´on en Gran Escala (VLSI). Todas estas aplicaciones coinciden en el requerimiento de objetos espaciales que ser´an almacenados, consultados y visualizado.
Mostrar más

5 Lee mas

Show all 10000 documents...