• No se han encontrado resultados

Probabilidades y Estadística Introducción al Análisis de Datos

N/A
N/A
Protected

Academic year: 2021

Share "Probabilidades y Estadística Introducción al Análisis de Datos"

Copied!
12
0
0

Texto completo

(1)

Probabilidades y Estadística

Introducción al Análisis de Datos

Municipio densidad energia población

Acebeda (La) 2.49 237 55

Ajalvir 140.56 53.871 2.755

Alameda del Valle 7.8 996 195

Alamo (El) 260.54 18.246 5.784

Alcalá de Henares 2149.59 940.718 188.519

Alcobendas 2187.04 610.305 98.417

Alcorcón 4582.82 520.648 154.441

Aldea del Fresno 34.81 7.978 1.803

Algete 448.42 72.054 16.995

Alpedrete 764.05 31.192 9.627

Ambite 12.42 1.473 323

Anchuelo 26.57 3.539 574

Aranjuez 221.56 182.221 41.897

Arganda del Rey 454.83 317.136 36.250

Arroyomolinos 295.46 53.680 6.116

Atazar (El) 3.42 219 101

Batres 57.59 6.312 1.244

Becerril de la Sierra 138.64 13.659 4.090

Belmonte de Tajo 48.27 2.603 1.144

Berrueco (El) 16.08 3.003 463

Berzosa del Lozoya 11.19 440 160

Boadilla del Monte 655.08 125.833 30.920

Boalo (El) 108.16 16.412 4.283

Braojos 7.63 392 190

Brea de Tajo 10.54 1.031 467

Brunete 142.82 19.905 6.984

Buitrago del Lozoya 64.04 8.481 1.697

Bustarviejo 28.78 4.901 1.649

Cabanillas de la Sierra 38.3 2.186 540

Cabrera (La) 89.78 7.385 2.011

Cadalso de los Vidrios 51.49 16.344 2.451

Camarma de Esteruelas 101.1 48.678 3.579

Campo Real 53.65 16.888 3.310

Canencia 9.15 1.100 482

Carabaña 27.84 4.393 1.325

Casarrubuelos 275.47 4.069 1.460

Cenicientos 27.3 4.473 1.859

Cercedilla 175.89 23.749 6.297

Cervera de Buitrago 10.75 368 129

Chapinería 63.78 4.480 1.620

Chinchón 39.48 17.141 4.576

Ciempozuelos 323.75 68.330 16.058

Cobeña 173.03 13.086 3.599

Collado Mediano 235.27 13.108 5.317

Collado Villalba 2009.29 186.613 50.634

Colmenar Viejo 203.94 133.773 37.239

Colmenar de Oreja 49.54 20.594 6.257

Colmenar del Arroyo 20.34 3.059 1.029

Colmenarejo 196.69 17.778 6.235

Corpa 17.8 861 461

Coslada 6.848,00 307.349 82.176

Cubas de la Sagra 189.14 9.508 2.421

Daganzo de Arriba 121.16 65.440 5.307

Escorial (El) 184.14 50.614 12.669

Estremera 14.35 5.875 1.135

Fresnedillas de la Oliva 38.33 2.121 1.081

Fresno de Torote 29.46 3.460 931

Fuenlabrada 4794.97 626.853 187.963

Fuente el Saz de Jarama 158.43 25.481 5.260

Fuentidueña de Tajo 25.03 9.583 1.517

Galapagar 413.18 68.023 26.857

Garganta de los Montes 8.64 1.624 348

Gargantilla del Lozoya y Pinilla de Buitrago 12.57 1.555 303

Gascones 6.9 600 138

Getafe 1993.81 1.040.736 156.315

Griñón 378.97 56.702 6.594

Guadalix de la Sierra 67.36 14.832 4.109

Guadarrama 209.77 43.974 11.957

Hiruela (La) 5.76 127 99

Horcajo de la Sierra 6.93 771 147

Horcajuelo de la Sierra 4.83 295 115

Hoyo de Manzanares 148.45 18.048 6.725

Humanes de Madrid 601.95 88.274 11.738

Leganés 4104.41 516.947 176.900

(2)

Análisis de Datos

Objetivos:

•Descubrir las

posibilidades del el análisis de datos

•Motivar el uso de herramientas que aportan fiabilidad, flexibilidad y

productividad en la gestión datos y explotación de la información

•Mostrar la metodología estadística de

análisis de datos con aplicaciones y

modelos implementados

(3)

•Observaciones, Medidas, Datos

•Información / Incertidumbre

•Conocimiento (relaciones, probabilidad)

•Decisión, Predicción

Métodos de estudio/investigación/análisis de datos

Problemas

Definir y comprender Soluciones

Explicación

(4)

Introducción.

Qué es la estadística?

•Es el estudio y aplicación de los métodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos, siempre y

cuando la variabilidad y la incertidumbre sea una causa intrínseca de los mismos.

•El objetivo es explorar los datos y realizar inferencias con la información disponible para comprender los procesos que generan

los datos, ayudar a tomar decisiones y realizar predicciones.

•La exploración, descripción y análisis se limita al conjunto datos observado mediante resumenes numéricos y gráficos de la frecuencia.

•Por otra parte, la inferencia extiende las conclusiones del estudio al proceso

generador de la información mediante el uso de modelos probabilísticos o

estocásticos.

(5)

Inferencia Estadística:

Probabilidad de que la Inferencia sea correcta sobre la población objeto de estudio.

Obtener conclusiones basadas en datos experimentales e información subjetiva: Inferencia Bayesiana.

El objetivo de la Inferencia Estadística y la Inferencia

Bayesiana es evaluar la Incertidumbre mediante Probabilidad.

(6)

Estadística Fácil Aprender estadística: ¿por qué? y ¿para qué?

•Herramienta de trabajo

•Solución de problemas

•Investigación teórica y aplicada

•Comprensión y

utilización de la investigación

•Satisfacción personal

(7)

Análisis de datos e

Interpretación de resultados

Extracción de información de un conjunto de datos

• Gráficos y tablas

• Medias o promedios aritméticos

• Variabilidad

• Unidades, rangos e intervalos

• Coeficientes de correlación

• Fiabilidad experimental

• Validez, tests o contrastes

• Regresión, predicciones, muestra

• Inferencia estadística

• Comparar muestras

Razonamiento:

ciclo deductivo e inductivo

El método estadístico

(8)

Población y Muestra

Población

cualquier conjunto de objetos, personas, plantas, instituciones... o entes en general, que son portadores de una serie de características que nos interesa estudiar.

•Finita: alumnos de clase

•Infinita: clientes de un operador de telecomunicaciones Muestra

subconjunto representativo de la población de forma que las conclusiones sacadas en aquella se generalizan a ésta.

Coste, tamaño, sesgo, estimador.

Censo

Listado completo de la población

(9)

Conceptualización: Variables estadísticas y escalas

Stanley Stevens' "Scales of measurement" (1946): nominal, ordinal, interval, ratio

(variables estacionarias, temporales, espaciales,…)

Carácter estadístico cualitativo.

Escala nominal

Catálogo de productos de oferta en un supermercado clasificados por la sección donde se encuentran.

Catálogo de viajes de una agencia, clasificados por los destinos.

Catálogo de libros la una biblioteca, clasificados por materias.

Programas de la semana en una cadena de televisión, clasificados por franja horaria.

Titulados universitarios, clasificados por el título obtenido.

Carta de platos de un restaurante, clasificados por entrantes, primeros, segundos y postres.

Escala ordinal

Rutas de senderismo por los Picos de Europa, ordenados por nivel de dificultad.

Predicción del viento de la mar en el litoral Cantabrico durante un año, escala de vientos.

Estado de las playas de la península Ibérica un dia de agosto, código de banderas.

Estado de los pacientes en urgencias de un hospital, escala de valoración clínica.

Valoración de idoneidad para la localización de un planta industrial en un conjunto de alternativas.

Estado de conservación del ecosistema de un municipio expresado por sus habitantes, escala likert

de 5 niveles: MuyBien, Bien, Normal, Mal, MuyMal.

(10)

Conceptualización: Variables estadísticas y escalas

Carácter estadístico cuantitativo (unidades).

Escala discreta

Número de hijos.

Enlaces en una pagina web.

Averías de un vehículo en un año.

Plantilla de profesores de una universidad, años de edad.

Libros prestados a los usuarios de la biblioteca.

Espectadores de un programa de televisión.

Escala continua

Carta de platos de un restaurante, calorías.

Catálogo de productos de oferta en un supermercado, precio.

Duración de un viaje, tiempo.

Superficie de un inmueble.

Catálogo de viajes ofertados por una agencia, precio/dia.

Tiempo de espera de pacientes para ser atendido en la urgencia de un hospital.

Modelos de vehículos producidos por una marca, consumo.

(11)

Historía (breve) de la Estadística (y la probabilidad)

•Demografía Descriptiva

•Recursos naturales

•Juegos de AZAR Cálculo de PROBABILIDADES

•Investigación social, psicología, genética Muestreo e Inferencia

•Fundamentación teórica (axiomas, teoría de la medida, modelos probabílisticos)

•El ordenador y el software estadístisco: Estadística computacional.

•Análisis multivariante (bioestadística,…), temporal (economía,…) y espacial (x,y,z)

•Simulación y Análisis de Decisiones.

•Grandes bases de datos: Minería de Datos.

(12)

Historía (breve) de la Estadística (y la probabilidad)

S. XVII - Pascal, Fermart, Huygens,Graunt, J. y N. Bernoulli,…

S. XVIII – Montmort, Laplace, De Moivre, Bayes,

S. XIX – Legendre, Gaus, Bessel, Qutelet, Poisson, Chebyshev, Galton, Pearson,…

S. XX – Spearman, Gosset, Fisher, Kolmogorov, Hotelling, Smirnov, Glass, Tukey, Markov, Liapunov, Borel, Lévy, Frechet, Savage, de Fineti, von Mises, Weibull,

Snedecor, Savage, LindLey, Kruskal, Kendall, Gini, Feller, Erlang, Einstein, Cox, Chernoff, Box, Borel, Bonferroni, Efron, Yule, …

S. XXI - ….

Referencias

Documento similar

La publicidad digital tiene como su primordial herramienta a la página web y su contenido, para desarrollar esta nueva modalidad de publicidad, tiene poseer los elementos como las

• Eugeni Siscar, de BNP Paribas, añade como factor de incertidumbre la posibilidad de impago de la deuda

cuando se agregan en R p dos o más puntos que poseen leyes condicionales idénticas, entonces las distancias en R n no quedan modificadas. En los términos de nuestro ejemplo: si

Este libro intenta aportar al lector una mirada cuestiona- dora al ambiente que se desarrolló en las redes sociales digitales en un escenario de guerra mediática mantenido por

Para comprobar tanto el middleware como el controlador de acceso a datos de un nivel de red y un cliente de base de datos dados, utilice la función connectivity.. Figura 2-7:

En primer lugar, se va a realizar el contraste de Chow para concluir si hay cambio estructural desde el segundo trimestre de 2009, lo que nos indicará si

o esperar la resolución expresa" (artículo 94 de la Ley de procedimiento administrativo). Luego si opta por esperar la resolución expresa, todo queda supeditado a que se

1. LAS GARANTÍAS CONSTITUCIONALES.—2. C) La reforma constitucional de 1994. D) Las tres etapas del amparo argentino. F) Las vías previas al amparo. H) La acción es judicial en