• No se han encontrado resultados

CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES

N/A
N/A
Protected

Academic year: 2022

Share "CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES"

Copied!
27
0
0

Texto completo

(1)

CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES

TEMA I

(2)

Modelos Multivariantes 2

Algunas cuestiones previas. En Rial, A. y Varela, J. (2008). Estadística Práctica para la Investigación en Ciencias de la Salud. Coruña:

Netbiblo. Páginas 3-11.

Introducción al Análisis Multivariante. En Rial, A. y Varela, J. (2008).

Estadística Práctica para la Investigación en Ciencias de la Salud.

Coruña: Netbiblo. Páginas 189-199.

LECTURA OBLIGATORIA

(3)

ALGUNOS CONCEPTOS PREVIOS

Tipos de Variables y Niveles de medida

Proceso de datos y Análisis de datos

Estadística y niveles de análisis

Validez Interna, Externa y Ecológica

Error Tipo I () y Error Tipo II ()

Significación estadística y significación práctica

Contraste estadístico

Supuestos para el análisis de datos

Pruebas paramétricas y no paramétricas

Matriz (tipos de matrices)

Correlación y covarianza

(4)

Modelos Multivariantes 4

EL ANÁLISIS ESTADÍSTICO

La ESTADÍSTICA como un cuadro de herramientas. 3 niveles de análisis:

Nivel 1: UNIVARIADO. Resumir e ilustrar la información contenida en una matriz de datos

Nivel 2: BIVARIADO. Contrastar hipótesis, comparar el

comportamiento de dos o más grupos o analizar la relación entre pares de variables

Nivel 3: MULTIVARIANTE. Elaborar modelos, ecuaciones o

funciones que permitan explicar unas variables a partir de otras o identificar variables latentes para resumir la información

(5)

La selección de la Prueba Estadística

¿Qué queremos hacer? ¿en qué Nivel de Análisis nos situamos?

Nivel 1: UNIVARIADO. Estadísticos descriptivos: índices de tendencia central, de variabilidad, de distribución, posición, etc.

Nivel 2: BIVARIADO. Contrastes paramétricos vs. no paramétricos, análisis de correlaciones.

Nivel 3: MULTIVARIANTE. Técnicas multivariantes de Dependencia (Regresión Lineal, Regresión Logística, Discriminante, Anova,

Manova..) y de Interdependencia (Factorial, Correspondencias,

(6)

Modelos Multivariantes 6

Nadie duda de que el comportamiento humano y el comportamiento de los grupos o de las organizaciones, es algo complejo y sobre el que confluyen multitud de factores.

Los científicos sociales son conscientes de que gran parte de los fenómenos se explican por la intervención de múltiples variables.

Los investigadores necesitan herramientas estadísticas adecuadas para comprobar cómo distintas variables se combinan a la hora de explicar los comportamientos objeto de estudio.

La mejor forma de representar el conocimiento que poseemos de la realidad y de las leyes que la rigen es la elaboración de modelos.

Importancia de lo MULTIVARIANTE

(7)

Surge como una forma de hacer asimilable al entendimiento humano gran cantidad de datos que hay en la realidad, sintetizando los aspectos más relevantes y perdiendo el mínimo de información posible.

Útil porque permite descubrir estructuras, establecer relaciones o contrastar hipótesis globales, reflejando los mecanismos que actúan para determinar la conducta humana de una manera más adecuada, ya que está multideterminada.

KENDALL lo define como “una extensión del análisis univariable y bivariable al análisis simultáneo de más de dos variables en un muestreo de observaciones”. Es una definición meramente instrumental, ya que no recoge el enfoque de la MODELIZACIÓN ESTADÍSTICA. ¿OTRAS?

ANÁLISIS MULTIVARIANTE

(8)

Modelos Multivariantes 8

MODELOS

¿Qué es un MODELO?. Una representación formal, estructurada, concisa y clara de la realidad, que permite recoger y explicar sus propiedades y las leyes que la rigen, posibilitando la realización de predicciones.

Modelos matemáticos. Son formulaciones matemáticas de una situación, que permiten hacer predicciones en torno a la distribución de los acontecimientos.

Los MODELOS ESTADÍSTICOS son un tipo concreto de modelos matemáticos elaborados a partir de los datos de una muestra.

Tienen un componente de inferencia.

(9)

MODELOS ESTADÍSTICOS

Los Modelos Estadísticos contienen una parte sistemática (S) y una parte aleatoria (A).

La combinación de ambos componentes debe ser capaz de reproducir el objeto de interés científico (Y).

Aunque existen multitud de formas de vincular los dos elementos de un modelo estadístico, la primera tentativa y la más recurrida, por su simplicidad, es la forma lineal, sumando ambos componentes:

Y   S A

(10)

Modelos Multivariantes 10

MODELOS ESTADÍSTICOS

La parte aleatoria se suele denominar término de error y acostumbra a representarse por la letra E. La parte sistemática S suele incluir más de un elemento y, por ello, es frecuente que se desglose en varios componentes sistemáticos, que representen el efecto simultáneo de diversas variables. En consecuencia el modelo puede expresarse del siguiente modo:

( )

Yf XE

donde f (X) representa una combinación lineal de las variables

explicativas, por ejemplo, f(X) =

1

X

1

+

2

X

2

, siendo

1

y

2

coeficientes que representan el peso, efecto o importancia

relativa de cada variable explicativa.

(11)

El investigador debe recurrir a un modelo concreto, de la complejidad necesaria, para adaptarse al fenómeno real que pretende explicar.

La estrategia habitual, cuando el problema de investigación es relativamente simple, es la de intentar explicarlo a través de un modelo lineal. De no ser posible, para no encorsetar la realidad, se recurre a un nivel mayor de complejidad en la formulación matemática.

La determinación del modelo no es una cuestión irrelevante, sino tal vez el mayor reto en el desarrollo de la investigación.

Además, el investigador debe optar siempre por el modelo más simple

En definitiva...

(12)

Modelos Multivariantes 12

RAZONES DE LA EXPANSIÓN

1.Necesidades de investigación. La complejidad de los fenómenos sociales requiere un tratamiento de datos multidimensional

2.Utilidad en numerosos campos

3.El desarrollo de la informática y los ordenadores. Posibilidad de realizar cálculos complejos en pocos segundos

4.Abundante bibliografía aplicada (artículos, manuales y series monográficas)

5.Proliferación de la investigación de mercados y los estudios de opinión

ANÁLISIS MULTIVARIANTE

(13)

PELIGROS y PROBLEMAS:

Olvido de la teoría

Fácil estimación y difícil interpretación

Incluir demasiadas variables (en contra de la parsimonia)

Incumplimento de Supuestos

Casos anómalos

Tamaño muestral (arma de doble filo)

Relevancia conceptual ≠ significación estadística

ANÁLISIS MULTIVARIANTE

(14)

Modelos Multivariantes 14

CONFUSIÓN TERMINOLÓGICA. Conceptos relacionados:

– Modelos, métodos, técnicas y análisis

– Multivariantes, multivariables, multivariados

Herramientas estadísticas que permiten analizar un conjunto de variables de manera simultánea y poner a prueba distintos

modelos para explicar las relaciones entre ellas.

Muy diversas

– Regresión Lineal, Análisis Discriminante, Regresión logística, Análisis de Varianza, Análisis Conjunto, Análisis de Supervivencia, Análisis de

Estructuras de Covarianza (Ecuaciones Estructurales), … – Análisis Factorial, Análisis de Correspondencias, Análisis de

Conglomerados, Escalamiento Multidimensional, Análisis Log-Linear, …

TÉCNICAS MULTIVARIANTES

(15)

I.N. SHETH, 2 grandes preguntas:

¿Son unas variables dependientes de otras?

¿Cuáles son las propiedades de los datos?

2 grandes tipos:

Métodos de Dependencia: Regresión, Discriminante, Análisis de Varianza, Análisis Conjunto

Métodos de Interdependencia :Cluster, Factorial, Correspondencias, Escalamiento

Métodos métricos vs. no métricos

CLASIFICACIÓN

(16)

Modelos Multivariantes 16

Todas las técnicas Multivariantes

¿Algunas de las variables son dependientes de

otras?

NO

Reciben el nombre de Métodos de

Interdependencia

Reciben el nombre de Métodos de

Dependencia

No se designa ninguna variable como si se hubiesen pronosticado mediante otras variables. Todas son tomadas como un conjunto que interesa al investigador.

Análisis Factorial, Análisis de Conglomerados, Escalamiento Multidimensional

Se especifican una o más variables como si se hubiesen pronosticado (VD) mediante un conjunto de VI.

Análisis de Regresión, Análisis Conjunto, Análisis Discriminante, Análisis de Varianza

(17)

OBJETIVO: Explicar o predecir una variable Criterio a partir de una o varias variables predictoras

Y’ = a + b

1

X

1

+ b

2

X

2

+…+ b

n

X

n

EJEMPLO: Predecir las ventas a partir de la inversión en publicidad, nº de tiendas, descuento aplicado, etc.

CONDICIÓN: Predictores y Criterio cuantitativos

Simple o Múltiple

Caso especial: predictores categóricos (Regresión con variables ficticias: DUMMY)

REGRESIÓN LINEAL

(18)

Modelos Multivariantes 18

OBJETIVO:

Identificar funciones capaces de separar dos o más grupos de individuos según sus puntuaciones en una serie de variables, con el fin de localizar las variables que contribuyen en mayor grado a discriminar a los sujetos de los diferentes grupos establecidos a priori. Técnica de clasificación.

Y1 = X1 + X2 + X3 + ... + Xn (no métrica) (métricas)

Obtener una función discriminante del tipo

Zjk = a + W1X1+ W2X2 + ... + WjXk

EJEMPLO: Predecir el voto a partir de los ingresos económicos, la edad…

CONDICIÓN: Predictores cuantitativos y Criterio categórico

Simple o Múltiple (según el criterio sea dicotómico ó politómico)

ANÁLISIS DISCRIMINANTE

(19)

OBJETIVO: Pronosticar o explicar la pertenencia de los sujetos a un grupo, a partir de sus puntuaciones en una serie de variables independientes o predictores (similar al discriminante). Estimar la probabilidad de que se de un evento.

EJEMPLO: Predecir si un alumno va a aprobar o no en función de las horas de estudio, frecuencia de asistencia a clase, estatus socioeconómico

CONDICIÓN: VI métricas o no métricas y VD categórica

Permite trabajar con predictores cualitativos y/o categóricos

Logística Binaria y Multinomial

REGRESIÓN LOGÍSTICA

(20)

Modelos Multivariantes 20

OBJETIVO: Entender cómo conforman los individuos sus preferencias hacia los objetos, estimando la importancia relativa que le conceden a cada uno de los atributos o características de éste.

EJEMPLO: Explicar las preferencias de las amas de casa hacia las diferentes opciones de LECHE

CONDICIÓN: VI categórica (atributos) y VD ordinal

Muy utilizado en Marketing (diseño de nuevos productos, test de envases, elasticidad del precio, Identificación del producto ideal, segmentación de mercados, simulaciones, etc.)

ANÁLISIS CONJUNTO

(21)

OBJETIVO: Predecir o modelizar el tiempo que transcurre hasta que ocurre un evento, el RIESGO de…

EJEMPLO: Conocer la probabilidad de supervivencia de un grupo de pacientes de una determinada patología en función del tratamiento recibido, edad, etc.

CONDICIÓN (3 variables diferentes):

DE RESPUESTA: Tiempo de registro o seguimiento (cuantitativa)

DE CENSURA: Si ha ocurrido o no el evento (dicotómica)

EXPLICATIVAS: cuantitativa o cualitativa (Edad, Tratamiento, …)

ANÁLISIS DE SUPERVIVENCIA

(22)

Modelos Multivariantes 22

OBJETIVO: Determinar e qué medida una VD está influenciada por una o varias VI. Comprobar si existe un efecto significativo de un “Tratamiento”

EJEMPLO: Comprobar si existe un efecto significativo del consumo de alcohol sobre el rendimiento atencional

CONDICIÓN: VI categórica (factores) y VD cuantitativa

Ideal para experimentos

Una o varias VÍAS (VI): ONEWAY ó ANOVA (Diseños factoriales)

MANOVA (Análisis Multivariante de la Varianza: varias VD)

ANÁLISIS DE VARIANZA

(23)

OBJETIVO: Reducción de datos. A partir de la relación entre variables observadas identificar FACTORES o variables latentes

EJEMPLO: Agrupar ítems de una escala y etiquetarlos bajo una misma dimensión o factor de evaluación

CONDICIÓN: Variables cuantitativas

Exploratorio (AFE): Componentes Principales

Confirmatorio (AFC): LISREL, AMOS

ANÁLISIS FACTORIAL

(24)

Modelos Multivariantes 24

ANÁLISIS DE

CORRESPONDENCIAS

OBJETIVO: Reducción de datos. A partir de la relación entre variables observadas identificar DIMENSIONES o variables latentes

EJEMPLO: Obtener un Mapa de Posicionamiento de los países turísticos europeos, identificando las dimensiones subyacentes

CONDICIÓN: Variables cualitativas

Un subtipo de Análisis Factorial, ideal para tablas de asociación (recogida de datos rápida)

Muy utilizado en Marketing

(25)

OBJETIVO: Identificar grupos grupos homogéneos de sujetos u objetos a partir de su puntuación en una serie de variables.

EJEMPLO: identificar segmentos de jóvenes en función de sus hábitos de consumo

CONDICIÓN: Variables medidas en la misma escala

También llamado Cluster Analysis

Técnica de Clasificación

Los grupos no son conocidos a priori

ANÁLISIS DE

CONGLOMERADOS

(26)

Modelos Multivariantes 26

OBJETIVO: Utilizar las proximidades entre objetos para realizar una representación espacial de los mismos, identificando las dimensiones subyacentes

EJEMPLO: Representación espacial del mercado de la cerveza en Galicia CONDICIÓN: Gran versatilidad en la recogida de datos (distintos tipos de tareas)

Gran Utilidad en MKT e investigación social

ESCALAMIENTO

MULTIDIMENSIONAL

(27)

OTRAS TÉCNICAS

Correlación Canónica: Analizar relaciones entre un grupo de variables predictoras y un grupo de variables criterio.

Modelos de Ecuaciones Estructurales o de Estructuras de Covarianza:

Permite comprobar en qué medida un modelo teórico se ajusta a los datos empíricos (Path Analysis). Programas estadísticos: LISREL y AMOS

Modelos Log-Lineales: Permite poner a pruebas modelos que postulan distinto tipo de relaciones entre dos o más variables categóricas (Incluyen los modelos LOGIT, PROBIT, etc.)

Referencias

Documento similar

Para los informadores clave ejecutores de los programas de seguridad alimentaria de grupos vulnerables las principales barreras son la descoordinación intersectorial e

A la hora de realizar el análisis de regresión mediante SPSS existen diferentes métodos para seleccionar los predictores a incluir en el modelo de regresión. Las opciones

 Dicho método calcula la supervivencia cada vez que un paciente experimenta el evento, generando las probabilidades en cada momento..  Las probabilidades de

Conociendo el valor o UTILIDAD PARCIAL asociada a cada característica somos capaces de estimar el atractivo o UTILIDAD GLOBAL de un objeto, como suma de las utilidades parciales

Nuestro análisis de regresión logística mostró que existe 2 veces más de Riesgo de presentar retraso diagnóstico y 4 veces más de Riesgo de presentar enfermedad

La escala de frustración de las necesidades psicológicas básicas en contextos educativo obtuvo valores significativos en el análisis de regresión lineal para los factores

Metodología: en primer lugar, se realiza un análisis de regresión múltiple para determinar qué factores tienen mayor efecto sobre el aprendizaje y, posteriormente,

Utilizando análisis de regresión logística se comprobó que, en el caso del alcohol, la urgencia positiva y la falta de premeditación distinguían entre participantes con