5. PROCEDIMIENTO
5.1. Analisis de datos
Para realizar el tratamiento estadístico de los datos utilizamos el software SPSS, versión 15.0.
En primer lugar, como parte del análisis exploratorio que se realiza inicialmente de forma previa a cualquier tratamiento estadístico se procedió a calcular los es-
tadísticos descriptivos de tendencia central (v.g., media) y de dispersión (v.g., varianza) para el tono de voz, por una parte, de los sujetos incluidos en el grupo
control (sin patología) considerando los grupos de edad, y por otra, el tono de voz de las pacientes diagnosticadas de TCA. En ambos casos, se estudian las dis- tribuciones de la frecuencia fundamental “a” (F0 /a/) y la frecuencia fundamental “i” (F0 /i/). A continuación, se realizó un análisis de tipo gráfico, apoyado en dia-
gramas de cajas y bigotes. El motivo de utilizar este tipo de diagramas se debe a
que permite apreciar de forma sencilla la forma, tendencia central y variabilidad de una distribución.
En segundo lugar para estudiar la relación entre las distintas variables de interés (v.g., F0 /a/, F0 /i/, comienzo menarquia, años desde la menarquia) se analizaron las correlaciones, inicialmente para la muestra completa y posteriormente por separado para cada uno de los grupos patológicos y el grupo control. Para ello, se han utilizado el coeficiente de correlación de Pearson y el coeficiente de co-
rrelación de Spearman. Se han utilizado estos dos coeficientes debido a que el
primero es adecuado para variables cuantitativas, como es el caso de la F0 /a/ y la
F0 /i/, mientras que el segundo es más adecuado en el caso de variables de tipo ordinal que toman un rango restringido de valores, como es el caso de la edad de comienzo de la menarquia y los años transcurridos desde ésta. Para apreciar
mejor la relación entre las dos variables fundamentales de este estudio (v.g., F0 /a/ y F0 /i/) se ha representado la relación entre los dos tipos de frecuencia fun- damental, comparando cada uno de los grupos patológicos con el grupo control, utilizando diagramas de dispersión.
Para analizar las diferencias en el tono de voz entre de las pacientes con ANR, ANP y BN, y entre estas y el grupo control, en primer lugar se aplicaron las pruebas
de Kolmogorov-Smirnov y pruebas de Levene para estudiar el cumplimiento de
los supuestos necesarios para la aplicación de estadística paramétrica (v.g., nor- malidad, homocedasticidad, etc). Debido al incumplimiento de dichos supuestos, se optó por la aplicación de pruebas estadísticas no paramétricas en lugar de pa- ramétricas, como por ejemplo el Análisis de Varianza (ANOVA). Para explorar la existencia de al menos dos grupos con diferencias significativas en alguna de las frecuencias fundamentales aplicamos dos test de Kruskal-Wallis (uno para cada tipo de frecuencia fundamental). A la vista de los resultados significativos para F0 /a/ y para F0 /i/ se realizaron análisis post-hoc utilizando tests U de Mann Whitney
con la corrección de Bonferroni. Además se calcularon los tamaños del efecto, r, según el procedimiento de Rosenthal (1991): . Para la interpretación de los va-
lores del tamaño del efecto no existe una norma general que permita considerar que un determinado valor se corresponde siempre a un efecto elevado, medio o bajo, es decir, la consideración de la importancia de un determinado tamaño del efecto es dependiente del área de estudio. En esta tesis hemos optado por seguir la interpretación de Field (2009): r= .10, efecto pequeño, explica el 1% de la varianza total; r= .30, efecto moderado, explica el 9% de la varianza total; r = .50, efecto elevado, explica el 25% de la varianza total. Para la representación gráfica de las diferencias entre los tres grupos patológicos y el grupo control halladas
para las variables F0 /a/ y F0 /i/, se optó por la utilización de gráficos de líneas por tratarse de variables cuantitativas y continuas.
Para estudiar la relación existente entre la aparición del trastorno de forma pos- terior o anterior a la menarquia y el tipo de patología que presentan los sujetos con TCA, primariamente representamos mediante gráficos de sectores la rela- ción entre tener diagnosticado cada uno de los tres tipos de TCA y haber tenido el trastorno bien de forma posterior o simultánea a la menarquia, bien de forma previa al diagnóstico. El motivo de utilizar un gráfico de sectores es que es el tipo de gráfico adecuado para variables nominales y es especialmente útil en el caso de que el interés fundamental sea la proporción o porcentaje de cada uno de los niveles de la variable categórica. Seguidamente, para analizar si existían diferen- cias en la voz de las pacientes que habían obtenido el diagnóstico de forma pre- via a la menarquia, las que lo habían obtenido de forma simultánea o posterior a la menarquia y el grupo control, se realizaron tres Pruebas T para muestras
independientes, calculándose los tamaños del efecto mediante la aplicación de
la siguiente fórmula: ; donde t= valor del estadístico t de Student; gl = grados de libertad. Por último, se utilizaron gráficos de líneas para representar la variación de los valores medios de las frecuencias fundamentales según los años que habían transcurrido desde la aparición de la menarquia, tanto en el caso de los tres grupos patológicos, como en el del grupo control.
Para analizar si el tipo de trastorno estaba asociado con la percepción subjetiva de la voz se realizó un test de ji-cuadrado y se interpretaron los valores de los resi-
duos corregidos estandarizados. Sólo analizamos las diferencias en la percepción
de la voz entre las pacientes de los tres grupos de TCA, debido a que en el caso del grupo control la voz percibida fue una constante (en todos los casos dijeron
que su voz era normal). Para la representación gráfica se optó por diagramas de
barras, que son recomendables para la representación de frecuencias en el caso
de variables ordinales con un rango de valores reducido.
Para estudiar los cambios que se producían en el tono de voz durante el período de tratamiento de las pacientes ingresadas realizamos un análisis gráfico, basado en diagramas de líneas en el que se representó a todas las pacientes que per- manecieron ingresadas más de una semana de forma independiente para cada uno de los grupos patológicos. Debido a que los gráficos permitían sospechar la existencia de diferencias entre grupos patológicos, posteriormente realizamos un análisis cuantitativo de las diferencias entre los grupos ANR, BN y ANP en la dirección del cambio de la voz durante el ingreso hospitalario y en la magnitud del cambio mediante la aplicación de Pruebas t de Student para muestras inde-
pendientes. Para ello, se tuvieron en cuenta sólo los datos de las primeras dos
semanas de ingreso debido a que pocas pacientes permanecieron ingresadas durante la tercera semana de seguimiento. Como magnitud del cambio de la voz, se consideró el cambio total entre las dos semanas, en valor absoluto y por tanto, sin tener en cuenta la dirección del cambio a una voz más grave o más aguda. Como dirección del cambio de la voz se consideró la diferencia entre la primera y la segunda semana teniendo en cuenta el signo, que representa el cambio de la voz a más grave o más aguda.
Ulteriormente, para evaluar si es posible predecir la existencia de trastorno de la conducta alimentaria (ANR) frente a una voz normal (grupo control) a partir de las frecuencias fundamentales de la voz, realizamos un análisis de regresión
logística en el grupo de edad de mayores de 15 años. Este análisis es el indicado
a partir tanto de variables cuantitativas como categóricas. El objetivo de un aná- lisis de regresión logística es obtener una ecuación de la función que optimiza la predicción de una variable dicotómica, esta ecuación tendrá la forma siguiente (ecuación 1):
Ecuación 1. Ecuación de la función que optimiza la predicción de una variable dicotómica.
A la hora de ajustar el modelo se consideraron inicialmente como posibles predic- tores tanto el tono de voz (F0 /a/ y F0 /i/) como la edad, y la edad a la que se tuvo la menarquia. Por ello, al valorar el ajuste del modelo con todas o varias de estas variables (Regresión Logística Múltiple) se realizó previamente un diagnóstico de la Colinearidad de dichas variables. Para ello se utilizaron la Tolerancia y el FIV.
Ecuación 2. Fórmulas de la tolerancia y del FIV.
Hay que recordar que el modelo de regresión logística no es un modelo lineal, se utiliza un método de máxima verosimilitud para estimar sus parámetros. Por ello, como contrastes del ajuste global hemos informado del valor de las prue- bas ómnibus sobre los coeficientes del modelo, que en este caso están basadas en el estadístico Ji-cuadrado de Pearson. Además se ha tenido en cuenta la sig- nificatividad del cambio que se había producido en el modelo según el -2 loga-
ritmo neperiano de la verosimilitud (-2LL). Posteriormente se han utilizado los
estadísticos R2 de Cox y Snell y R2 de Nagelkerke como punto de referencia para
hay que tener en cuenta que ambos toman un valor mínimo de 0 para el ajuste nulo. El estadístico de Cox y Snell nunca llega a alcanzar un valor de 1 para el caso de un ajuste perfecto. Es por ello que Nagelkerke propuso una modificación de dicho estadístico para que permitiese alcanzar el valor 1 en el caso de un ajuste perfecto. Dado que el uso de la R2 de Cox y Snell está más extendido, en esta tesis
presentamos ambos (Ecuaciones 3 y 4).
Ecuaciones 3 y 4. Fórmulas tomadas de: Pardo, A y Ruíz, M.A. (2014). Análisis de datos en Ciencias Sociales y de la Salud III. Capítulo 2, Análisis de Regresión
Por otro lado, a la hora de exponer los resultados se ha tenido en cuenta la ma- triz de confusión que compara los datos observados con los pronosticados por el modelo. Además hemos considerado la significación del estadístico de Wald a la hora de, por una parte, valorar la contribución al modelo por parte de cada una de las variables consideradas y, por otra, para tomar la decisión de qué variables quedarían incluidas finalmente en el modelo definitivo. Este estadístico sigue una distribución Ji-cuadrado y se calcula de la siguiente forma:
Donde b=coeficiente para el predictor y SE la desviación estándar del error
Por último, en lo que se refiere a la regresión logística, cabe mencionar que lo ideal hubiese sido dividir la muestra en dos partes, realizando el ajuste del mo- delo con una parte de la muestra y una validación posterior con la submuestra restante. Si no se ha procedido de esta forma ha sido debido al pequeño tamaño de la muestra.
Por último, se realizó la representación gráfica de la curva ROC para las variables
F0 /a/ y F0 /i/, y tanto para la muestra completa del grupo control y el grupo ANR, como para la fracción de sujetos de esos grupos que tenían edades superiores a los 15 años. “La curva ROC no es más que la representación gráfica de la sensibili- dad o fracción de verdaderos positivos, frente a 1-especificidad que representaría la fracción de falsos positivos para cada uno de los posibles puntos de corte de
un test. Mediante esta representación, la curva proporciona una representación global de la exactitud en el diagnóstico” (Martínez-Arias, Hernández-Lloreda, y Hernández-Lloreda, 2006).
Antes de pasar al capítulo de resultados, queremos explicar que la falta de unifi- cación en los decimales bien dada por:
• -El programa versión SPSS 15.0 expresa el rango con dos decimales,
• El programa Praat (explicado en el apartado de instrumentos) refleja los Her- zios (Hz) con sólo un decimal (a diferencia de la media de esos datos que si la expresamos con tres decimales para dar el dato más fiable)
• La r de Rosenthal se escribe siempre con dos decimales, a diferencia de los residuos estandarizados corregidos del test de Ji-cuadrado que es con uno • El punto de corte (la tolerancia) por consenso, se expresa con dos decimales