PARÁMETROS Y SELECCIÓN DE DISTRIBUCIONES.
El principal objetivo de esta tesis es (véase 1.2) profundizar en el conocimiento del estado de naturaleza de la capacidad resistente de las coníferas españolas tal como pueden llegar al mercado de destino. Para ello, la labor fundamental ha consistido en, para las tres variables de referencia (densidad, tensión de rotura en flexión, y módulo de elasticidad longitudinal, véase 2.3), intentar establecer qué distribuciones se adaptan mejor a los datos de ensayo disponibles, que se describen en 3.2.
Se utiliza, en adelante, la siguiente terminología, para las tres variables de referencia citadas:
• MORC: tensión de rotura en flexión corregida al 12% de humedad de equilibrio de la madera.
• MOEC: módulo de elasticidad longitudinal corregido al 12% id. id.
• DENSC: densidad corregida al 12% id. id.
Tal como se indica en el Subcapítulo 2.3(b), puede considerarse establecido que las distribuciones que más se aproximan al estado de naturaleza de las variables de referencia citadas son la Normal, Lognormal y Weibull.
NOMENCLATURA.
El coeficiente de variación se expresa con la abreviatura CV. Siguiendo la práctica habitual en la literatura especializada, las referidas
distribuciones son aludidas como:
• Distribución Normal de media µ y desviación estándar σ: N(µ,σ)
• Distribución Lognormal de mediana ξ y desviación estándar del logaritmo natural de la variable estudiada δ: LN(ξ, δ)
• Distribución Weibull de parámetro de escala w y de forma k: W2(w,k)
• Distribución Weibull de parámetro de escala w, parámetro de forma k, y parámetro de truncamiento inferior τ: W3(w,k,τ)
• Del mismo modo, se interpretan las siguientes distribuciones, utilizadas en 5.2 para las variables de cargas ambientales:
o Distribución Gumbel, de parámetros α y u:
GU(α,u). En esta tesis, se utiliza para modelar cargas de nieve.
Miguel A. R. Nevado - Página3.1-3 (λ, k). En esta tesis, se utiliza para modelar cargas de uso intermitente.
La expresión del tipo Nx(µ,σ), ó LNx(ξ, δ), es la evaluación de la función
de distribución de que se trate en el punto “x”.
La expresión del tipo X~ W3(w,k,τ), indica que X es una variable estocástica distribuida conforme a una Weibull de parámetros w, k, y τ, o distribución y parámetros que se indiquen.
A continuación, se exponen las ecuaciones consideradas para cada una de las
distribuciones indicadas, donde fx(x) es la función de densidad de probabilidad y Fx(x)
Miguel A. R. Nevado - Página3.1-4 NORMAL (N)
Parámetros: m (o µ ) y σ, correspondientes al primer y segundo momento de la distribución.
LOGNORMAL (LN)
Parámetros ξ y δ, correspondientes a la mediana de x y a la desviación estándar de ln(x)
WEIBULL (W3)
Parámetros w, k y τ, correspondientes a escala, forma y truncamiento, respectivamente.
NOTA: Si el parámetro de truncamiento inferior τ es 0, la distribución pasa a ser Weibull de 2 parámetros (W2). La distribución también se conoce como distribución de extremos mínimos de Tipo III.
GAMMA (GA)
Parámetros k y λ, donde k es un parámetro de forma y λ un parámetro de escala.
GUMBEL (GU)
Parámetros u y α, donde u es el valor característico mayor considerado de la variable (es decir, es un parámetro de posición), y α
es un parámetro de escala, que da una medida inversa de la dispersión de x.
NOTA: Esta distribución también se conoce como distribución de extremos máximos, de Tipo I. La clasificación en los diferentes tipos de distribuciones estadísticas de extremos, puede encontrarse en Ang y Tang (1990) o Benjamin y Cornell (1970). Fue
Miguel A. R. Nevado - Página3.1-5 El procedimiento matemático de ajuste de los datos ha consistido en la aplicación del método de la máxima verosimilitud en la estimación de los parámetros que
corresponderían al ajuste de cada una de las cuatro posibles distribuciones candidatas (N, LN, W2 y W3) al 100 de los datos de las diferentes muestras.
El método de la máxima verosimilitud se considera como uno de los más adecuados en elaboración de datos en ingeniería civil (véanse Ditlevsen y Madsen, 1996, Faber, 2001, Soorensen, 2000 ó Lemaire, 2006, ó Ang y Tang, 2006). El procedimiento es el siguiente (tal como se describe en el fundamento teórico de la aplicación informática utilizada, véase Capítulo 7.d, Statrel). Para una muestra x=(x1,…,xn) , la
función de verosimilitud se define como:
Donde q es el vector de parámetros desconocidos, y f(x) es la función
de densidad de probabilidad de la distribución de que se trata (N, LN, W2 ó W3). Así, por ejemplo, q (µ, σ), q (ζ, δ), q (w, k) ó q (w, k, τ), en
las distribuciones candidatas expresadas. La expresión L(q|x) se lee
“verosimilitud de que los parámetros reales son q, dado que se ha
obtenido la muestra x”. La función indicada se maximiza, para
obtener el estimador del vector de parámetros. En realidad, por operatividad, la función que se maximiza es l(q|x) = ln (L(q|x)).
Los parámetros que se estiman por este procedimiento, tienen, usualmente, las siguientes deseables características:
• Son consistentes.
• Asintóticamente eficientes y no sesgados. • Se distribuyen, para muestras suficientemente
grandes, normalmente con media igual al valor del parámetro estimado.
De este modo, como complemento de la estimación del valor del parámetro, el método arroja asimismo una indicación de la
incertidumbre en la asignación del mismo, en la forma de su desviación estándar. Asimismo, se obtiene una posible correlación entre los diferentes parámetros de la misma función de distribución. El procedimiento que utiliza el programa utilizado, Statrel, es el algoritmo de Schittkowki, publicado por primera vez en 1986, con la denominación “NLPQL: A FORTRAN subroutine Solving Non-Linear Programming Problems”.
Una vez calculados los parámetros, y su variabilidad, para cada una de las cuatro distribuciones posibles para las tres variables de referencia y en cada muestra, se procede a presentar las cuatro distribuciones dibujadas en rojo contra la distribución empírica, en poligonal azul, lo que permite una primera aproximación a cuál sea el ajuste más adecuado.
Miguel A. R. Nevado - Página3.1-6 MORC (tensión de rotura en flexión longitudinal) de la muestra SI. Los dos gráficos superiores corresponden al ajuste a las distribuciones Lognormal y Normal. Los dos gráficos inferiores corresponden a ajustes a distribuciones Weibull de dos y tres parámetros (izquierda y derecha, respectivamente).
A continuación, para la misma muestra, se dibujan los datos sobre el papel
probabilístico correspondiente a cada una de las cuatro distribuciones candidatas.
Por ejemplo, para la misma muestra anterior, el resultado es el siguiente:
Miguel A. R. Nevado - Página3.1-7 El papel probabilístico se considera (véase Faber 2001) como una herramienta de primer orden para estimar si una muestra pertenece a una familia de distribuciones. Las observaciones en azul se contrastan contra la línea recta roja, que indicaría el ajuste óptimo. Las dos envolventes verdes del diagrama, indican el intervalo de confianza del 5% para el test K-S (ver más adelante).
La ecuación de la línea recta es y = a + bx, donde las constantes “a” y
“b” son las siguientes, para cada una de los cuatro tipos de distribuciones.
Miguel A. R. Nevado - Página3.1-8 Para la elección final de la función que se propone, se han seguido los pasos sucesivos del protocolo a continuación expuesto, para cada muestra (ajustada por máxima verosimilitud al 100% de los datos):
1. Se rechazan las distribuciones que no son aceptables según el test A-D (Anderson-Darling).
2. Si solo queda una distribución, resulta elegida como candidata definitiva. 3. Si hay más de una, se rechazan las que no son aceptables según el test K-S
(Kolmogorov-Smirnof).
4. Si solo queda una distribución, resulta elegida como candidata definitiva. 5. En caso de quedar más de una, se elige la que es aceptable según el test χ2. 6. Si ambas son rechazables o ambas no son rechazables, se elige como
candidata principal la que mejor predice el percentil más relevante , a efectos prácticos de dimensionado, correspondiente. Para DENSC y MORC, el percentil que se compara en principio es el 5º; de no poderse decidir, se compara el 20º. Para MOEC, se compara en primer lugar el valor medio, y en segundo lugar, el 5º percentil. La otra distribución queda como segunda candidata.
7. Si llegando a este punto aún no se puede llegar a una conclusión clara, se determina seleccionando aquélla que presenta menor variabilidad en la estimación de parámetros.
8. En todo caso, deberá haber consistencia entre la conclusión a la que se llega por los pasos indicados, y el resultado del examen gráfico indicado.
Lógicamente, el percentil más relevante dependerá del estado límite que se esté estudiando. No obstante, se han elegido los indicados por ser los que, para la mayor parte de las situaciones de utilización, son determinantes del dimensionado.
El test A-D es una modificación del test de Cramer-v.Mises (frecuente en la literatura clásica de estadística) que pone especial énfasis en el ajuste de las colas de la distribución. Básicamente, se mide el
cuadrado de las desviaciones respecto a la distribución teórica, y estas desviaciones de pesan por la función (Fx(x) [1 - Fx(x)])-1. Debe
señalarse que su precisión es menos eficiente en la parte central de la distribución.
El test K-S consiste en la comparación entre la distribución empírica, no paramétrica, Hn(x) y la supuesta, F0(x). El test consiste en la elaboración del siguiente estadístico de contraste:
La hipótesis H0:F(x)=F0(x) es rechazada si:
Donde n es el número de observaciones y λ1-α es un valor tabulado,
Miguel A. R. Nevado - Página3.1-9 El test χ2 se utiliza en estadística de forma muy extendida. Sin
embargo, no siempre resulta eficiente, comparado con los otros dos test citados. De hecho, tras el análisis, e independientemente del protocolo indicado, no se ha encontrado ninguna muestra en la que la hipótesis sea no rechazable según este test, si ya había sidorechazable por los otros dos.
El nivel de significación en todos los casos, se ha fijado en el 5%. Puede encontrarse una descripción detallada de la aplicación de los tres tests citados, en Ang y Tang (2007), así como en la documentación del programa informático utilizado en el análisis, Statrel (1991).
Se hace notar que sólo en las muestras menos significativas, por la poca
representatividad de su muestreo (tal como la muestra RB) ha habido dudas relevantes para la elección de la función propuesta.
Finalmente, siguiendo las recomendaciones de la literatura al respecto (véase 2.3), se ha procedido al ajuste de los parámetros del tipo de distribución elegido, para la densidad y la tensión de rotura en flexión, al 30% inferior de los datos. El
procedimiento de ajuste seguido ha sido el de mínimos cuadrados.
El procedimiento aplicado es el siguiente. Sea Fx(x|θ) la función de distribución acumulada a ajustar, cuyo vector de parámetros es θ . En nuestro caso, podrá ser, por ejemplo: θ (µ, σ), θ (ζ, δ), θ (w, k) ó θ
(w, k, τ), según se trate de distribuciones N, LN, W2 o W3, respectivamente.
Sea el vector de las observaciones:
Se ordenan por su valor los datos de la muestra, lo que establece una función de distribución empírica, que responde a:
Los parámetros se determinan por el siguiente problema de optimización:
En el problema indicado, N corresponderá al 30% de los valores
inferiores.
El significado del ajuste descrito se ejemplifica para diferentes muestras de referencia en el Anejo A.5.
Los Anejos A.1 y A.2 contienen la información resultado del proceso descrito. A continuación se expone la organización de la información.
NOMENCLATURA DE VARIABLES. Con carácter general, se utiliza la denominación DENSC, MORC y MOEC para hacer referencia, respectivamente, a la densidad, la tensión de rotura en flexión longitudinal, y el módulo de elasticidad longitudinal.
Miguel A. R. Nevado - Página3.1-10 ANEJO A.1.a: PRESENTACIÓN GRÁFICA POR ESPECIES. Para cada una de las muestras analizadas, el anejo presenta, de forma sucesiva para cada una de las variables de referencia, tres hojas:
1) Tres diagramas:
a) Nube de puntos de la variable con una de las otras dos. b) Nube de puntos de la variable con la restante. c) Histograma de frecuencias absolutas de la variable. 2) Cuatro diagramas (de izquierda a derecha y de arriba abajo):
a) Trazado de observaciones (azul) en papel probabilístico LOGNORMAL (línea roja) b) Id. en papel probabilístico NORMAL
c) Id. en papel probabilístico WEIBULL de dos parámetros d) Id. en papel probabilístico WEIBULL de tres parámetros. 3) Cuatro diagramas:
a) Comparación de observaciones (azul) con la predicción de la distribución ajustada al 100% de los datos (rojo), para la función de distribución LOGNORMAL.
b) Id. Para la NORMAL
c) Id. Para la WEIBULL de dos parámetros d) Id. Para la WEIBULL de tres parámetros.
ANEJO A.1.b. PRESENTACIÓN GRÁFICA POR VARIABLES. Para cada variable (DENSC, MORC, MOEC), corregida al 12%, y de forma sucesiva para cada una de las muestras, el anejo presenta tres hojas:
1) Tres diagramas:
a) Nube de puntos de la densidad con la segunda variable. b) Nube de puntos de la densidad con la tercera variable. c) Histograma de frecuencias absolutas de la densidad. 2) Cuatro diagramas (de izquierda a derecha y de arriba abajo):
a) Trazado de observaciones (azul) en papel probabilístico LOGNORMAL (línea roja) b) Id. en papel probabilístico NORMAL
c) Id. en papel probabilístico WEIBULL de dos parámetros d) Id. en papel probabilístico WEIBULL de tres parámetros. 3) Cuatro diagramas:
a) Comparación de observaciones (azul) con la predicción de la distribución ajustada al 100% de los datos (rojo), para la función de distribución LOGNORMAL.
b) Id. Para la NORMAL
c) Id. Para la WEIBULL de dos parámetros d) Id. Para la WEIBULL de tres parámetros.
ANEJO A.2.a. PARÁMETROS INICIALES. Distribuciones posibles para cada muestra con los estadísticos relevantes de la misma, y parámetros inicialmente estimados por el procedimiento de la máxima verosimilitud, para cada variable de referencia, ajustando la distribución al 100% de los datos.
El resumen operativo del análisis realizado, se presenta en el Subcapítulo 4 (Resultados) junto a los parámetros ajustados finalmente propuestos para su utilización en cálculo probabilístico.
Miguel A. R. Nevado - Página3.1-11