• No se han encontrado resultados

Cálculo eficiente del estimador Jackknife agrupado para mínimos cuadrados lineales

N/A
N/A
Protected

Academic year: 2020

Share "Cálculo eficiente del estimador Jackknife agrupado para mínimos cuadrados lineales"

Copied!
14
0
0

Texto completo

(1)Vol. XX, No 2, Diciembre (2012) Matemáticas: 55–68. Matemáticas: Enseñanza Universitaria c Escuela Regional de Matemáticas Universidad del Valle - Colombia. Cálculo eficiente del estimador Jackknife agrupado para mı́nimos cuadrados lineales Alexander Arévalo S.. Héctor J. Martı́nez R.. Ana M. Sanabria R.. Universidad del Valle. Universidad del Valle. Universidad del Valle. Recibido Ago. 30, 2011. Aceptado Ago. 01, 2012. Abstract In this paper, we generalize the results obtained by Martinez and Sanabria to calculate the Jackknife Estimator for Linear Least Squares, which express the estimates of the subproblems that result when calculating the Grouped Jackknife Estimator for the Linear Least Squares Problem (GJELLS) in terms of the initial estimate and other simple expressions to calculate, and thus modify the standard algorithm to calculate the GJELLS. 2 2 2 3 This modification reduces the number of operations of the order O( m hn ) + O( mh n ) + O( mn ) h to a number of operations of the order O(mn2 ) + O(hn) + O(mn) + O(mh2 ), where m is the sample size, h a fixed number given by the Grouped Jackknife Estimator (h << m) and n is the number of parameters to estimate (m ≥ n). Keywords: Linear Least Square, Jackknife estimator, Complexity of computation. MSC(2000): 93E24, 62F40, 03D15 Resumen En este artı́culo, hacemos una generalización de los resultados obtenidos por Martı́nez y Sanabria para el cálculo del Estimador Jackknife para Mı́nimos Cuadrados Lineales (EJMCL), los cuales permiten expresar los estimadores de los subproblemas que resultan al calcular el Estimador Jackknife Agrupado para Mı́nimos Cuadrados Lineales (EJAMCL) en términos del estimador inicial y otras expresiones sencillas de calcular, y ası́ modificar el algoritmo estándar para calcular el EJAMCL. 2 3 2 2 ) Con esta modificación, se reduce el número de operaciones del orden O( m hn )+O( mh n )+O( mn h 2 2 a un número de operaciones del orden O(mn )+O(hn)+O(mn)+O(mh ), donde m es el tamaño de la muestra, h un número fijo dado por el Estimador Jackknife Agrupado (h << m) y n es el número de parámetros a estimar (m ≥ n). Palabras y frases claves: Mı́nimos Cuadrados Lineales, Estimador Jackknife, Complejidad computacional. 1. Introducción. El algoritmo estándar para el cálculo del Estimador Jackknife para Mı́nimos Cuadrados Lineales (EJMCL) requiere un número de operaciones del orden O(m2 n2 )+ O(mn3 ), donde m es el tamaño de la muestra y n es el número de parámetros a estimar, lo cual hace que calcular el EJMCL sea muy costoso, computacionalmente hablando. Sin embargo, Martı́nez y Sanabria, usando convenientemente propiedades básicas del álgebra lineal, lograron obtener un algoritmo mucho más eficiente, disminuyendo el número de operaciones al orden O(mn) + O(mn2 ) bajo la condición de que el problema de estimación inicial y los subproblemas involucrados sean de rango completo [2]; posteriormente, lograron mantener el resultado.

(2) 56. A. Arevalo, H. Martı́nez y A. Sanabria. anterior sin la necesidad de que los subproblemas involucrados fuesen de rango completo [3]; y por último, lograron conservar la eficiencia del cálculo sin requerir condición alguna sobre el problema inicial, es decir, sin importar que el problema de estimación inicial sea de rango deficiente [4]. En este artı́culo, presentamos una generalización de los resultados obtenidos por Martı́nez y Sanabria, los cuales permiten realizar una modificación al algoritmo estándar para calcular el Estimador Jackknife Agrupado para Mı́nimos Cuadrados Lineales (EJAMCL), reduciendo el número de operaciones a realizar, generalizando ası́ el algoritmo para calcular el EJMCL obtenido por Martı́nez y Sanabria para el caso del estimador Jackknife agrupado. 2. Estimador Jackknife Agrupado para Mı́nimos Cuadrados Lineales (EJAMCL). Definición 1. Sea X1 , . . . , Xm una muestra aleatoria de una población caracterizada por un parámetro θ y T = tm (X1 , . . . , Xm ) un estimador de dicho parámetro, basado en la muestra de tamaño m. Al dividir la muestra en g grupos de tamaño h (m = gh), si denotemos por Tj al estimador T evaluado para los (m − h) elementos que quedan después de quitar el j-ésimo grupo de elementos de la muestra (j = 1, . . . , g), el Estimador Jackknife Agrupado (EJA) [1] es TJA. g. g. j=1. j=1. 1X (g − 1) X = (gT − (g − 1)Tj ) = gT − Tj . g g. De otro lado, dado el conjunto de observaciones (aTi , αi ), donde ai ∈ Rn y αi ∈ R para i = 1, . . . , m con m ≥ n, el problema de estimar x tal que αi = aTi x por el método de los mı́nimos cuadrados lineales, se reduce a encontrar x b tal que kAb x − yk2 = mı́nn kAx − yk2 , x∈R. donde A = [a1 , . . . , am ]T ∈ Rm×n y y = (α1 , . . . , αm )T . Al vector x b se le denomina Estimador de Mı́nimos Cuadrados Lineales (EMCL). Ahora, dividiendo las m observaciones de la muestra en g grupos de tamaño h (m = gh) y aplicando el método de estimación Jackknife agrupado a x b, obtenemos el Estimador Jackknife Agrupado para Mı́nimos Cuadrados Lineales (EJAMCL) x bJA = gb x − (g − 1). donde xbj es la solución del subproblema. g X xbj j=1. g. kAj xbj − yj k2 = mı́nn kAj x − yj k2 , x∈R. ,. j = 1, . . . , g ,.

(3) Cálculo Jackknife agrupado. 57. donde Aj es la matriz resultante de extraer el grupo j−ésimo de filas de la matriz A y yj es el vector resultante de extraer el grupo j−ésimo de componentes del vector y. Para efectos de un mayor entendimiento, daremos a continuación un pequeño ejemplo del cálculo del EJAMCL. Ejemplo 1. Dados los puntos (−6, −9), (−5, −6), (−4, −5), (−3, −3), (−2, 1), (−1, 0), (0, 3), (1, 5), (2, 7), (3, 9), (4, 12), (5, 13), deseamos estimar la mejor recta que los aproxime, en el sentido de los mı́nimos cuadrados; es decir, necesitamos estimar M y b tales que, si zi = M ti + b, kz − yk2 sea mı́nimo, siendo (ti , yi ) los puntos dados. En términos de la notación utilizada, tenemos que m = 12 y n = 2, y la matriz A, el vector y y el vector x estarı́an dados por     −6 1 −9 −6 −5 1     −5 −4 1     −3 −3 1     1 −2 1           M 0 −1 1 y x= A= , y =   b 3  0 1     5  1 1     7  2 1     9  3 1      4 1  12  5 1 13 Ası́, el estimador de mı́nimos cuadrados   3402 927 T x b= , ≈ (1, 98, 3, 24)T 1716 286. resuelve el problema mı́nx∈R2 kAx − yk2 . De igual forma, tomando g = 3, h = 4, podemos calcular el EJAMCL, calculando los respectivos xbj , para j = 1, 2, 3, que resuelven mı́nx∈R2 kAj x − yj k2 para las siguientes matrices y vectores: y1 = (1, 0, 3, 5, 7, 9, 12, 13)T        −9 −6 −6 1 −2 1 −1 1 −5 1 −6 −5        −4  0 1 −4 1 −5         1 1 −3 1 −3 −3       A1 =   2 1 , A2 =  2 1 , y2 =  7  , A3 = −2         3 1 9 −1  3 1         4 1  12  0  4 1 5 1 13 1 5 1.    1 −9    1 −6 −5 1    −3  1  , y3 =  1  1   0 1    3 1 1 5.

(4) 58. A. Arevalo, H. Martı́nez y A. Sanabria. Los estimadores de las submuestras son:  128   41       21   69  1, 95 1, 85     x c1 =   ≈ , x c2 =   ≈ 3, 17 , 3, 32 93 877 28 276.  27 .  14   x c3 =   ≈ 43 14. Ahora, utilizando la fórmula para x bJA , tenemos el EJAMCL ası́, x bJA.  3402 .  1716  3 − 1 − = 3   3 927 286. .  41 .  128 .  27 .  21   69   14   + +        93 877 43 28 276 14. .  212 .  100  ≈ =   334 100.   1, 92 3, 07. .  2, 12 , 3, 34. el cual es un estimador de x que posee mejores propiedades estadı́sticas que x̂, calculado inicialmente. El algoritmo estándar para calcular el EJAMCL lo podemos expresar en los siguientes cuatro pasos: 1. Dados A ∈ Rm×n , y ∈ Rm . 2. Resolver mı́nx∈Rn kAx − yk22 . ⇒ Salida: x b. 3. Para j = 1, . . . , g.. Resolver mı́nx∈Rn kAj x − yj k22 . ⇒ Salida: xbj .. 4. Calcular x bJA = gb x − (g − 1). Pg. j=1. x bj . ⇒ Salida: x bJA . g. Si las matrices A y Aj , para j = 1, . . . , g, son de rango completo, los pasos 1 y 2 se reducen a encontrar las soluciones únicas de los sistemas de ecuaciones AT Ax = AT y. y. ATj Aj xj = ATj yj ,. para j = 1, . . . , g.. En otra palabras, se reduce a calcular x b y los xbj , tal que x b = (AT A)−1 AT y. y. xbj = (ATj Aj )−1 ATj yj ,. para j = 1, . . . , g.. Resolviendo los problemas planteados en los pasos 1 y 2 por el método de las ecuaciones normales, un algoritmo más detallado para el cálculo de EJAMCL es el siguiente. 3. Algoritmo estándar detallado para calcular el EJAMCL 1. Dados A ∈ Rm×n , y ∈ Rm . 2. {Resolver AT Ax = AT y.}.

(5) Cálculo Jackknife agrupado. 59. • Calcular C = AT A. • Calcular d = AT y.. • Resolver Cx = d. ⇒ Salida: x b.. 3. Para j = 1, . . . , g. {Resolver ATj Aj x = ATj yj .} • Calcular Cj = ATj Aj .. • Calcular dj = ATj yj .. • Resolver Cj xj = dj . ⇒ Salida: xbj .. 4. Calcular x bJA = gb x − (g − 1). Pg. j=1. xbj . ⇒ Salida: x bJA . g. En el algoritmo detallado anteriormente, nótese que la cantidad de operaciones necesarias para resolver los sistemas de ecuaciones lineales1 en el paso 1 3 es aproximadamente [mn2 + mn + n3 ] y, en el paso 2, es aproximadamente n3 2 [m h ((m−h)n +(m−h)n+ 6 )], donde m es el tamaño de la muestra, h un número fijo dado por el Estimador Jackknife Agrupado (h << m) y n es el número de parámetros a estimar (m ≥ n); por tanto, lo más costoso del algoritmo es el paso 2, donde se deben calcular los respectivos xbj . En adelante, usaremos la siguiente notación. Dada A = [a1 , . . . , am ]T con ai ∈ Rn , i = 1, . . . , m, la matriz Aj ∈ R(m−h)×n es la matriz que resulta de quitar h filas a la matriz A, que, sin perdida de generalidad, suponemos que son seguidas. Ası́ Aj = [a1 , . . . , ak−1 , ak+h , . . . , am ]T . Denotaremos por Bj ∈ R(h×n) la matriz formada por las h filas que se le quitaron a la matriz A. Ası́ Bj = [ak , . . . , ak+h−1 ]T . De igual forma, dado y = (α1 , . . . , αm )T con αi ∈ R, i = 1, . . . , m, el vector yj ∈ Rm−h es el vector que resulta de quitar las h componentes correspondientes al vector y. Ası́ yj = (α1 , . . . , αk−1 , αk+h , . . . , αm )T . Denotaremos por bj ∈ Rh el vector formado por las h componentes que se le quitaron al vector y. Ası́ bj = (αk , . . . , αk+h−1 )T . 1. Se asume que el sistema Cx = d se resuelve con un algoritmo como Cholesky. Otros algoritmos como QR, para resolver este sistema, no requieren el cálculo de la matriz C pero resultan ser más costosos, aunque proporcionan una mayor estabilidad numérica..

(6) 60 4. A. Arevalo, H. Martı́nez y A. Sanabria. Algunos resultados del álgebra lineal. A continuación, veremos una serie de resultados que, aunque no sean requeridos de manera directa, son importantes para el diseño y demostración de los resultados que respaldan los algoritmos. En primer lugar, con el objetivo de rebajar el costo del cálculo de ATj Aj , obtuvimos una generalización del Lema de Vargas [2]. Lema 1. Dada una matriz A = [a1 , . . . , am ]T ∈ Rm×n , si la matriz Aj = [a1 , . . . , ak−1 , ak+h , . . . , am ]T , es la matriz que resulta de quitar h filas a la matriz A y la matriz Bj es la matriz que se forma con las h filas que se quitaron a A; entonces ATj Aj = AT A − BjT Bj . Demostración. ATj Aj. = [a1 , . . . , ak−1 , ak+h , . . . , am ][a1 , . . . , ak−1 , ak+h , . . . , am ]T =. =. k−1 X. ai aTi. +. i=1. i=k+h. k−1 X. k+h−1 X. ai aTi. +. i=1. =. m X. m X i=1. ai aTi ai aTi. i=k. ai aTi −. k+h−1 X. −. k+h−1 X. ai aTi. i=k. +. m X. ai aTi. i=k+h. ai aTi. i=k. = [a1 , . . . , am ][a1 , . . . , am ]T − [ak , . . . , ak+h−1 ][ak , . . . , ak+h−1 ]T. = AT A − BjT Bj .. De igual manera, generalizamos el Lema 2 dado en [2], que nos permite simplificar el cálculo de ATj yj . Lema 2. Dada una matriz A = [a1 , . . . , am ]T y un vector y = (α1 , . . . , αm )T , si la matriz Aj = [a1 , . . . , ak−1 , ak+h , . . . , am ]T y el vector yj = (α1 , . . . , αk−1 , αk+h , . . . , αm )T , son, respectivamente, la matriz y el vector que resultan de quitar h filas a la matriz A y las h componentes correspondientes del vector y, y la matriz Bj es la matriz que se forma con las h filas que se quitaron a A y el vector bj es el vector que se forma con las h componentes que se quitaron a y; entonces ATj yj = AT y − BjT bj ..

(7) Cálculo Jackknife agrupado. 61. Demostración. ATj yj. = [a1 , . . . , ak−1 , ak+h , . . . , am ](α1 , . . . , αk−1 , αk+h , . . . , αm )T = α1 a1 + . . . + αk−1 ak−1 + αk+h ak+h + . . . + αm am = α1 a1 + . . . + αm am − αk ak − . . . − αk+h−1 ak+h−1 m X = αi ai − [ak , . . . , ak+h−1 ](αk , . . . , αk+h−1 )T i=1 T. = A y − BjT bj .. Por último, un resultado clave para el logro de nuestro objetivo, conocido como la fórmula general de Sherman-Morrison-Woodbury. Lema 3. (Sherman-Morrison-Woodbury) Dadas las matrices W ∈ Rn×n no singular, U ∈ Rn×m , V ∈ Rm×n y la idéntica Ik ∈ Rk×k . (Im + V W −1 U ) es no singular, si y sólo si, (W + U V ) es no singular. Además, si (Im + V W −1 U ) es no singular, (W + U V )−1 = W −1 − W −1 U (Im + V W −1 U )−1 V W −1 Demostración. ⇒) Si (Im + V W −1 U ) es no singular, tenemos que (W. + U V )(W −1 − W −1 U (Im + V W −1 U )−1 V W −1 ). = In + U V W −1 − U (Im + V W −1 U )−1 V W −1 +  U V W −1 U (Im + V W −1 U )−1 V W −1. = In + U V W −1 − (U + U V W −1 U )(Im + V W −1 U )−1 V W −1. = In + U V W −1 − U (Im + V W −1 U )(Im + V W −1 U )−1 V W −1 = In + U V W −1 − U V W −1 = In .. ⇐) Sea Z = W −1 U . Si (Im + V W −1 U ) = (Im + V Z) es singular, entonces existe x ∈ Rm diferente de cero, tal que (I + V Z)x = 0. Demostremos que y = Zx ∈ Rn es diferente de cero y (In + ZV )y = 0. De las hipótesis sobre x, tenemos que x = −V Zx = −V y, por lo tanto, si y = 0, x seria 0; por lo cual, concluimos que y 6= 0. Además, (In + ZV )y = (In + ZV )Zx = (Z + ZV Z)x = Z(Im + V Z)x = Z0 = 0, por lo tanto, (In + ZV ) es singular, y como (W + U V ) = W (In + W −1 U V ) = W (In + ZV ), concluimos que (W+UV) es singular..

(8) 62. A. Arevalo, H. Martı́nez y A. Sanabria. Ahora, haciendo uso de los lemas anteriores y bajo el supuesto que el problema inicial y los subproblemas respectivos son de rango completo, podemos expresar las soluciones de los sistemas ATj Aj xj = ATj yj del segundo paso del algoritmo, en términos de la solución de AT Ax = AT y y otras expresiones sencillas de calcular, como se muestra en el siguiente teorema. Teorema 1. Dada una matriz A = [a1 , . . . , am ]T ∈ Rm×n y un vector y = (α1 , ..., αm )T , si la matriz Aj = [a1 , . . . , ak−1 , ak+h , . . . , am ]T y el vector yj = (α1 , . . . , αk−1 , αk+h , . . . , αm ) son, respectivamente, la matriz y el vector que resultan de quitar h filas a la matriz A y las h componentes correspondientes del vector y; y además, A y Aj son matrices de rango completo, entonces xbj , la solución de ATj Aj xj = ATj yj , está dada por xbj = x b + Zj (wj − bj ),. donde x b es la solución de AT Ax = AT y , Zj es la solución de AT AZ = BjT , wj es la solución de (I − Bj Zj )w = ZjT dj con dj = ATj yj , y además, Bj y bj son la matriz y vector formado con las h filas quitadas a A y las h componentes quitadas a y, respectivamente. Demostración. Sean C = AT A, Cj = ATj Aj y d = AT y. Como A y Aj son de rango completo, entonces C y Cj son invertibles. Por el Lema 1, Cj = C − BjT Bj , por el Lema 2, dj = d − BjT bj y por el Lema 3, tenemos que Cj−1 = C −1 + C −1 BjT (I − Bj C −1 BjT )−1 Bj C −1 . Ahora xbj. = Cj−1 dj = [C −1 + C −1 BjT (I − Bj C −1 BjT )−1 Bj C −1 ]dj. = C −1 dj + C −1 BjT (I − Bj C −1 BjT )−1 Bj C −1 dj. = C −1 (d − BjT bj ) + C −1 BjT (I − Bj C −1 BjT )−1 Bj C −1 dj. = C −1 d − C −1 BjT bj + C −1 BjT (I − Bj C −1 BjT )−1 Bj C −1 dj . Sea Zj la solución de CZ = BjT , entonces xbj = x b − Zj bj + Zj (I − Bj Zj )−1 ZjT dj .. Sea wj la solución de (I − Bj Zj )w = ZjT dj , entonces xbj. = x b − Zj bj + Zj wj. = x b + Zj (wj − bj )..

(9) Cálculo Jackknife agrupado. 63. Con base en el Teorema 1, podemos decir que para la solución de los (m − h) sistemas de los subproblemas no es necesario calcular ATj Aj ni ATj yj , y que la solución del sistema ATj Aj x = ATj yj se reduce a la solución de sistemas con la matriz AT A 2 y al cálculo de algunos productos internos, haciendo que el costo del algoritmo estándar del EJAMCL sea mucho menor. Por tanto, proponemos modificar el paso 2 del algoritmo estándar de la siguiente manera. Para j = 1, . . . , g. {Resolver ATj Aj x = ATj yj .} • Resolver CZj = BjT . • Calcular Sj = Bj Zj . • Calcular rj = ZjT dj . • Resolver (I − Sj )wj = rj . • Calcular xbj = x b − Zj (wj − bj ).. ⇒ Salida: xbj . Haciendo esta modificación en el paso 2 del algoritmo estándar del EJAMCL, bajo el supuesto que A y Aj son de rango completo, reducimos el número de n3 h2 2 2 operaciones del algoritmo de [ m h ((m − h)n + (m − h)n + 6 )] a [n + hn + 2n + 3 ], donde m es el tamaño de la muestra, h un número fijo dado por el estimador Jackknife Agrupado (h << m) y n es el número de parámetros a estimar (m ≥ n). Claramente, el hecho que una matriz A sea de rango completo no implica que las matrices Aj también lo sean. Por ello, nos propusimos encontrar una caracterización de las soluciones de ATj Aj x = ATj yj basada en la solución de AT Ax = AT y, independientemente si las respectivas Aj son o no de rango completo. Para ello, necesitamos probar que el sistema (I − Bj Zj )p = Bj x b − bj tiene solución, aún cuando (I − Bj Zj ) sea singular, como lo demostramos en el siguiente lema. Lema 4. Dada una matriz A = [a1 , . . . , am ]T ∈ Rm×n de rango completo, un vector y = (α1 , . . . , αm )T , x b, la solución de AT Ax = AT y, y Zj la solución de AT AZ = BjT , entonces Bj xbj − bj. es solución de. (I − Bj Zj )p = Bj x b − bj ,. donde Bj y bj son la matriz y el vector formado con las h filas quitadas a A y las h componentes quitadas a y, respectivamente. Demostración. Sean C = AT A, Cj = ATj Aj , d = AT y y dj = ATj yj , entonces Bj x b − bj. = Bj C −1 d − bj. = Bj C −1 (dj + BjT bj ) − bj. = Bj C −1 dj + Bj C −1 BjT bj − bj. = ZjT dj + (ZjT BjT − I)bj 2. Recordemos que resolver un segundo sistema con la misma matriz, resulta menos costoso puesto que ya se tiene la factorización de la matriz calculada al resolver el primer sistema..

(10) 64. A. Arevalo, H. Martı́nez y A. Sanabria. Bj x b − bj. = ZjT Cj xbj + (ZjT BjT − I)bj. = ZjT (C − BjT Bj )xbj + (ZjT BjT − I)bj. = ZjT C xbj − ZjT BjT Bj xbj + (ZjT BjT − I)bj = Bj xbj − ZjT BjT Bj xbj + (ZjT BjT − I)bj. = (I − ZjT BjT )Bj xbj + (ZjT BjT − I)bj. = (I − ZjT BjT )(Bj xbj − bj ) = (I − Bj Zj )(Bj xbj − bj ),. puesto que ZjT BjT = ZjT CZj es una matriz simétrica. Veamos ahora, que para el caso en que la matriz (I −Bj Zj ) es singular, gracias al lema anterior, podemos determinar un conjunto solución de ATj Aj x = ATj yj . Teorema 2. Dada una matriz A = [a1 , . . . , am ]T ∈ Rm×n de rango completo, un vector y = (α1 , . . . , αm )T y x b, la solución de AT Ax = AT y, entonces un conjunto T T solución de Aj Aj x = Aj yj es xbj = x b + Zj uj ,. para todo uj ∈ Rh , tal que uj sea solución de (I −Bj Zj )u = Bj x b −bj , donde Zj es la solución de AT AZ = BjT , y además, Bj y bj son la matriz y el vector formado con las h filas quitadas a A y las h componentes correspondientes quitadas a y, respectivamente. Demostración. Sean C = AT A, Cj = ATj Aj , d = AT y y dj = ATj yj , entonces Cj (b x + Zj uj ) = (C − BjT Bj )(b x + Zj uj ). = Cx b + CZj uj − BjT Bj x b − BjT Bj Zj uj. = d + BjT uj − BjT Bj x b − BjT Bj Zj uj. = d − BjT Bj x b + BjT (I − Bj Zj )uj. = d − BjT Bj x b + BjT (Bj x b − bj ). = d − BjT bj. = dj .. Por el teorema anterior, garantizamos que todo elemento de la forma x b+ Zj uj , donde (I − Bj Zj )uj = Bj x b − bj , es solución de ATj Aj x = ATj yj . Ahora, para completar una caracterización del conjunto solución de ATj Aj xj = ATj yj , necesitamos ver que toda solución xbj es de la forma x b +Zj uj , lo cual establecemos en el siguiente resultado..

(11) Cálculo Jackknife agrupado. 65. Teorema 3. Dada una matriz A = [a1 , . . . , am ]T ∈ Rm×n de rango completo, un vector y = (α1 , . . . , αm )T y x b, la solución de AT Ax = AT y. Si xbj es una solución T T de Aj Aj xj = Aj yj , entonces xbj = x b + Zj uj ,. para algún uj ∈ Rh , solución del sistema (I − Bj Zj )u = Bj x b − bj , donde Zj es la solución de AT AZ = BjT , y además, Bj y bj son la matriz y el vector formado con las h filas quitadas a A y las h componentes correspondientes quitadas a y, respectivamente. Demostración. Sean C = AT A, Cj = ATj Aj , d = AT y y dj = ATj yj , entonces Cj xbj T (C − Bj Bj )xbj C xbj − BjT Bj xbj Sea vj = Bj xbj , entonces. C xbj. C xbj. = dj = d − BjT bj. = d − BjT bj. = d − BjT bj + BjT Bj xbj .. = d − BjT bj + BjT vj. = d + BjT (vj − bj ).. Sea uj = vj − bj , entonces C xbj xbj. Además,. = d + BjT uj = C −1 (d + BjT uj ) = C −1 d + C −1 BjT uj = x b + Zj uj .. (I − Bj Zj )uj = (I − Bj Zj )(vj − bj ) = (I − Bj Zj )(Bj xbj − bj ) = Bj x b − bj . Ası́, hemos logrado caracterizar el conjunto solución de ATj Aj xj = ATj yj , aún para cuando Aj no es de rango completo. De los resultados anteriores, se puede notar que uj es de la forma wj − bj ; donde wj es solución de (I −Bj Zj )w = ZjT dj . Veamos que uj = wj −bj es solución.

(12) 66. A. Arevalo, H. Martı́nez y A. Sanabria. de (I − Bj Zj )u = Bj x b − bj .. (I − Bj Zj )uj = (I − Bj Zj )(wj − bj ) = (I − Bj Zj )wj − (I − Bj Zj )bj = ZjT dj + Bj Zj bj − bj. = ZjT (d − BjT bj ) + Bj Zj bj − bj. = ZjT d − ZjT BjT bj + Bj Zj bj − bj. = Bj C −1 d − bj. = Bj x b − bj. Ahora, en el caso en que Aj es de rango completo, la matriz (I − Bj Zj ) es no singular y ası́ el vector uj es único e igual a (wj − bj ), donde wj es la solución de (I − Bj Zj )w = ZjT dj , como se demostró en el Teorema 1. Dados los resultados anteriores, ahora podemos realizar una pequeña, pero significante modificación al algoritmo dado en la sección anterior, manteniendo su eficiencia y sin la condición de que las matrices Aj sean de rango completo; es decir, con la única condición de que sólo A sea de rango completo. Como existe la posibilidad que alguno de los subproblemas (Aj ) sean de rango deficiente (I−Bj Zj singular), el subproblema j tendrı́a infinitas soluciones. En tal caso, proponemos tomar uno de los uj que sean solución de (I − Bj Zj )u = Bj x b − bj y tomar a xbj = x b + Zj uj como solución del subproblema. Finalmente, generalizaremos nuestro resultado, quitando la condición sobre el problema inicial; es decir, sin importar si A es o no de rango completo. Para ello, veremos un lema que nos permitirá prescindir de esta condición. Lema 5. Dada una matriz A = [a1 , . . . , am ]T , un vector y = (α1 , . . . , αm )T y x b, T T una solución de A Ax = A y, entonces Bj xbj − bj. es solución de. (I − Bj Zj )p = Bj x b − bj ,. donde Zj es una solución de AT AZ = BjT , y además, Bj y bj son la matriz y el vector formado con las h filas quitadas a A y las h componentes correspondientes quitadas a y, respectivamente.. Demostración. Sean C = AT A, Cj = ATj Aj , d = AT y y dj = ATj yj . Como Cx b = d = dj + Bj bj , entonces ZjT C x b = ZjT dj + ZjT Bj bj .. Ahora, como CZj = BjT , entonces Bj x b = ZjT C x b = ZjT dj + ZjT Bj bj . Ası́, tenemos.

(13) Cálculo Jackknife agrupado. 67. que Bj x b − bj. = ZjT dj + (ZjT BjT − I)bj. = ZjT Cj xbj + (ZjT BjT − I)bj. = ZjT (C − BjT Bj )xbj + (ZjT BjT − I)bj. = ZjT C xbj − ZjT BjT Bj xbj + (ZjT BjT − I)bj. = Bj xbj − ZjT BjT Bj xbj + (ZjT BjT − I)bj. = (I − ZjT BjT )Bj xbj + (ZjT BjT − I)bj. = (I − ZjT BjT )(Bj xbj − bj ) = (I − Bj Zj )(Bj xbj − bj ).. Nótese que el sistema AT AZ = BjT siempre tiene solución (Zj ), puesto que el sistema AT AZ = BjT puede verse como h sistemas de la forma AT Azi = ak+i−1 , donde zi y ak+i−1 con i = 1, . . . , h, son los vectores columna de las matrices Z y BjT , respectivamente. Ahora, cada sistema AT Azi = ak+i−1 siempre tiene solución, puesto que, solucionar este sistema es equivalente a solucionar el sistema AT Azi = AT ek+i−1 que es el sistema de ecuaciones normales correspondiente al problema de mı́nimos cuadrados lineales mı́n kAz − ek+i−1 k, el cual siempre tiene solución (er es el r−ésimo vector canónico de Rh ). Ası́, con el Lema 5, garantizamos el mismo resultado del Lema 4; con la diferencia que ahora no necesitamos que la matriz A sea de rango completo, logrando garantizar que el Teorema 2 siga siendo válido aún cuando la matriz A no sea de rango completo. De esta manera, obtenemos un conjunto solución de ATj Aj x = ATj yj basado en una solución de AT Ax = AT y, sin condición alguna sobre el problema inicial o los subproblemas requeridos; es decir, que la matriz A y las matrices Aj no necesariamente sean de rango completo. Cabe anotar que el Teorema 3 no es válido sin la hipótesis de rango completo para la matriz A, por lo tanto, sin esta hipótesis no es posible caracterizar el conjunto solución de ATj Aj x = ATj yj . Dados los anteriores resultados, tenemos el soporte teórico para garantizar que el algoritmo propuesto es válido aún para cuando A y Aj sean de rango deficiente. Ası́, si el problema inicial (A) es de rango deficiente, entonces el problema inicial (AT Ax = AT y) tendrı́a infinitas soluciones. En tal caso, tomamos una de sus soluciones (un x b), una de las soluciones (Zj ) de AT AZ = BjT y un vector uj que sea solución de (I − Bj Zj )u = Bj x b − bj y la solución de ATj Aj xj = ATj yj sigue siendo xbj = x b + Zj uj , como se propuso anteriormente. Cabe resaltar que esta última modificación no altera la eficiencia lograda, puesto que la eficiencia se da al reducir el costo de solución de los subproblemas con base en la solución del problema inicial, aún ası́ los subproblemas y el problema inicial sean de rango deficiente..

(14) 68. A. Arevalo, H. Martı́nez y A. Sanabria. Créditos Este artı́culo hace parte del Trabajo de Grado dirigido por H.J. Martı́nez y A.M. Sanabria y presentado por A. Arévalo como requisito parcial para optar al tı́tulo de Matemático en la Universidad del Valle. Una versión inicial de este artı́culo fue presentado en el XVIII Congreso Colombiano de Matemáticas celebrado en Bucaramanga (Santander), en julio de 2011. Referencias [1] Behar, R. y Yepes, M. Sobre algunas técnicas de remuestreo: El método Jackknife. Heurı́stica 5, No 6, 1991. [2] Martı́nez, H. J. y Sanabria, A. M. Cálculo eficiente del estimador jackknife para mı́nimos cuadrados lineales bajo condiciones de unicidad. Matemáticas: Enseñanza Universitaria, Vol III, No 1 y 2, 2000. [3] Martı́nez, H. J. y Sanabria, A. M. Cálculo eficiente del estimador jackknife para mı́nimos cuadrados lineales de rango completo. Revista de la Académia Colombiana de Ciencias Exactas, Fı́sicas y Naturales, Vol XXX, 2006. [4] Martı́nez, H. J. y Sanabria, A. M. Cálculo eficiente del estimador jackknife para mı́nimos cuadrados lineales de rango deficiente. Aceptado para publicación en la Revista de la Académia Colombiana de Ciencias Exactas, Fı́sicas y Naturales, 2012. Dirección de los autores Alexander Arévalo S. — Departamento de Matemáticas, Universidad del Valle, CaliColombia e-mail: [email protected] Héctor J. Martı́nez R. — Departamento de Matemáticas, Universidad del Valle, CaliColombia e-mail: hector.martı́[email protected] Ana M. Sanabria R. — Departamento de Matemáticas, Universidad del Valle, CaliColombia e-mail: [email protected].

(15)

Referencias

Documento similar

(c) Consejo Superior de Investigaciones Científicas Licencia Creative Commons 3.0 España

Máster en Business Administration – MBA de UADE, Argentina, Publicista del Politécnico Grancolombiano, especialista en analizar, crear y ejecutar la experiencia de usuario (UX)

En virtud de esta política, que fue conocida como la apertura, numerosos y destacados po- líticos exiliados por el régimen pudieron regresar al país; la prensa disfrutó de una

Lo que me ha enseñado esta investigación es que todavía queda mucho que aprender del Valle de Cuelgamuros: El archivo de Méndez, las complejas cualidades de un espacio bajo

Los recintos serán una clase de artefactos técnicos (producidos por transformación de materias y productos por medio de otros artefactos) caracterizables como

Advi ´ertase que los resultados obtenidos coinciden con el estimador por m´ınimos cuadrados no lineales, por tanto, al igual que antes, no es posible dar una soluci ´on anal´ıtica

Esta uni- dad académica de investigación de la Pontificia Universidad Javeriana se ha preocupado principalmente por el hecho de que esta frontera se esté convir- tiendo cada vez más

Se entenderá por necesidad terapéutica la facultad del médico para actuar profesional- mente sin informar antes al paciente, cuando por razones objetivas el conocimiento de su