Cálculo eficiente del estimador Jackknife agrupado para mínimos cuadrados lineales

Texto completo

(1)Vol. XX, No 2, Diciembre (2012) Matemáticas: 55–68. Matemáticas: Enseñanza Universitaria c Escuela Regional de Matemáticas Universidad del Valle - Colombia. Cálculo eficiente del estimador Jackknife agrupado para mı́nimos cuadrados lineales Alexander Arévalo S.. Héctor J. Martı́nez R.. Ana M. Sanabria R.. Universidad del Valle. Universidad del Valle. Universidad del Valle. Recibido Ago. 30, 2011. Aceptado Ago. 01, 2012. Abstract In this paper, we generalize the results obtained by Martinez and Sanabria to calculate the Jackknife Estimator for Linear Least Squares, which express the estimates of the subproblems that result when calculating the Grouped Jackknife Estimator for the Linear Least Squares Problem (GJELLS) in terms of the initial estimate and other simple expressions to calculate, and thus modify the standard algorithm to calculate the GJELLS. 2 2 2 3 This modification reduces the number of operations of the order O( m hn ) + O( mh n ) + O( mn ) h to a number of operations of the order O(mn2 ) + O(hn) + O(mn) + O(mh2 ), where m is the sample size, h a fixed number given by the Grouped Jackknife Estimator (h << m) and n is the number of parameters to estimate (m ≥ n). Keywords: Linear Least Square, Jackknife estimator, Complexity of computation. MSC(2000): 93E24, 62F40, 03D15 Resumen En este artı́culo, hacemos una generalización de los resultados obtenidos por Martı́nez y Sanabria para el cálculo del Estimador Jackknife para Mı́nimos Cuadrados Lineales (EJMCL), los cuales permiten expresar los estimadores de los subproblemas que resultan al calcular el Estimador Jackknife Agrupado para Mı́nimos Cuadrados Lineales (EJAMCL) en términos del estimador inicial y otras expresiones sencillas de calcular, y ası́ modificar el algoritmo estándar para calcular el EJAMCL. 2 3 2 2 ) Con esta modificación, se reduce el número de operaciones del orden O( m hn )+O( mh n )+O( mn h 2 2 a un número de operaciones del orden O(mn )+O(hn)+O(mn)+O(mh ), donde m es el tamaño de la muestra, h un número fijo dado por el Estimador Jackknife Agrupado (h << m) y n es el número de parámetros a estimar (m ≥ n). Palabras y frases claves: Mı́nimos Cuadrados Lineales, Estimador Jackknife, Complejidad computacional. 1. Introducción. El algoritmo estándar para el cálculo del Estimador Jackknife para Mı́nimos Cuadrados Lineales (EJMCL) requiere un número de operaciones del orden O(m2 n2 )+ O(mn3 ), donde m es el tamaño de la muestra y n es el número de parámetros a estimar, lo cual hace que calcular el EJMCL sea muy costoso, computacionalmente hablando. Sin embargo, Martı́nez y Sanabria, usando convenientemente propiedades básicas del álgebra lineal, lograron obtener un algoritmo mucho más eficiente, disminuyendo el número de operaciones al orden O(mn) + O(mn2 ) bajo la condición de que el problema de estimación inicial y los subproblemas involucrados sean de rango completo [2]; posteriormente, lograron mantener el resultado.

(2) 56. A. Arevalo, H. Martı́nez y A. Sanabria. anterior sin la necesidad de que los subproblemas involucrados fuesen de rango completo [3]; y por último, lograron conservar la eficiencia del cálculo sin requerir condición alguna sobre el problema inicial, es decir, sin importar que el problema de estimación inicial sea de rango deficiente [4]. En este artı́culo, presentamos una generalización de los resultados obtenidos por Martı́nez y Sanabria, los cuales permiten realizar una modificación al algoritmo estándar para calcular el Estimador Jackknife Agrupado para Mı́nimos Cuadrados Lineales (EJAMCL), reduciendo el número de operaciones a realizar, generalizando ası́ el algoritmo para calcular el EJMCL obtenido por Martı́nez y Sanabria para el caso del estimador Jackknife agrupado. 2. Estimador Jackknife Agrupado para Mı́nimos Cuadrados Lineales (EJAMCL). Definición 1. Sea X1 , . . . , Xm una muestra aleatoria de una población caracterizada por un parámetro θ y T = tm (X1 , . . . , Xm ) un estimador de dicho parámetro, basado en la muestra de tamaño m. Al dividir la muestra en g grupos de tamaño h (m = gh), si denotemos por Tj al estimador T evaluado para los (m − h) elementos que quedan después de quitar el j-ésimo grupo de elementos de la muestra (j = 1, . . . , g), el Estimador Jackknife Agrupado (EJA) [1] es TJA. g. g. j=1. j=1. 1X (g − 1) X = (gT − (g − 1)Tj ) = gT − Tj . g g. De otro lado, dado el conjunto de observaciones (aTi , αi ), donde ai ∈ Rn y αi ∈ R para i = 1, . . . , m con m ≥ n, el problema de estimar x tal que αi = aTi x por el método de los mı́nimos cuadrados lineales, se reduce a encontrar x b tal que kAb x − yk2 = mı́nn kAx − yk2 , x∈R. donde A = [a1 , . . . , am ]T ∈ Rm×n y y = (α1 , . . . , αm )T . Al vector x b se le denomina Estimador de Mı́nimos Cuadrados Lineales (EMCL). Ahora, dividiendo las m observaciones de la muestra en g grupos de tamaño h (m = gh) y aplicando el método de estimación Jackknife agrupado a x b, obtenemos el Estimador Jackknife Agrupado para Mı́nimos Cuadrados Lineales (EJAMCL) x bJA = gb x − (g − 1). donde xbj es la solución del subproblema. g X xbj j=1. g. kAj xbj − yj k2 = mı́nn kAj x − yj k2 , x∈R. ,. j = 1, . . . , g ,.

(3) Cálculo Jackknife agrupado. 57. donde Aj es la matriz resultante de extraer el grupo j−ésimo de filas de la matriz A y yj es el vector resultante de extraer el grupo j−ésimo de componentes del vector y. Para efectos de un mayor entendimiento, daremos a continuación un pequeño ejemplo del cálculo del EJAMCL. Ejemplo 1. Dados los puntos (−6, −9), (−5, −6), (−4, −5), (−3, −3), (−2, 1), (−1, 0), (0, 3), (1, 5), (2, 7), (3, 9), (4, 12), (5, 13), deseamos estimar la mejor recta que los aproxime, en el sentido de los mı́nimos cuadrados; es decir, necesitamos estimar M y b tales que, si zi = M ti + b, kz − yk2 sea mı́nimo, siendo (ti , yi ) los puntos dados. En términos de la notación utilizada, tenemos que m = 12 y n = 2, y la matriz A, el vector y y el vector x estarı́an dados por     −6 1 −9 −6 −5 1     −5 −4 1     −3 −3 1     1 −2 1         M 0 −1 1 y x= A= , y =   b 3  0 1     5  1 1     7  2 1     9  3 1      4 1  12  5 1 13 Ası́, el estimador de mı́nimos cuadrados 3402 927 T x b= , ≈ (1, 98, 3, 24)T 1716 286. resuelve el problema mı́nx∈R2 kAx − yk2 . De igual forma, tomando g = 3, h = 4, podemos calcular el EJAMCL, calculando los respectivos xbj , para j = 1, 2, 3, que resuelven mı́nx∈R2 kAj x − yj k2 para las siguientes matrices y vectores: y1 = (1, 0, 3, 5, 7, 9, 12, 13)T        −9 −6 −6 1 −2 1 −1 1 −5 1 −6 −5        −4  0 1 −4 1 −5         1 1 −3 1 −3 −3       A1 =   2 1 , A2 =  2 1 , y2 =  7  , A3 = −2         3 1 9 −1  3 1         4 1  12  0  4 1 5 1 13 1 5 1.    1 −9    1 −6 −5 1    −3  1  , y3 =  1  1   0 1    3 1 1 5.

(4) 58. A. Arevalo, H. Martı́nez y A. Sanabria. Los estimadores de las submuestras son:  128   41   21   69  1, 95 1, 85     x c1 =   ≈ , x c2 =   ≈ 3, 17 , 3, 32 93 877 28 276.  27 .  14   x c3 =   ≈ 43 14. Ahora, utilizando la fórmula para x bJA , tenemos el EJAMCL ası́, x bJA.  3402 .  1716  3 − 1 − = 3   3 927 286. .  41 .  128 .  27 .  21   69   14   + +        93 877 43 28 276 14. .  212 .  100  ≈ =   334 100. 1, 92 3, 07. . 2, 12 , 3, 34. el cual es un estimador de x que posee mejores propiedades estadı́sticas que x̂, calculado inicialmente. El algoritmo estándar para calcular el EJAMCL lo podemos expresar en los siguientes cuatro pasos: 1. Dados A ∈ Rm×n , y ∈ Rm . 2. Resolver mı́nx∈Rn kAx − yk22 . ⇒ Salida: x b. 3. Para j = 1, . . . , g.. Resolver mı́nx∈Rn kAj x − yj k22 . ⇒ Salida: xbj .. 4. Calcular x bJA = gb x − (g − 1). Pg. j=1. x bj . ⇒ Salida: x bJA . g. Si las matrices A y Aj , para j = 1, . . . , g, son de rango completo, los pasos 1 y 2 se reducen a encontrar las soluciones únicas de los sistemas de ecuaciones AT Ax = AT y. y. ATj Aj xj = ATj yj ,. para j = 1, . . . , g.. En otra palabras, se reduce a calcular x b y los xbj , tal que x b = (AT A)−1 AT y. y. xbj = (ATj Aj )−1 ATj yj ,. para j = 1, . . . , g.. Resolviendo los problemas planteados en los pasos 1 y 2 por el método de las ecuaciones normales, un algoritmo más detallado para el cálculo de EJAMCL es el siguiente. 3. Algoritmo estándar detallado para calcular el EJAMCL 1. Dados A ∈ Rm×n , y ∈ Rm . 2. {Resolver AT Ax = AT y.}.

(5) Cálculo Jackknife agrupado. 59. • Calcular C = AT A. • Calcular d = AT y.. • Resolver Cx = d. ⇒ Salida: x b.. 3. Para j = 1, . . . , g. {Resolver ATj Aj x = ATj yj .} • Calcular Cj = ATj Aj .. • Calcular dj = ATj yj .. • Resolver Cj xj = dj . ⇒ Salida: xbj .. 4. Calcular x bJA = gb x − (g − 1). Pg. j=1. xbj . ⇒ Salida: x bJA . g. En el algoritmo detallado anteriormente, nótese que la cantidad de operaciones necesarias para resolver los sistemas de ecuaciones lineales1 en el paso 1 3 es aproximadamente [mn2 + mn + n3 ] y, en el paso 2, es aproximadamente n3 2 [m h ((m−h)n +(m−h)n+ 6 )], donde m es el tamaño de la muestra, h un número fijo dado por el Estimador Jackknife Agrupado (h << m) y n es el número de parámetros a estimar (m ≥ n); por tanto, lo más costoso del algoritmo es el paso 2, donde se deben calcular los respectivos xbj . En adelante, usaremos la siguiente notación. Dada A = [a1 , . . . , am ]T con ai ∈ Rn , i = 1, . . . , m, la matriz Aj ∈ R(m−h)×n es la matriz que resulta de quitar h filas a la matriz A, que, sin perdida de generalidad, suponemos que son seguidas. Ası́ Aj = [a1 , . . . , ak−1 , ak+h , . . . , am ]T . Denotaremos por Bj ∈ R(h×n) la matriz formada por las h filas que se le quitaron a la matriz A. Ası́ Bj = [ak , . . . , ak+h−1 ]T . De igual forma, dado y = (α1 , . . . , αm )T con αi ∈ R, i = 1, . . . , m, el vector yj ∈ Rm−h es el vector que resulta de quitar las h componentes correspondientes al vector y. Ası́ yj = (α1 , . . . , αk−1 , αk+h , . . . , αm )T . Denotaremos por bj ∈ Rh el vector formado por las h componentes que se le quitaron al vector y. Ası́ bj = (αk , . . . , αk+h−1 )T . 1. Se asume que el sistema Cx = d se resuelve con un algoritmo como Cholesky. Otros algoritmos como QR, para resolver este sistema, no requieren el cálculo de la matriz C pero resultan ser más costosos, aunque proporcionan una mayor estabilidad numérica..

(6) 60 4. A. Arevalo, H. Martı́nez y A. Sanabria. Algunos resultados del álgebra lineal. A continuación, veremos una serie de resultados que, aunque no sean requeridos de manera directa, son importantes para el diseño y demostración de los resultados que respaldan los algoritmos. En primer lugar, con el objetivo de rebajar el costo del cálculo de ATj Aj , obtuvimos una generalización del Lema de Vargas [2]. Lema 1. Dada una matriz A = [a1 , . . . , am ]T ∈ Rm×n , si la matriz Aj = [a1 , . . . , ak−1 , ak+h , . . . , am ]T , es la matriz que resulta de quitar h filas a la matriz A y la matriz Bj es la matriz que se forma con las h filas que se quitaron a A; entonces ATj Aj = AT A − BjT Bj . Demostración. ATj Aj. = [a1 , . . . , ak−1 , ak+h , . . . , am ][a1 , . . . , ak−1 , ak+h , . . . , am ]T =. =. k−1 X. ai aTi. +. i=1. i=k+h. k−1 X. k+h−1 X. ai aTi. +. i=1. =. m X. m X i=1. ai aTi ai aTi. i=k. ai aTi −. k+h−1 X. −. k+h−1 X. ai aTi. i=k. +. m X. ai aTi. i=k+h. ai aTi. i=k. = [a1 , . . . , am ][a1 , . . . , am ]T − [ak , . . . , ak+h−1 ][ak , . . . , ak+h−1 ]T. = AT A − BjT Bj .. De igual manera, generalizamos el Lema 2 dado en [2], que nos permite simplificar el cálculo de ATj yj . Lema 2. Dada una matriz A = [a1 , . . . , am ]T y un vector y = (α1 , . . . , αm )T , si la matriz Aj = [a1 , . . . , ak−1 , ak+h , . . . , am ]T y el vector yj = (α1 , . . . , αk−1 , αk+h , . . . , αm )T , son, respectivamente, la matriz y el vector que resultan de quitar h filas a la matriz A y las h componentes correspondientes del vector y, y la matriz Bj es la matriz que se forma con las h filas que se quitaron a A y el vector bj es el vector que se forma con las h componentes que se quitaron a y; entonces ATj yj = AT y − BjT bj ..

(7) Cálculo Jackknife agrupado. 61. Demostración. ATj yj. = [a1 , . . . , ak−1 , ak+h , . . . , am ](α1 , . . . , αk−1 , αk+h , . . . , αm )T = α1 a1 + . . . + αk−1 ak−1 + αk+h ak+h + . . . + αm am = α1 a1 + . . . + αm am − αk ak − . . . − αk+h−1 ak+h−1 m X = αi ai − [ak , . . . , ak+h−1 ](αk , . . . , αk+h−1 )T i=1 T. = A y − BjT bj .. Por último, un resultado clave para el logro de nuestro objetivo, conocido como la fórmula general de Sherman-Morrison-Woodbury. Lema 3. (Sherman-Morrison-Woodbury) Dadas las matrices W ∈ Rn×n no singular, U ∈ Rn×m , V ∈ Rm×n y la idéntica Ik ∈ Rk×k . (Im + V W −1 U ) es no singular, si y sólo si, (W + U V ) es no singular. Además, si (Im + V W −1 U ) es no singular, (W + U V )−1 = W −1 − W −1 U (Im + V W −1 U )−1 V W −1 Demostración. ⇒) Si (Im + V W −1 U ) es no singular, tenemos que (W. + U V )(W −1 − W −1 U (Im + V W −1 U )−1 V W −1 ). = In + U V W −1 − U (Im + V W −1 U )−1 V W −1 + U V W −1 U (Im + V W −1 U )−1 V W −1. = In + U V W −1 − (U + U V W −1 U )(Im + V W −1 U )−1 V W −1. = In + U V W −1 − U (Im + V W −1 U )(Im + V W −1 U )−1 V W −1 = In + U V W −1 − U V W −1 = In .. ⇐) Sea Z = W −1 U . Si (Im + V W −1 U ) = (Im + V Z) es singular, entonces existe x ∈ Rm diferente de cero, tal que (I + V Z)x = 0. Demostremos que y = Zx ∈ Rn es diferente de cero y (In + ZV )y = 0. De las hipótesis sobre x, tenemos que x = −V Zx = −V y, por lo tanto, si y = 0, x seria 0; por lo cual, concluimos que y 6= 0. Además, (In + ZV )y = (In + ZV )Zx = (Z + ZV Z)x = Z(Im + V Z)x = Z0 = 0, por lo tanto, (In + ZV ) es singular, y como (W + U V ) = W (In + W −1 U V ) = W (In + ZV ), concluimos que (W+UV) es singular..

(8) 62. A. Arevalo, H. Martı́nez y A. Sanabria. Ahora, haciendo uso de los lemas anteriores y bajo el supuesto que el problema inicial y los subproblemas respectivos son de rango completo, podemos expresar las soluciones de los sistemas ATj Aj xj = ATj yj del segundo paso del algoritmo, en términos de la solución de AT Ax = AT y y otras expresiones sencillas de calcular, como se muestra en el siguiente teorema. Teorema 1. Dada una matriz A = [a1 , . . . , am ]T ∈ Rm×n y un vector y = (α1 , ..., αm )T , si la matriz Aj = [a1 , . . . , ak−1 , ak+h , . . . , am ]T y el vector yj = (α1 , . . . , αk−1 , αk+h , . . . , αm ) son, respectivamente, la matriz y el vector que resultan de quitar h filas a la matriz A y las h componentes correspondientes del vector y; y además, A y Aj son matrices de rango completo, entonces xbj , la solución de ATj Aj xj = ATj yj , está dada por xbj = x b + Zj (wj − bj ),. donde x b es la solución de AT Ax = AT y , Zj es la solución de AT AZ = BjT , wj es la solución de (I − Bj Zj )w = ZjT dj con dj = ATj yj , y además, Bj y bj son la matriz y vector formado con las h filas quitadas a A y las h componentes quitadas a y, respectivamente. Demostración. Sean C = AT A, Cj = ATj Aj y d = AT y. Como A y Aj son de rango completo, entonces C y Cj son invertibles. Por el Lema 1, Cj = C − BjT Bj , por el Lema 2, dj = d − BjT bj y por el Lema 3, tenemos que Cj−1 = C −1 + C −1 BjT (I − Bj C −1 BjT )−1 Bj C −1 . Ahora xbj. = Cj−1 dj = [C −1 + C −1 BjT (I − Bj C −1 BjT )−1 Bj C −1 ]dj. = C −1 dj + C −1 BjT (I − Bj C −1 BjT )−1 Bj C −1 dj. = C −1 (d − BjT bj ) + C −1 BjT (I − Bj C −1 BjT )−1 Bj C −1 dj. = C −1 d − C −1 BjT bj + C −1 BjT (I − Bj C −1 BjT )−1 Bj C −1 dj . Sea Zj la solución de CZ = BjT , entonces xbj = x b − Zj bj + Zj (I − Bj Zj )−1 ZjT dj .. Sea wj la solución de (I − Bj Zj )w = ZjT dj , entonces xbj. = x b − Zj bj + Zj wj. = x b + Zj (wj − bj )..

(9) Cálculo Jackknife agrupado. 63. Con base en el Teorema 1, podemos decir que para la solución de los (m − h) sistemas de los subproblemas no es necesario calcular ATj Aj ni ATj yj , y que la solución del sistema ATj Aj x = ATj yj se reduce a la solución de sistemas con la matriz AT A 2 y al cálculo de algunos productos internos, haciendo que el costo del algoritmo estándar del EJAMCL sea mucho menor. Por tanto, proponemos modificar el paso 2 del algoritmo estándar de la siguiente manera. Para j = 1, . . . , g. {Resolver ATj Aj x = ATj yj .} • Resolver CZj = BjT . • Calcular Sj = Bj Zj . • Calcular rj = ZjT dj . • Resolver (I − Sj )wj = rj . • Calcular xbj = x b − Zj (wj − bj ).. ⇒ Salida: xbj . Haciendo esta modificación en el paso 2 del algoritmo estándar del EJAMCL, bajo el supuesto que A y Aj son de rango completo, reducimos el número de n3 h2 2 2 operaciones del algoritmo de [ m h ((m − h)n + (m − h)n + 6 )] a [n + hn + 2n + 3 ], donde m es el tamaño de la muestra, h un número fijo dado por el estimador Jackknife Agrupado (h << m) y n es el número de parámetros a estimar (m ≥ n). Claramente, el hecho que una matriz A sea de rango completo no implica que las matrices Aj también lo sean. Por ello, nos propusimos encontrar una caracterización de las soluciones de ATj Aj x = ATj yj basada en la solución de AT Ax = AT y, independientemente si las respectivas Aj son o no de rango completo. Para ello, necesitamos probar que el sistema (I − Bj Zj )p = Bj x b − bj tiene solución, aún cuando (I − Bj Zj ) sea singular, como lo demostramos en el siguiente lema. Lema 4. Dada una matriz A = [a1 , . . . , am ]T ∈ Rm×n de rango completo, un vector y = (α1 , . . . , αm )T , x b, la solución de AT Ax = AT y, y Zj la solución de AT AZ = BjT , entonces Bj xbj − bj. es solución de. (I − Bj Zj )p = Bj x b − bj ,. donde Bj y bj son la matriz y el vector formado con las h filas quitadas a A y las h componentes quitadas a y, respectivamente. Demostración. Sean C = AT A, Cj = ATj Aj , d = AT y y dj = ATj yj , entonces Bj x b − bj. = Bj C −1 d − bj. = Bj C −1 (dj + BjT bj ) − bj. = Bj C −1 dj + Bj C −1 BjT bj − bj. = ZjT dj + (ZjT BjT − I)bj 2. Recordemos que resolver un segundo sistema con la misma matriz, resulta menos costoso puesto que ya se tiene la factorización de la matriz calculada al resolver el primer sistema..

(10) 64. A. Arevalo, H. Martı́nez y A. Sanabria. Bj x b − bj. = ZjT Cj xbj + (ZjT BjT − I)bj. = ZjT (C − BjT Bj )xbj + (ZjT BjT − I)bj. = ZjT C xbj − ZjT BjT Bj xbj + (ZjT BjT − I)bj = Bj xbj − ZjT BjT Bj xbj + (ZjT BjT − I)bj. = (I − ZjT BjT )Bj xbj + (ZjT BjT − I)bj. = (I − ZjT BjT )(Bj xbj − bj ) = (I − Bj Zj )(Bj xbj − bj ),. puesto que ZjT BjT = ZjT CZj es una matriz simétrica. Veamos ahora, que para el caso en que la matriz (I −Bj Zj ) es singular, gracias al lema anterior, podemos determinar un conjunto solución de ATj Aj x = ATj yj . Teorema 2. Dada una matriz A = [a1 , . . . , am ]T ∈ Rm×n de rango completo, un vector y = (α1 , . . . , αm )T y x b, la solución de AT Ax = AT y, entonces un conjunto T T solución de Aj Aj x = Aj yj es xbj = x b + Zj uj ,. para todo uj ∈ Rh , tal que uj sea solución de (I −Bj Zj )u = Bj x b −bj , donde Zj es la solución de AT AZ = BjT , y además, Bj y bj son la matriz y el vector formado con las h filas quitadas a A y las h componentes correspondientes quitadas a y, respectivamente. Demostración. Sean C = AT A, Cj = ATj Aj , d = AT y y dj = ATj yj , entonces Cj (b x + Zj uj ) = (C − BjT Bj )(b x + Zj uj ). = Cx b + CZj uj − BjT Bj x b − BjT Bj Zj uj. = d + BjT uj − BjT Bj x b − BjT Bj Zj uj. = d − BjT Bj x b + BjT (I − Bj Zj )uj. = d − BjT Bj x b + BjT (Bj x b − bj ). = d − BjT bj. = dj .. Por el teorema anterior, garantizamos que todo elemento de la forma x b+ Zj uj , donde (I − Bj Zj )uj = Bj x b − bj , es solución de ATj Aj x = ATj yj . Ahora, para completar una caracterización del conjunto solución de ATj Aj xj = ATj yj , necesitamos ver que toda solución xbj es de la forma x b +Zj uj , lo cual establecemos en el siguiente resultado..

(11) Cálculo Jackknife agrupado. 65. Teorema 3. Dada una matriz A = [a1 , . . . , am ]T ∈ Rm×n de rango completo, un vector y = (α1 , . . . , αm )T y x b, la solución de AT Ax = AT y. Si xbj es una solución T T de Aj Aj xj = Aj yj , entonces xbj = x b + Zj uj ,. para algún uj ∈ Rh , solución del sistema (I − Bj Zj )u = Bj x b − bj , donde Zj es la solución de AT AZ = BjT , y además, Bj y bj son la matriz y el vector formado con las h filas quitadas a A y las h componentes correspondientes quitadas a y, respectivamente. Demostración. Sean C = AT A, Cj = ATj Aj , d = AT y y dj = ATj yj , entonces Cj xbj T (C − Bj Bj )xbj C xbj − BjT Bj xbj Sea vj = Bj xbj , entonces. C xbj. C xbj. = dj = d − BjT bj. = d − BjT bj. = d − BjT bj + BjT Bj xbj .. = d − BjT bj + BjT vj. = d + BjT (vj − bj ).. Sea uj = vj − bj , entonces C xbj xbj. Además,. = d + BjT uj = C −1 (d + BjT uj ) = C −1 d + C −1 BjT uj = x b + Zj uj .. (I − Bj Zj )uj = (I − Bj Zj )(vj − bj ) = (I − Bj Zj )(Bj xbj − bj ) = Bj x b − bj . Ası́, hemos logrado caracterizar el conjunto solución de ATj Aj xj = ATj yj , aún para cuando Aj no es de rango completo. De los resultados anteriores, se puede notar que uj es de la forma wj − bj ; donde wj es solución de (I −Bj Zj )w = ZjT dj . Veamos que uj = wj −bj es solución.

(12) 66. A. Arevalo, H. Martı́nez y A. Sanabria. de (I − Bj Zj )u = Bj x b − bj .. (I − Bj Zj )uj = (I − Bj Zj )(wj − bj ) = (I − Bj Zj )wj − (I − Bj Zj )bj = ZjT dj + Bj Zj bj − bj. = ZjT (d − BjT bj ) + Bj Zj bj − bj. = ZjT d − ZjT BjT bj + Bj Zj bj − bj. = Bj C −1 d − bj. = Bj x b − bj. Ahora, en el caso en que Aj es de rango completo, la matriz (I − Bj Zj ) es no singular y ası́ el vector uj es único e igual a (wj − bj ), donde wj es la solución de (I − Bj Zj )w = ZjT dj , como se demostró en el Teorema 1. Dados los resultados anteriores, ahora podemos realizar una pequeña, pero significante modificación al algoritmo dado en la sección anterior, manteniendo su eficiencia y sin la condición de que las matrices Aj sean de rango completo; es decir, con la única condición de que sólo A sea de rango completo. Como existe la posibilidad que alguno de los subproblemas (Aj ) sean de rango deficiente (I−Bj Zj singular), el subproblema j tendrı́a infinitas soluciones. En tal caso, proponemos tomar uno de los uj que sean solución de (I − Bj Zj )u = Bj x b − bj y tomar a xbj = x b + Zj uj como solución del subproblema. Finalmente, generalizaremos nuestro resultado, quitando la condición sobre el problema inicial; es decir, sin importar si A es o no de rango completo. Para ello, veremos un lema que nos permitirá prescindir de esta condición. Lema 5. Dada una matriz A = [a1 , . . . , am ]T , un vector y = (α1 , . . . , αm )T y x b, T T una solución de A Ax = A y, entonces Bj xbj − bj. es solución de. (I − Bj Zj )p = Bj x b − bj ,. donde Zj es una solución de AT AZ = BjT , y además, Bj y bj son la matriz y el vector formado con las h filas quitadas a A y las h componentes correspondientes quitadas a y, respectivamente.. Demostración. Sean C = AT A, Cj = ATj Aj , d = AT y y dj = ATj yj . Como Cx b = d = dj + Bj bj , entonces ZjT C x b = ZjT dj + ZjT Bj bj .. Ahora, como CZj = BjT , entonces Bj x b = ZjT C x b = ZjT dj + ZjT Bj bj . Ası́, tenemos.

(13) Cálculo Jackknife agrupado. 67. que Bj x b − bj. = ZjT dj + (ZjT BjT − I)bj. = ZjT Cj xbj + (ZjT BjT − I)bj. = ZjT (C − BjT Bj )xbj + (ZjT BjT − I)bj. = ZjT C xbj − ZjT BjT Bj xbj + (ZjT BjT − I)bj. = Bj xbj − ZjT BjT Bj xbj + (ZjT BjT − I)bj. = (I − ZjT BjT )Bj xbj + (ZjT BjT − I)bj. = (I − ZjT BjT )(Bj xbj − bj ) = (I − Bj Zj )(Bj xbj − bj ).. Nótese que el sistema AT AZ = BjT siempre tiene solución (Zj ), puesto que el sistema AT AZ = BjT puede verse como h sistemas de la forma AT Azi = ak+i−1 , donde zi y ak+i−1 con i = 1, . . . , h, son los vectores columna de las matrices Z y BjT , respectivamente. Ahora, cada sistema AT Azi = ak+i−1 siempre tiene solución, puesto que, solucionar este sistema es equivalente a solucionar el sistema AT Azi = AT ek+i−1 que es el sistema de ecuaciones normales correspondiente al problema de mı́nimos cuadrados lineales mı́n kAz − ek+i−1 k, el cual siempre tiene solución (er es el r−ésimo vector canónico de Rh ). Ası́, con el Lema 5, garantizamos el mismo resultado del Lema 4; con la diferencia que ahora no necesitamos que la matriz A sea de rango completo, logrando garantizar que el Teorema 2 siga siendo válido aún cuando la matriz A no sea de rango completo. De esta manera, obtenemos un conjunto solución de ATj Aj x = ATj yj basado en una solución de AT Ax = AT y, sin condición alguna sobre el problema inicial o los subproblemas requeridos; es decir, que la matriz A y las matrices Aj no necesariamente sean de rango completo. Cabe anotar que el Teorema 3 no es válido sin la hipótesis de rango completo para la matriz A, por lo tanto, sin esta hipótesis no es posible caracterizar el conjunto solución de ATj Aj x = ATj yj . Dados los anteriores resultados, tenemos el soporte teórico para garantizar que el algoritmo propuesto es válido aún para cuando A y Aj sean de rango deficiente. Ası́, si el problema inicial (A) es de rango deficiente, entonces el problema inicial (AT Ax = AT y) tendrı́a infinitas soluciones. En tal caso, tomamos una de sus soluciones (un x b), una de las soluciones (Zj ) de AT AZ = BjT y un vector uj que sea solución de (I − Bj Zj )u = Bj x b − bj y la solución de ATj Aj xj = ATj yj sigue siendo xbj = x b + Zj uj , como se propuso anteriormente. Cabe resaltar que esta última modificación no altera la eficiencia lograda, puesto que la eficiencia se da al reducir el costo de solución de los subproblemas con base en la solución del problema inicial, aún ası́ los subproblemas y el problema inicial sean de rango deficiente..

(14) 68. A. Arevalo, H. Martı́nez y A. Sanabria. Créditos Este artı́culo hace parte del Trabajo de Grado dirigido por H.J. Martı́nez y A.M. Sanabria y presentado por A. Arévalo como requisito parcial para optar al tı́tulo de Matemático en la Universidad del Valle. Una versión inicial de este artı́culo fue presentado en el XVIII Congreso Colombiano de Matemáticas celebrado en Bucaramanga (Santander), en julio de 2011. Referencias [1] Behar, R. y Yepes, M. Sobre algunas técnicas de remuestreo: El método Jackknife. Heurı́stica 5, No 6, 1991. [2] Martı́nez, H. J. y Sanabria, A. M. Cálculo eficiente del estimador jackknife para mı́nimos cuadrados lineales bajo condiciones de unicidad. Matemáticas: Enseñanza Universitaria, Vol III, No 1 y 2, 2000. [3] Martı́nez, H. J. y Sanabria, A. M. Cálculo eficiente del estimador jackknife para mı́nimos cuadrados lineales de rango completo. Revista de la Académia Colombiana de Ciencias Exactas, Fı́sicas y Naturales, Vol XXX, 2006. [4] Martı́nez, H. J. y Sanabria, A. M. Cálculo eficiente del estimador jackknife para mı́nimos cuadrados lineales de rango deficiente. Aceptado para publicación en la Revista de la Académia Colombiana de Ciencias Exactas, Fı́sicas y Naturales, 2012. Dirección de los autores Alexander Arévalo S. — Departamento de Matemáticas, Universidad del Valle, CaliColombia e-mail: [email protected] Héctor J. Martı́nez R. — Departamento de Matemáticas, Universidad del Valle, CaliColombia e-mail: hector.martı́[email protected] Ana M. Sanabria R. — Departamento de Matemáticas, Universidad del Valle, CaliColombia e-mail: [email protected].

(15)