Revisión de la Estimación Robusta en Modelos de Supervivencia

(1)

1 INTRODUCCI ´ON. 1

Revisi ´on de la Estimaci ´on Robusta en Modelos de

Supervivencia

Enrique E. ´Alvarez y Julieta Ferrario Universidad Nacional de La Plata y CONICET

Resumen

En An álisis de Supervivencia se analizan datos referidos al tiempo final de ocurrencia de un evento,T , y asociado a éste se recogen un vector de variables explicativas independientes o “covariates”, Z. Lo que se desea es modelar la relaci ón entreT y Z, y el enfoque m ás com ún para ésto se basa sobre la funci ón de intensidad o tasa de riesgo, definida como:

λ(t) := l´ım

ǫ↓0

Prob_{T ≤ t + ǫ|T > t}

ǫ .

Una generalizaci ón de los modelos para la funci ón de riesgo incluye variables regresoras. Éstos pueden ser formadas de varias maneras y los tres modelos semiparamétricos m ás utilizados y a los que hacemos referencia aqu´ı son: de riesgo proporcional, de tiempo de falla acelerado y de riesgo aditivo. El objetivo de esta revisi ón es recopilar algunas propuestas de robustificaci ón realizadas hasta el momento para los modelos proporcional, de falla acelerado y aditivo, a fin de proponer una manera natural de abordar la robustificaci ón del modelo aditivo que, a nuestro entender, no hay nada propuesto hasta el momento para eventos simples.

1. Introducci ´

on.

Para analizar datos referidos al tiempo final de ocurrencia, T , de un evento, ´este se refiere como tiempo de falla. El evento que se analiza puede ser recurrente o no, y adem ´as su tiempo de falla puede ser causado por varias motivos. Asociado a cada tiempo de falla del evento se recogen un vector de covariates Z que puede incluir variables cuantitativas, cualitativas, que dependan o no del tiempo e incluso pueden ser variables externas (independientes del proceso del evento recurrente) y/o internas (si no es externa).

Para modelar y determinar la distribuci ´on de T , F (t), que la suponemos continua en todo este tra-bajo (es decir, F (t) = Rt

0f (u) du) se definen dos funciones importantes y ´utiles en las aplicaciones de

supervivencia:

la funci ´on de supervivencia:S(t) = 1 − F (t);

la funci ´on de riesgo o funci ´on de intensidad de falla:λ(t) = f (t)/S(t) = −d ln(S(t))/dt.

Nosotros nos focalizamos s ólo en los modelos basados sobre la funci ón de intensidad. Esta funci ón, antes ya definida, también se la puede definir a través del proceso de conteo de la ocurrencia del evento, {N(t) : t ≥ 0}. La función de intensidad de un individuo para el proceso del evento es definida como

λ(t|H(t)) = l´ım ∆t↓0 P r∆N(t) = 1|H(t) ∆t , (1) donde∆N (t) = N (t + ∆t− ) − N(t−

) y H(t) = {N(s) : 0 ≤ s < t} es la historia de los eventos antes de t del individuo. Esto es,λ(t|H(t))∆t es, para ∆t chico, la probabilidad aproximada de que un evento ocurra en (t, t + ∆t−_{] dado la historia del proceso antes de t.}

Una generalizaci ón de los modelos para la funci ón de intensidad del tiempo de fallaT asociada con el vector Z incluye variables regresoras. Éstas pueden ser formadas de varias maneras y las tres m ás comunes y las cuales nos referiremos aqu´ı, para cada individuo con covariate Z, son:

(2)

2 MODELO DE RIESGO MULTIPLICATIVO 2 1. Modelo de riesgo proporcional o riesgo multiplicativo de Cox:

λ(t|Z) = λ0(t) exp(β′0Z(t))

2. Modelo de tiempo de falla acelerado:

λ(t|Z) = λ0 t exp(β′0Z(t)) exp(β ′ 0Z(t))

3. Modelo de riesgo aditivo:

λ(t|Z) = λ0(t) + β′0Z(t)

donde β0 ∈ Rp es el vector de par ámetro de regresi ón, λ0(t) = λ(t|Z = 0) es la función baseline,

des-conocida, arbitraria y no negativa en funci ón del tiempo. En los tres casos se desea estimar el vector de par ámetro de regresi ón y la funci ón baseline, λ0(t). Estos modelos son semiparamétricos ya que se

supone un modelo paramétrico solamente para el efecto de la variable independiente Z, mientras que la funci ón λ0 es tratada de forma no paramétrica. Observar que la funci ón de intensidad es modificada por

una proporci ón (modelo de Cox), una reescalaci ón (modelo de falla acelerado) y una traslaci ón (modelo aditivo).

Haremos, para cada uno de los modelos anteriores, una revisi ón y an álisis de algunos trabajos fo-caliz ándonos s ólamente sobre los resultados estad´ısticos de la estimaci ón del par ámetro de regresi ón, motivados por la b úsqueda de estimadores menos sensibles a observaciones extremas y de alta palanca y/o a perturbaciones en la distribuci ón de F , que se han estudiado hasta el momento en las siguientes secciones.

En la siguiente secci ón desarrollamos las propuestas de estimaci ón del par ámetro para el modelo de riesgo proporcional en el que exponemos, para el caso en que el evento sea simple, el conocido estimador de m áxima verosimilitud parcial (o estimador de Cox (1972 y 1975)) y dos propuestas robustas, la de Sasieni (1993 A y B) y la de Bednarski (1993). También desarrollamos la extensi ón del estimador de Cox, que realizan Huang y Chen (2003), a eventos recurrentes. En la Secci ón 3 desarrollamos las propuestas robustas (para eventos simples) de Locatelli, Marazzi y Yohai (2011), y (para eventos recurrentes) de Lin, Wei y Ying (1998) y Strawderman (2005) para el modelo de falla acelerado. Por último, en la Secci ón 4 para la estimaci ón en el modelo aditivo daremos las ideas de Lin y Ying (1994), para eventos simples y Sun, Park y Sun (2006) para eventos recurrentes.

2. Modelo de riesgo multiplicativo

En el modelo cl ´asico de riesgo proporcional de Cox (1972), se considera que los datos provienen de un evento simple y donde la variable explicativa es externa e independiente del tiempo. Se consideran m individuos independientes, se observan los tiempos de falla de cada unoti en el intervalo de tiempo finito

[0, τ ] y se define Ni(t) como el n ´umero total de tiempos de falla en(0, t] del evento del individuo i donde

Ni(0) = 0. Luego el proceso estoc ´astico {Ni(t) : t ≥ 0} es un proceso de conteo para la ocurrencia del evento.

Sea Hi(t) = {Ni(s) : 0 ≤ s < t} la historia de los eventos antes de t del individuo i, (i = 1 : m). Entonces

para este modelo, para el tiempo de supervivenciatidel individuoi con vector de variables independientes

Zi∈ Rp, la funci ´on de intensidad es de la forma

λ(ti|Zi) = λ0(ti) exp(β′0Zi) , (2)

donde β0 es unp−vector de coeficientes de regresi´on desconocido y λ0, la funci ´on de riesgo para Zi = 0

(3)

2 MODELO DE RIESGO MULTIPLICATIVO 3 La funci ´on de verosimilitud condicional sobre Hi(τ ) de m individuos independientes, bajo el modelo

(2), es: LC(β0, λ0) = m Y i=1 λ0(ti) exp(β′0Zi) exp − Z τ 0 λ0(u) exp(β′0Zi) du = m Y i=1 λ0(ti) exp(β′0Zi) exp − exp(β′0Zi) Z τ 0 λ0(u) du = m Y i=1

λ0(ti) exp(β′0Zi) exp − Λ0(τ ) exp(β′0Zi), (3)

dondeΛ0(t) =R₀tλ0(u) du es la funci ´on de baseline acumulada. Observemos que esta funci ´on de

verosimi-litud depende del par ´ametro β0 y de la funci ´onλ0, ambas desconocidas.

Cox (1975), para estimar β0 en (2), por la falta de conocimiento de λ0(·) en (3), propuso un m´etodo

de estimaci ´on denominado m ´axima verosimilitud parcial (MVP). La verosimilitud parcial no es una vero-similitud en el sentido usual ya que fue motivada condicionando sobre los tiempos de fallas observados ti, donde la probabilidad condicional de que el individuoi falle en ti dado que los individuosk tales que

tk≥ tiy que solo uno de ellos falle enti es

λ(ti|Zi)

P

tk≥tiλ(ti|Zk)

. Luego la funci ´on de MVP es:

LP(β) = m Y i=1 λ(ti|Zi) P tk≥tiλ(ti|Zk) = m Y i=1 exp(β′Zi) P tk≥tiexp(β ′ Zk) , (4)

y es tratada como la verosimilitud usual. Notar que el numerador depende únicamente de la informaci ón del individuo quien experiment ó el evento, mientras que el denominador utiliza informaci ón sobre todos los individuos quienes no han experimentado el evento (incluyendo algunos individuos quienes ser´ıan luego censurados).

Entonces, el estimador de MVP de β0, ˆβ, es soluci ´on de la siguiente ecuaci ´on de score

UP(β) := m X i=1 ( Zi− P tk≥tiZkexp(β ′_Z k) P tk≥tiexp(β ′ Zk) ) = 0, (5)

que, bajo ciertas condiciones de regularidad, es asint ´oticamente normal.

Andersen y Gill (1982) extienden el modelo de Cox para eventos recurrentes y para variables explicati-vas externas que dependen del tiempo. Consideran el proceso de conteo multivariado dem componentes N = (N1, . . . , Nm) de la vida de m individuos, donde Ni es la cantidad de eventos observados en la vida

deli-´esimo individuo, i = 1 : m sobre el intervalo [0, τ ]. Suponen que Ni(τ ) es casi seguro finito. Adem ´as,

asumen queN tiene un proceso de intensidad aleatorio λ = (λ1, . . . , λm) tal que

λi(t|Zi) = Yi(t)λ0(t) exp(β′0Zi(t)), (6)

dondeYi(t) es el proceso {0, 1} continuo a derecha, que indica con 1 cuando el i−´esimo individuo est ´a bajo

observaci ´on en el tiempo t, y que el vector de dimensi ´on p de procesos de variables independientes Zi =

(Zi1, . . . , Zip) es predecible y localmente acotado.

Observar que la representaci ´on del funcional del score UP(β), bajo el modelo (6), es:

UP(β) := m X i=1 Z τ 0 Zi h dNi(t) − Yi(t)dΛi(t; Zi) i , (7) dondeΛi(t; Zi) = Rt 0λi(t|Zi).

(4)

2 MODELO DE RIESGO MULTIPLICATIVO 4 El estimador de MVP de β0en (6), ˆβ, que es consistente, se define como la soluci ´on de la ecuaci ´on

UAG(β) = m X i=1 Z τ 0 Zi(s) dNi(s) − Z τ 0 Pm

i=1Zi(s)Yi(s) exp(β′Zi(s))

Pm

i=1Yi(s) exp(β′Zi(s))

d ¯N (s) = 0, (8)

donde ¯N = Pm

j=1Nj. Adem ´as, bajo ciertas condiciones de regularidad y utilizando resultados de

martin-galas locales, obtienen la normalidad asint ´otica del estimador.

Pero el estimador de MVP, ˆβ, pierde eficiencia con respecto al estimador de m áxima verosimilitud cuando β0 se aleja del cero (Ver la Figura 1), y tiene funci ón de influencia no acotada (Reid y Crépeau,

1985) haci´endose sensible a observaciones extremas.

Figura 1: Gr áfica de la eficiencia relativa asint ótica del estimador de MVP comparada con el estimador de m áxima verosimilitud, para un problema de dos muestra (Z = 0, 1), con ausencia de censura y λ(t|Z) = λ0exp(β0Z) (Efron (1977)), donde p representa la proporci ón de 1 en la muestra.

Uno de los autores que buscaron estimadores robustos a partir del estimador de MVP, fue Sasieni (1993A). Él propone una versi ón pesada del estimador MVP, es decir, le asigna m ás importancia a lo que sucede en algunos tiempos de fallas que en otros a través de una funci ón de peso, w(t, Pm), donde

Pm es la medida emp´ırica del tiempo de falla con masa 1/m en cada punto, tal que w(·, Pm) : [0, ∞) →

[0, ∞) sea predecible, localmente acotada y tal que exista una funci´on w medible tal que kwk∞ < ∞ y

kw(·, Pm) − w(·)k∞ Prob

→ 0. Formalmente, Sasieni propone un estimador de β pesado, ˆβ_w que es soluci ´on de U_S(β; w) := m X i=1 ∆iw(ti, Pm) ( Z_i(ti) − Pm j=1Yj(ti)Zj(ti) exp(β′Zj(ti)) Pm j=1Yj(ti) exp(β′Zj(ti)) ) = 0 . (9) ´

Este resulta ser, bajo ciertas condiciones, consistente de tasa√m y asint ´oticamente normal.

Sasieni propuso que w(t, Pm) = ˆS(t, ˆβ), donde ˆS(t, 0) es el estimador de Kaplan-Meier (1958) de la

funci ón de supervivencia marginal (es decir, ignorando las variables explicativas) y a éste estimador, asumiendo que las covariates son acotadas, lo llama el estimador de Wilcoxon (por la analog´ıa que tiene con respecto al test de Wilcoxon). Con esta funci ón de peso, Sasieni logra dar menos peso a observaciones posteriores y se convertir á m ás eficiente en censuras crecientes. Pero el estimador de Kaplan-Meier no

(5)

2 MODELO DE RIESGO MULTIPLICATIVO 5 es robusto (Reid (1981) analiz ó como cambia la funci ón de influencia del estimador de MVP al agregar una observaci ón), es decir va a ser sensible a observaciones at´ıpicas. Adem ás, al utilizar un estimador preliminar de β0la funci ón de pesow(t, Pm) dejar á de ser predecible.

Cuando el modelo de Cox se verifica, el estimador de MVP (cuandow = 1) es eficiente (tiene m´ınima varianza en la clase de estimadores pesados) (Begun, Hall, Huang y Wellner, (1983), Efron (1977)) y adem ás tiene funci ón de influencia no acotada. Cuando la funci ón de peso no depende de la muestra y w 6= 1, y cuando depende de la muestra (w(t, Pm)) el estimador tiene la misma eficiencia asint ótica

con respecto al estimador MVP de Cox pero ambos son menos eficientes que éste. Sasieni calcul ó la eficiencia relativa asint ótica (ARE) de su estimador con funci ón de pesow(t, Pm) con respecto al estimador

de m áxima verosimilitud parcial de Cox para el caso de que Z no dependa del tiempo. Realiz ó una simulaci ón para ver el desempe ño de la ARE del estimador de Wilcoxon frente a censuras crecientes. Lo que se observa en el gr áfico del ARE en funci ón de β0es que en todos los casos la funci ón crece a medida

que β0se aleja del cero y adem ´as va aumentando su eficiencia a medida que se aumenta el porcentaje de

censura. Por ejemplo, si no hay censura el ARE va de 0.75 a 0.80 y cuando la censura es del 10% va de 0.80 a 0.90.

En cuanto a la funci ón de influencia, Sasieni nota que el problema de que el estimador de MVP tenga funci ón de influencia alta (no acotada asint óticamente) es por dos potenciales razones: una, por los valores de Z “extremos” y, la otra, por los individuos que m ás sobrevivieron, es decir, por los valores grandes de T . El primero no se soluciona sin importa la funci ón de peso w(t, Pm) que se seleccione, ya

que ésta s ólo depende de los tiempos de falla y de su distribuci ón emp´ırica. Entonces asumiendo que Z est á acotado, cuando el estimador es el de Wilcoxon se obtiene un estimador con funci ón de influencia acotada sin importar de que Pm sea o no un miembro de Cox (P es un miembro del modelo de Cox con

par ´ametro β0, y lo denotamos P∈ P(β0), si existen Tu,Tcindependientes condicionalmente dado Z tal que

T = m´ın(Tu_{, T}c_{), ∆ = I(T}u_{≤ T}c_{) y el riesgo proporcional de T}u_{dado Z en} _{t es λ(t|Z) = λ}

0(t) exp(β′0Z(t))).

Por lo tanto, para el método propuesto por Sasieni la selecci ón de la funci ón de pesow(t, Pm) a menudo

ser ´a una compensaci ´on entre eficiencia y robustez.

Por otro lado, en otro trabajo de Sasieni (1993B) amplia la familia de los estimadores anteriormente ex-puestas permitiendo funciones de pesos que no s ólo dependan de los tiempos de falla y de su distribuci ón emp´ırica sino también que dependan de Z. Esta familia m ás grande de estimadores la llam ó estimadores

de claseK y los defini ´o de la siguiente manera: Sea K una funci ´on medible de Rp_{× R}

+× Q → Rp, donde Q

es una extensi ´on de P(β0), que lo contiene y a todas las posibles distribuciones emp´ıricas Pm, entonces,

bajo ciertas condiciones, el estimador de claseK, ˆβ_K, es soluci ´on de:

m X i=1 K(Zi, Ti, Pm)Zi− Pm k=1K(Zk, Ti, Pm)Yk(Ti)Zkexp(β′Zk) Pm k=1Yk(Ti) exp(β′Zk) = 0. (10)

El estimador ˆβ_K es consistente de tasa√m y asint ´oticamente normal.

Observaci ´on 1. Esta clase de estimadores fueron primero propuestos por Ritov y Wellner (1988) pero

utili-zaron funciones que solo depend´ıan de Z yT .

Otro trabajo en el que se modific ó la ecuaci ón de estimaci ón de score del riesgo proporcional (5) para obtener un estimador robusto, fue el de Bednarski (1993). Las modificaciones no solo producen estimadores consistentes y asint óticamente normales de β0 para el modelo de riesgo proporcional sino

que tambi´en para peque ˜nos entornos del modelo, definidos como {G : kG − F k∞≤ ǫ/√m}, donde F es la

funci ón de distribuci ón acumulada “verdadera” de(T, Z, τ ) del modelo de Cox. La herramienta importante que utiliza Bednarski es la diferenciabilidad Fréchet, con la que logra una funci ón de influencia acotada y la norma del supremo del funcional del estimador conduce a un punto de ruptura no nulo.

(6)

2 MODELO DE RIESGO MULTIPLICATIVO 6 funci ´on de pesoA(t, z) (suave no negativa que vale 0 para valores grandes de t y de β′z) como sigue:

UB(β; A) := n X j=1 A(tj, Z(j)) " Z(j)− P tk≥tjA(tj, Zk)Zkexp(β ′_Z k) P tk≥tjA(tj, Zk) exp(β ′_Z k) # ∆j= 0, (11)

donde ∆j := I(Tj ≤ τ). El efecto de la funci´on A(t, z) que est ´a a la izquierda es para pesar hacia abajo

las observaciones no censuradas con valores grandes det exp(β′z) y en las sumas del cociente, A(t, z) es calculada para las observaciones artificiales combinando tiempotj con variables explicativas Zk (tk≥ tj),

as´ı pesa hacia abajo todas las observaciones con valores relativamente grande de β′zentre todas aquellas contk≥ tj. Con esta “doble poda” logra dar consistencia al estimador.

Por ejemplo, Bednarski (1993), Minder y Bednarski (1996), Bednarski y Nowak (2003), Bednarski y Mocarska (2006) y Bednarski (2007) proponen las siguientes funcionesA(t, z):

M − m´ın M, t exp(β′z), (12) M − m´ın M, Λ(t) exp(β′_z), exp −Λ(t) exp(β ′ z) αM ,

dondeM es una constante seleccionada apropiadamente y α es un factor de escala. Con estas funciones de peso, el estimador se calcula iterativamente y se estabiliza despu´es de la tercera o cuarta iteraci ´on. Es decir, por ejemplo, primero se toma a β= β1como un estimador preliminar (que puede ser el de MVP de

Cox), se evaluaM como un percentil (el 80 o 90 %) de la muestra T1exp(β′1Z1), T2exp(β′1Z2), . . . , Tnexp(β′1Zn)

y luego tomando A(t, z), como en (12), se calcula un nuevo estimador β2utilizando (11). ´Esto se repite 2

veces y se considera a β4 como el estimador robusto final.

Por otro lado, cuando los datos provienen de un evento recurrente es usual modelarlos con intervalos de tiempo entre sus recurrencias. Es decir, seanTi1< . . . < Tinilos tiempos continuos de fallas observados

dondeni:= Ni(Ci) =Pj≥1∆ij (con ∆ij := I(Tij ≤ Ci)), es el n ´umero de fallas del individuoi en el intervalo

de tiempo [0, Ci], donde Ci es el tiempo de censura del individuo i (con i = 1 : m). Luego se definen

Xij := Ti(j)− Ti(j−1) como los tiempos de espera entre arribos o intervalos de tiempo entre el (j − 1) y

j−´esima ocurrencia para el individuo i, y j = 1 : ni+ 1, donde Ti0:= 0 y Ti,ni+1:= Ci.

Dentro de este marco, Huang y Chen (2003) desarrollan un método que, si bien no es robusto, lo desctacamos por ser una buena técnica para extender cualquier método para eventos simples a eventos recurrentes y es utilizado por varios autores. Su trabajo se focaliza sobre el desarrollo de un modelo de riesgo multiplicativo marginal para el tiempo entre las ocurrencias de un evento recurrente, en el hecho de que la correlaci ón entre individuos puede no ser totalmente explicada por las covariates observadas. Ellos trabajan con Z independiente del tiempo y asumen que:

1. cada proceso del evento recurrente es un proceso de renovaci ´on, 2. el modelo de la funci ´on de intensidad es de la forma (2), y

3. dado Z, el intervalo de tiempo es independiente del tiempo de censura.

Ellos argumentan (al igual que el trabajo de Wang y Chang (1999) en el que estiman la funci ´on de supervivencia marginal de los tiempos entre dos eventos sucesivos) que las suposiciones 1 y 3 implican que, para el individuo i y, dado ni y Xi,ni+1, los intervalos de tiempo observados completos, Xij (j =

1 : ni), est án idénticamente distribuidos. Ya que el primer intervalo de tiempo est á sujeto a la censura

independiente, la intercambiabilidad de los intervalos de tiempo observados completos sugiere que un subconjunto de los datos observados puede ser tratado como datos observados de supervivencia en clases; sin embargo, aparentemente el tama ˜no de la clase es informativo. Espec´ıficamente, parani> 0 remueven

los intervalos censurado del conjunto de intervalosXij, es decir, s ´olo tienen en cuenta los intervalos Xij

conj = 1 : n∗

(7)

3 MODELO DE TIEMPO DE FALLA ACELERADO 7 Adem ás, las suposiciones 2 y 3 determinan que el procedimiento de regresi ón de Cox est ándar puede ser aplicado a los datos del primer intervalo de tiempo, o sea, sobre el conjunto de datos{Xi1, δi, Zi}i=1:m,

dondeδi := I(ni > 0). Entonces, para estos datos, la representaci ´on del funcional de la funci ´on de score

parcial normalizada dada por Huang y Wang (2000) (que proponen un método de estimaci ón consistente para el modelo de riesgo multiplicativo bajo un modelo de medici ón de error aditivo para las covariates para eventos simples) es:

UHW(β) := Z τ 0    d ˆEiZiδiI(Xi1≤ s) − ˆ Ei h Ziexp(β′Zi) ˜Yi1(s) i ˆ Ei h exp(β′_Z i) ˜Yi1(s) i d ˆEiδiI(Xi1≤ s)    , (13)

donde ˜Yi1(s) := I(Xi1 ≥ s), ˆEi representa el promedio emp´ırico sobre i = 1 : m y τ es una constante

preestablecida tal que Prob(X(1) ≥ τ) > 0 (en la pr ´actica τ es usualmente tomado como el tiempo de

seguimiento m ´as largo).

Como se coment ´o antes, el primer intervalo de tiempo de cada individuo puede ser reemplazado por una selecci ´on aleatoria de la misma clase. Es decir, podemos generar Qm

i=1n ∗

i conjuntos diferentes de

intervalos para reemplazarlo a {Xi1}i=1:m. Si bien con ésto se lograr á una estimaci ón m ás eficiente, no

obstante es una aproximaci ´on muy costosa computacionalmente. Entonces, Huang y Chen, proponen estimar β utilizando la siguiente funci ´on de score:

UHCh(β) := Z τ 0    d ˆK1(s) − ˆ Eij h Z_iexp(β′Z_i) ˜Yij(s) i ˆ Eij h exp(β′Zi) ˜Yij(s) i d ˆK0(s)    , (14)

donde ˜Yij(s) := I(Xij≥ s), ˆK0(s) = Êij[δiI(Xij ≤ s)], ˆK1(s) = Êij[ZiδiI(Xij ≤ s)], Êij := ÊiEˆjy Êjrepresenta

el promedio emp´ırico sobrej = 1 : n∗

i. Con ´esto logran un estimador consistente, asint ´oticamente normal

y m ´as eficiente que el que s ´olo utiliza el primer intervalo.

Nosotros hemos realizado una simulaci ón para comparar el estimador de Huang y Chen utilizando s ólo el primer intervalo de tiempo con el que utiliza todos los intervalos de tiempo. Lo que obtuvimos, en varios casos analizados, fue que al utilizar todos los intervalos de tiempo observados no censurados se logra una mejor estimaci ón que la que s ólo utiliza el primer intervalo de tiempo observado (en los casos analizados obtuvimos una diferencia entre 0.48 y 0.93 en las estimaciones).

3. Modelo de tiempo de falla acelerado

En an álisis de supervivencia los modelos de regresi ón de tiempo de falla acelerado son una útil alterna-tiva al modelo de riesgo multiplicativo en algunos contextos. Ellos son ejemplos de modelos transformados del tiempo que puede ser utilizado tanto en el marco de eventos simples como en eventos recurrentes. Es-te modelo es un caso particular del modelo de tiempos transformados ya que el efecto de Z es transformar la escala del tiempot a exp(β′0Z)t. Adem ás, este modelo es log-lineal para T , ya que

log T = β′0Z+ U, (15)

dondeU es la variable error. Luego T = exp(β′0Z) ˜T donde ˜T = eU > 0 tienen funci ´on de riesgo λ0(˜t), que es

independiente de β0. Entonces la funci ´on de riesgo deT es de la forma

λ(t|Z) = λ0 t exp(β′0Z(t)) exp(β ′

0Z(t)). (16)

La ecuaci ón (15) permite aplicar procedimientos robustos de modelos de regresi ón de falla acelerado para hallar los estimadores. Por eso, destacamos el reciente trabajo de Locatelli, Marazzi y Yohai (2011). Ellos proponen estimadores robustos para modelo de tiempo de falla acelerado con distribuci ón de error asimétrica (o simétrica) y observaciones censuradas. Asumen que el modelo de error pertenece a una

(8)

3 MODELO DE TIEMPO DE FALLA ACELERADO 8 familia de distribuci ón log posici ón escala. O sea, consideran un modelo de tiempo de falla acelerado, m ás general que el (15):

˜

Ti= β′0Zi+ σ0Ui, i = 1 : m, (17)

donde ˜Ti es el tiempo de falla sobre la escala de logaritmo. Los erroresUi son iid e independientes de la

covariate Zi, β0 es el vector de coeficientes desconocidos y σ0 es un par ´ametro de escala desconocido.

Adem ´as, la distribuci ´on de los Zi es desconocida. Por otro lado, consideran censuras simples, Ti∗ =

m´ın( ˜Ti, Ci) donde Ci son tiempos de censura iid e independientes de los ˜Ti. Entonces son observadas

(T∗

i, Zi, ∆i), donde ∆i vale 1 si el tiempo observado no fue censurado y vale 0 en caso contrario.

En el modelo (17) se desea estimar β0 yσ0. Pero comoσ0 es necesario para el c ´alculo de la esperanza

condicional (una herramienta utilizada para la estimaci ón, comportamiento asint ótico y punto de ruptura) de la respuestaT = exp( ˜T ), Locatelli, Marazzi y Yohai no lo tratan como un par ámetro auxiliar, como es lo usual. Luego, el procedimiento de estimaci ón propuesto consta de tres etapas:

ETAPA 1. Se calcula unS-estimador inicial, (˜β_m, ˜σm), con alto punto de ruptura y consistente.

ETAPA 2. El estimador “inicial” (˜β_m, ˜σm) quiz ´as sea ineficiente. Entonces, para obtener un estimador

“final” con el mismo punto de ruptura que ´este pero que sea altamente eficiente hay que rechazar los outliers. Es decir, se rechazan las observaciones cuya verosimilitudes bajo el modelo inicial son m ´as chicas que un valor de cota dado,ϑm.

ETAPA 3. Se calcula el estimador final (ˆβ_n, ˆσn), de m ´axima verosimilitud pesado cuya funci ´on de peso

depende de ϑm. Este estimador es una extensi ´on natural del estimador de m ´axima verosimilitud

truncado para observaciones no censuradas propuesto por Marazzi y Yohai (2003).

Con este procedimiento obtienen estimadores con eficiencia completa con respecto al de MV y mantienen el punto de ruptura del estimador inicial, logrando as´ı un estimador robusto con respecto a outliers en la respuesta y en puntos con alta palanca.

En los estudios sobre eventos recurrentes a menudo el interés se centra en modelar la distribuci ón del tiempo de falla entre la recurrencia de un evento (o intervalo de tiempo) o en la distribuci ón de los tiempo de cada falla. Adem ás existen procedimientos de inferencia basados en métodos marginales y métodos basados en intensidad. Los métodos marginales habitualmente se focalizan sobre la funci ón de tasa acumulada o funci ón de la media y no hacen condici ón sobre la historia del evento completo. Un ejemplo de ésto lo veremos en el trabajo que realizan Lin, Wei y Ying (1998). En cambio, los métodos de intensidad especifican como la probabilidad de recurrencia posterior depender á de la historia del evento pasado. Aqu´ı destacaremos el trabajo de Strawderman (2005).

Lin, Wei y Ying (1998) trabajan con los tiempos de falla, es decir, para i = 1 : m y j = 1, . . ., sea Tij el

j−´esimo tiempo de falla del evento para el sujeto i−´esimo. Asumen que los sujetos son independientes, pero no se impone ninguna estructura de dependencia sobre los tiempos de recurrencia del mismo sujeto. Definen a N∗

i(t) como el n ´umero de fallas que han ocurrido sobre el sujeto i en el tiempo t en ausencia

de censura, esto es N∗ i(t) =

P

k≥1I(Tik≤ t). Adem ´as suponen que la funci´on media del proceso de conteo

N∗

i(t) asociado al vector de variable explicativa Zi∈ Rp, que la suponen acotada, es de la forma:

E Ni∗(t)|Zi = µ0 exp(β′0Zi) t, (18)

donde β0 es un p−vector de par ámetros de regresión desconocido, y µ0 es una funci ón continua no

especificada. De acuerdo a este modelo, el n ´umero esperado de eventos en el tiempo t bajo Zi = z es

igual al n ´umero esperado de eventos en el tiempot exp(β′0z) bajo Zi= 0. En otras palabras, el conjunto de

(9)

3 MODELO DE TIEMPO DE FALLA ACELERADO 9 la escala del tiempo en aquellas ocurrencias de eventos por un factor multiplicativo deexp(β′0Zi) relativo

a aquel de un vector de covariate cero.

Sea Ci el tiempo de censura del sujeto i, que lo asumen independiente de Tik condicionado sobre

Zi. Luego el proceso de conteo Ni(t) de los tiempos de fallas censurados, se pueden expresar como

Ni(t) =Pk≥1I(Tik≤ t ∧ Ci).

Motivados por la funci ´on de score de la verosimilitud parcial para el modelo de proceso de Poisson de intensidad proporcional (Andersen y Gill, 1982) y las funciones de estimaci ´on de rango pesado para el modelo log-lineal (15) (Prentice, 1978; Tsiatis, 1990; Wei, Ying y Ling, 1990), proponen la siguiente clase de funciones de estimaciones para β0:

U(β) := m X i=1 Z ∞ 0 Q(t; β)Zi− ¯Z(t; β) dNi t exp(−β′Zi), (19)

dondeQ(t; β) tiene variaci ´on acotada y converge casi seguro a una funci ´on continua y ¯ Z(t; β) = Pm j=1I(t exp(−β ′ Zj) ≤ Cj)Zj Pm j=1I(t exp(−β ′ Zj) ≤ Cj) .

Ellos se refieren a U(β) como la funci ón de estimaci ón log-rango si Q ≡ 1 y como la función de estimación de Gehan si Q(t; β) = Pm

i=1I(t exp(−β ′

Zi) ≤ Ci)/m. Para la primer funci ´on de peso, como en el caso de

estimaci ón de rango para el modelo log-lineal (15), la funci ón de estimaci ón U(β) es una funci ón constante a trozos de β, entonces definen el estimador ˆβcomo un cero de U(β) o como un m´ınimo de kU (β)k2. Para

la funci ´on de estimaci ´on de Gehan, (19) se convierte en U(β) = 1 m m X i=1 m X j=1 X k≥1 ∆ik(Zi− Zj) I log τ log Tik≥ β′(Zi− Zj), (20)

y as´ı obtienen ˆβminimizando la funci ´on: 1 m m X i=1 m X j=1 X k≥1

∆ikm´ax log τ − log Tik− β′(Zi− Zj), 0 .

El estimador resultante puede ser ligeramente diferente al m´ınimo de kU (β)k2, pero son asint

´otica-mente equivalentes.

El estimador ˆβ, soluci ón de U(β) = 0, resulta ser consistente y asint óticamente normal. Pero, resolver la ecuaci ón de estimaci ón U(β) = 0 puede en general ser arduo cuando p (la dimensi ón de Z) es grande. Entonces, proponen ˆβ⋆como soluci ón de

U(β) = m X i=1 Di(ˆβ)Gi, donde Di(β) := Z ∞ 0 Q(t; β)Zi− ¯Z(t; β) d h Ni t exp(−β′Zi) − Z t 0 I(t exp(−β ′ Zi) ≤ Ci)dˆµ0(s; β) i , con ˆ µ0(t; β) = m X i=1 Z t 0 dNi t exp(−β′Zi) Pm j=1I(t exp(−β ′_Z j) ≤ Cj)

y(G1, · · · , Gn) son v.a. normales est ´andar independientes. Tambi´en se puede obtener ˆβ ⋆

como soluci ´on de U(β) = G, donde G es normal con media cero y matriz de covarianzaPm

i=1Di(ˆβ)Di(ˆβ)′. Luego√m(ˆβ− ˆβ ⋆

) tiene la misma distribuci ´on l´ımite que √m(ˆβ_{− β}₀) y adem ´as la matriz de covarianza de ˆβ puede ser estimada por la matriz de covarianza emp´ırica de ˆβ⋆.

Cuando el modelo se ajusta razonablemente a los datos, Lin, Wei y Ying proponen que el estimador de la ecuaci ón de estimaci ón de Gehan (soluci ón de U(β) = 0 o U (β) = G, que se puede resolver de manera

(10)

3 MODELO DE TIEMPO DE FALLA ACELERADO 10 eficiente), puede ser utilizado como un estimador inicial para estimaciones con funciones de peso m ás generales, ya que la soluci ón de la ecuaci ón de estimaci ón de Gehan ser á similar a las soluciones de la ecuaci ón de estimaci ón con pesos m ás generales. Adem ás, para la mayor´ıa de los efectos pr ácticos, es suficiente hacer inferencias basadas sobre la estimaci ón de Gehan.

El trabajo de Strawderman (2005) desarrolla un nuevo modelo semiparamétrico para el efecto de las variables explicativas, independientes del tiempo, sobre la intensidad condicional de un proceso de conteo de evento recurrente. Su modelo es una extensi ón del modelo del tiempo de falla acelerado para datos de supervivencia univariado, intervalos de tiempo entre eventos, y la estimaci ón del par ámetro de regresi ón esta motivada por las consideraciones de eficiencia semiparamétricas.

Primero considera un sujeto con un vector de covariate Z de dimensi ´on p independiente del tiempo, que experimenta el evento recurrente en los tiempos 0 =: T0 < T1 < T2 < . . .. Define el j-´esimo intervalo

de tiempo como Xj = Tj− Tj−1,j ≥ 1. Sean V1,V2,. . . variables aleatorias iid con funci ´on de distribuci ´on

F0, tal queF0(t) =R₀tf0(s)ds donde f0tiene primer derivada continua y segunda derivada acotada. Asume

que, dado Z, sus intervalos de tiempos, X1,X2,. . . son variables aleatorias independientes donde

Xj= Vjexp(−β′0Z),

siendo β0el vector de par ´ametro de regresi ´on. Notar que Z acelera o desacelera las intervalos de tiempo

Vj como sucede con los modelos de tiempos de falla acelerado.

Luego la funci ´on de riesgo deXj, dado Z es

λ0 x exp(β′0Z) exp(β′0Z),

donde λ0 es la funci ´on de riesgo asociada a F0. Entonces, en ausencia de censura y dado Z, el proceso

N (t) := m´ax{n :Pn

j=1Xj≤ t} es un proceso de renovaci´on.

Ahora suponem sujetos independientes, donde cada uno es observado en el intervalo de tiempo finito [0, Ci]. Entonces los datos observados son {Ni(u ∧ Ci), ∆i(u), Zi, u ≥ 0} para i = 1 : m, donde ∆i(u) = I(u ≤

Ci). Adem ´as asumen que Z1es casi seguro acotado y E[(N1(C1))6+ǫ] < ∞ para alg ´un ǫ > 0.

El trabajo de Strawderman fue motivado por los trabajos de Prentice (1978) (quien sugiri ´o estimar β0

del modelo (16) semiparamétrico invirtiendo una clase de estad´ısticos de rango lineal pesado), de Tsiatis (1990) (quien estableci ó las propiedades asint óticas de la clase de estimadores porpuesto por Prentice) y de Ritov (1990) (quien estableci ó una correspondencia directa entre las funciones estimadas por Prentice y Tsiatis y las basadas sobre consideraciones de eficiencia semiparamétrica para modelos de regresi ón lineal ccensurados). Él propone la clase pesada de funciones de estimaci ón, mediante la siguiente funci ón de score: ¯ SW(β) := 1 m m X i=1 ni X j=1 W ( ˜Xij(β)|β) " Zi− Pm k=1ZkPnr=1k+1I˜kr( ˜Xij|β) Pm k=1 Pnk+1 r=1 I˜kr( ˜Xij|β) # , (21)

donde ˜Xij(β) = Xijexp(β′Zi) para j = 1 : ni+ 1, ni= Ni(Ci), ˜Ikr(t|β) := I( ˜Xkr(β) ≥ t) y W (t|β) con t ∈ [0, ¯τ]

(τ satisface que ´ınf{t ∈ [0, ¯τ] : E(¯ Pni+1

j=1 I˜kr(t|β))} > 0) y β en alg ´un entorno de β0, es de variaci ´on acotada

y existe una funci ´on determin´ıstica continua y acotada w(t|β) tal que |W (t|β) − w(t|β0)| converge a 0

uniformemente en probabilidad.

Como (21) es una funci ´on de estimaci ´on basada en rango, el estimador ˆβpuede ser definido como un cero de ¯SW(β) o un m´ınimo de k ¯SW(β)k2. Sin embargo, puede existir varios m´ınimos porque ¯SW(β) no

es necesariamente mon ´otona. Pero, si W (u|β) =Pm

i=1

Pni+1

j=1 I˜ij(u|β)/m (denominado peso de Gehan), ´esta

dificultad desaparece. Y en este caso, (21) se reduce a ¯ SG(β) := 1 m2 m X i=1 ni X j=1 m X k=1 (Zi− Zk) nk+1 X r=1 ˜ Ikr( ˜Xij|β), (22)

(11)

4 MODELO ADITIVO: 11 que es el gradiente de la funci ´on objetivo convexa

LG(β) := 1 m2 m X i=1 ni X j=1 m X k=1 nk+1 X r=1

m´axn log ˜Xkr(β) − log ˜Xij(β), 0

o

, (23)

Los minimizadores deLG(β) y k ¯SG(β)k son asint´oticamente equivalentes (Fygenson y Ritov, 1994). Luego

Strawderman toma ˆβ_G= arg m´ın LG(β) y resulta ser consistente de tasa√m y asint ´oticamente normal.

Para este último estimador Strawderman comenta que “notablemente no se asume que el intervalo de tiempo sea acotado, es una útil consecuencia de la convexidad asociada con la funci ón de peso de Gehan”. Adem ás, da un algoritmo para calcular ˆβ_G y ˆΓG, un estimador consistente de la corvarianza de

√_m(ˆ_β

G− β0).

Para pesos generales, Strawderman propone un estimador ˆβ_W de un paso a partir del ˆβ_G, que tambi´en resulta ser consistente de tasa√m y asint ´oticamente normal.

4. Modelo aditivo:

Por ´ultimo, veremos los resultados estad´ısticos del modelo de riesgo aditivo para la funci ´on de inten-sidad que es de la forma:

λ(t|Z) = λ0(t) + β′0Z(t) (24)

donde β0 es el vector de par ámetro de regresi ón yλ0(t) = λ(t|Z = 0) es la función baseline, desconocida,

arbitraria y no negativa en funci ón del tiempo. Éste modelo propuesto por Lin y Ying (1994) es una alternativa al modelo de Aalen (1980) en el cual el par ámetro de regresi ón depende de los tiempos de falla, es decir, la funci ón de intensidad es de la forma

λ0(t) + β0(t)′Z(t) = (λ0(t), β0(t))′(1, Z(t)).

Primero plantearemos aqu´ı las distintas funciones de verosimilitud para el modelo aditivo s ´olo para el caso de eventos simples.

La funci ´on de verosimilitud condicional sobre Hi(τ ) de m individuos con funci ´on de intensidad (24),

dondet1≤ . . . ≤ tmson los tiempos de falla observados en[0, τ ] y Zi corresponde al sujetoi, es

LC(β, λ0) = m Y j=1 λ(tj|Zj) exp − Z τ 0 λ(u|Z j) du = = m Y j=1 λ0(tj) + β′0Zj(tj) exp − Z τ 0 λ0(u) + β′0Zj(u) du = = m Y j=1 λ0(tj) + β′0Zj(tj) exp −Λ0(τ ) + β′0Z∗j(τ ) , (25) donde Z∗j(t) = Rt

0Zj(u) du y Λ0(t) =R₀tλ0(u) du. Luego,

lC(β, λ0) = log LC(β, λ0) = m X j=1 n logλ0(tj) + β′0Zj(tj) − Λ0(τ ) + β′0Z ∗ j(τ ) o , (26) entonces ∂ ∂β0 lC(β, λ0) = m X j=1 _Z j(tj) λ0(tj) + β′0Zj(tj)− Z ∗ j(τ ) . (27)

Observemos que (27) depende del par ámetro de regresi ón β0 y de la funci ónλ0(·), lo cual complicar´ıa

(12)

4 MODELO ADITIVO: 12 Por otra parte, la funci ´on de verosimilitud parcial es

LP(β, λ0) = m Y j=1 λ(tj|Zj) P k∈Rjλ(tj|Zk) = m Y j=1 λ0(tj) + β′0Zj(tj) P k∈Rjλ0(tj) + β ′ 0Zk(tj) , (28)

dondeRj es el conjunto de riesgo en el tiempotj. Entonces

lP(β, λ0) = log LP(β, λ0) = m X j=1    logλ0(tj) + β′0Zj(tj) − log   X k∈Rj λ0(tj) + β′0Zk(tj)      = = m X j=1    logλ0(tj) + β′0Zj(tj) − log  rjλ0(tj) + β′0 X k∈Rj Z_k(tj)      = = m X j=1 n logλ0(tj) + β′0Zj(tj) − log rjλ0(tj) + β′0SZj o , (29)

donderj es el cardinal del conjuntoRj ySZj:=Pk∈RjZk(tj). Por lo tanto,

∂ ∂β0 lp(β, λ0) = m X j=1 Zj(tj) λ0(tj) + β′0Zj(tj)− SZj rjλ0(tj) + β′0SZj . (30)

Notar que la funci ´on de verosimilitud parcial (28), para este modelo no puede aplicarse como se hizo para el caso del modelo de riesgo multiplicativo (2), pues en este caso no se eliminar´ıa λ0(t) para la

estimaci ´on de β0, (ver la funci ´on de score (30)).

Sin embargo, hay varios autores que han podido estimar β0 sin la necesidad de recurrir a las cl ´asicas

funciones de verosimilitud condicional y/o parcial antes descritas. Entre estos autores hemos conside-rado el trabajo de Lin y Ying (1994) en el cual imitaron la caracter´ıstica de martingala de la funci ´on de score de la verosimilitud parcial del modelo multiplicativo del par ´ametro β0 logrando construir una

sim-ple funci ón de estimaci ón permitiendo expresar en forma expl´ıcita al estimador ˆβ₀ (ésto no sucede en los modelos multiplicativo y de falla acelerado).

Formalmente, Lin y Ying (1994) consideranm sujetos independientes y recogen en el proceso de conteo del sujetoi, {Ni(t); t ≥ 0} el n ´umero de eventos observados hasta el tiempo t. Bajo el modelo (24), la funci´on

de intensidad paraNi(t) esta dada por

Yi(t) dΛ(t; Zi) = Yi(t)dΛ0(t) + β′0Zi(t) dt, (31)

dondeYi(t) indica con 1 si el sujeto i est ´a en riesgo en el tiempo t y en en caso contrario con 0 y Λ0(t) =

Rt

0λ0(u) du. Ellos proponen estimar β0 imitando la funci ´on de score de la verosimilitud parcial del modelo

multiplicativo (7), que bajo (31), es de la forma U(β) = m X i=1 Z ∞ 0 Zi(t) h dNi(t) − Yi(t)dˆΛ0(β, t) + β′Zi(t) dt i , donde ˆΛ0 es el estimador deΛ0del modelo (24) definido como

ˆ

Λ0(ˆβ, t) =

Z t

0

Pm

i=1dNi(u) − Yi(u)ˆβ ′

Zi(u) du

Pm

i=1Yi(u)

, (32)

siendo ˆβun estimador consistente de β0. Luego, U(β) es equivalente a

ULY(β) := m X i=1 Z ∞ 0 Zi(t) − ¯Z(t) dNi(t) − Yi(t)β′Zi(t) dt, (33) donde ¯Z(t) =Pm

j=1Yj(t)Zj(t)/Pmj=1Yj(t). Entonces el estimador queda definido expl´ıcitamente como

ˆ β= m X i=1 Z ∞ 0 Yi(t)Zi(t) − ¯Z(t) ⊗2 dt !−1 _m X i=1 Z ∞ 0 Zi(t) − ¯Z(t) dNi(t) ! (34)

(13)

REFERENCIAS 13 ´

Este estimador resulta ser consistente de tasa√m y asint ´oticamente normal.

Por ´ultimo en el caso de eventos recurrentes destacamos el trabajo de Sun, Park y Sun (2006) en el que ajustan un modelo de riesgo aditivo λ(t|Zi) = λ0(t) + β′0Zi utilizando los intervalos de tiempo entre

las ocurrencias de los tiempo de falla y toman a la covariate independiente del tiempo, adem ´as de asumir que E||Z||2_{< ∞. Ellos extienden la idea de Lin y Ying (1994) a eventos recurrentes aplicando los mismos}

argumentos y suposiciones que realizan Huang y Chen (2003) adem ás de introducirle una funci ón de peso a la funci ón de score de estimaci ón.

Siguiendo los mismos argumentos y las mismas notaciones que utilizamos al describir el trabajo de Huang y Chen (2003), Sun, Park y Sun proponen la ecuaci ´on de estimaci ´on USP S(β) = 0 para estimar el

par ´ametro de regresi ´on β0, donde

USP S(β) := Z τ 0 Q(s) ( d ˆK1(s) − ˆ G1(s) ˆ G0(s) d ˆK0(s) − " ˆ EijZ′iZiI(Xij ≤ s) − ˆ G1(s)′Gˆ1(s) ˆ G0(s) # βds )

siendoQ(s) un proceso de peso (que puede depender de los datos) con variaci ón acotada y que converge casi seguro a una funci ón determin´ıstica uniformemente sobre [0, τ ], ˆG0(t) = Êij[I(Xij ≥ t)] y ˆG1(t) =

ˆ

Eij[ZiI(Xij ≥ t)].

Luego el estimador de β tambi´en se puede expresar de forma expl´ıcita como: ˆ β= ( Z τ 0 Q(s) " ˆ EijZ′iZiI(Xij ≤ s) − ˆ G1(s)′Gˆ1(s) ˆ G0(s) # ds )−1( Z τ 0 Q(s) " d ˆK1(s) − ˆ G1(s) ˆ G0(s) d ˆK0(s) #) , (35)

que es consistente de tasa√m y asint ´oticamente normal.

Ellos, al igual que Huang y Chen, también proponen un estimador que solo utiliza el primer intervalo de tiempo de cada individuo pero es menos eficiente que aquel que utiliza todos los intervalos (al igual que pasa en Huang y Chen). Adem ás comentan que “un problema que necesita ser estudiado a futuro es la selecci ón de un proceso de peso Q(t) que da el estimador m ás eficinete de β0 para una situaci ón

particular”. Para el estudio de simulaci ´on que se realiz ´o, se obtuvieron resultados similares paraQ ≡ 1 y Q(t) =Pm

i=1I(Ci≥ t)/m.

Referencias

[1] Aalen, O. O. (1980). A model for non-parametric regression analysis of counting processes. Lecture Notes on Mathematics Statistics and Probability. Springer-Verlag, New York, pp. 1-25.

[2] Andersen, P. K. and Gill, R. D. (1982). Cox’s regression model for counting processes: a large sample

study. The Annals of Statistics Vol. 10, No. 4, pp. 1110-1120.

[3] Andersen, P. K., Borgan, Gill, R. D. and Keidireg (1993) Statistical models based on counting processes. Springer, New York.

[4] Bednarski, T. (1993). Robust estimation in Cox’s regression model. Scandinavian Journal of Statistics, Vol. 20, pp. 213-225.

[5] Bednarski, T. and Nowak, M. (2003). Robustness and efficiency of Sasieni-type estimators in the Cox

model. Journal of Statistical Planning and Inference, Vol. 115, No. 1, pp. 261-272.

[6] Bednarski, T. and Mocarska, E. (2006). On robust model selection within the Cox model. Ecometrics Journal, Vol. 9, pp. 179-290.

[7] Bednarski, T. (2007). On a robust modification of Breslow’s cumulated hazard estimator. Computational Statistics and Data Analysis, Vol. 52, pp. 234-238.

(14)

REFERENCIAS 14 [8] Begun, J. M., Hall, W. J., Huang, W. M. and Wellner, J. A. (1983). Information and Asymptotic Efficiency

in Paramtric-Nonparametric Models. The Annal of Statistics, Vol. 11, No. 2, pp. 432-452.

[9] Cox, D.R. (1972). Regression Models and Life-Tables (with discussion). Journal of the Royal Statistical Society. Series B (Methodological), Vol. 34, No. 2, pp. 187-220.

[10] Cox, D.R. (1975). Partial Likelihood. Biometrika, Vol. 62, pp. 262-276.

[11] Efron, B. (1977). The efficiency of Cox’s likelihood function for censored data. Journal of the American Statistical Association, Vol. 72, No. 359, pp. 557-565.

[12] Fygenson, M. and Ritov, Y. (1994). Monotone Estimations for Censored Data. The Annals of Statistics, Vol. 22, No. 2, pp. 732-746.

[13] Huang, Y. and Wang, C.Y. (2000). Cox regression with accurate covariates unascertainable: A

nonparametric-correction approach. Journal of the American Statistical Association, Vol. 95, pp. 1209-1219.

[14] Huang, Y. and Chen, Y. Q. (2003). Marginal regression of gaps between recurrent events. Lifetime Data Analysis, Vol. 9, pp. 293-303.

[15] Kalbfleisch, J. D. and Prentice, R. L. (1973) Marginal likelihoods based on Cox’s regression and life

model. Biometrika, Vol. 60, No. 2, pp. 267-278.

[16] Kaplan, E. L. and Meier, P. (1958) Nonparametric estimation from incomplete observations. Journal of the American Statistical Association, Vol. 53, pp. 457-481.

[17] Karlin, S. and Taylor, H. M. (1975). A first course in Stochastic Processes, Academic Press, Inc. Lon-don.

[18] Lin, D. Y. and Ying, Z. (1994). Semiparametric analysis of the additive risk model. Biometrika, Vol. 81, No. 1, pp. 61-71.

[19] Lin, D. Y., Wei, L. J., Yang, I. and Ying, Z. (2000). Semiparametric regression for the mean and rate

functions of recurrent events. Journal of the Royal Statistical Society, Series B, Vol. 62, No. 2, pp. 711-730.

[20] Locatelli, I., Marazzi, A. an Yohai, V. J. (2011). Robust accelerate failure time regression. Computatio-nal Statistics and Data AComputatio-nalysis, Vol. 55, pp. 874-887.

[21] Marazzi, A. and Yohai, V. (2003). Adaptively truncated maximun likelihood regression with asymmetric

errors. Journal of Statistical Planning and Inference, Vol. 122, pp. 271-291.

[22] Minder, C. E. and Bednarski, T. (1996). A robust method for proportional hazards regression. Statistics in Medicine, Vol. 15, pp. 1033-1047.

[23] Prentice, R.L. (1978). Linear rank tests with right censored data. Biometrika, Vol. 65, pp. 167-179. [24] Reid, N. (1981). Influence functions for censored data. The Annals of Statistics, Vol. 9, No. 1, pp.

78-92.

[25] Reid, N. and Crepeau, H. (1985). Influence functions for proportional hazards regression. Biometrika, Vol. 72, No. 1, pp. 1-9.

[26] Ritov, Y. and Wellner, J. A. (1987). Censoring, Martingala and The Cox Model. Technical Report, University of Washington, Department of Statistics, No. 108.

[27] Ritov, Y. (1990). Estimation in a linear regression model with censored data.The Annals of Statistics, Vol. 18, No. 1, pp. 303-328.

(15)

REFERENCIAS 15 [28] Sasieni, P. (1993A). Maximum Weighted Partial Likelihood Estimators for the Cox Model. Journal of

the American Statistical Association, Vol. 88, No. 421, pp. 144-152.

[29] Sasieni, P. (1993B). Some new estimators for Cox reggression. The Annals of Statistics, Vol. 21, No. 4, pp. 1721-1759.

[30] Strawderman, R. L. (2005). The accelerated gap times model. Biometrika, Vol. 92, pp. 647-666. [31] Sun, L. Liu, J. Sun Ji. and Zhang M. (2006). Modeling the subdistribution of a competing risk.

Statis-tica Sinica, Vol. 16, pp. 1367-1385.

[32] Tsiatis, A.A. (1990). Estimating regression parameters using linear rank tests for censored data. The Annals of Statistics, Vol. 18, No. 1, pp. 354-372.

[33] van der Vaart (1998). Asymptotic Statistics. Cambridge University Press, Cambridge.

[34] Wang, M.C. and Chang, S.H. (1999). Nonparametric estimation of a recurrent survival function. Jour-nal of the American Statistical Association, Vol. 94, pp. 146-153.

[35] Wei, L.J., Ying, Z. and Ling, D.Y. (1990). Linear regression analysis of censored survival data based