• No se han encontrado resultados

Revisión de la Estimación Robusta en Modelos de Supervivencia

N/A
N/A
Protected

Academic year: 2021

Share "Revisión de la Estimación Robusta en Modelos de Supervivencia"

Copied!
15
0
0

Texto completo

(1)

1 INTRODUCCI ´ON. 1

Revisi ´on de la Estimaci ´on Robusta en Modelos de

Supervivencia

Enrique E. ´Alvarez y Julieta Ferrario Universidad Nacional de La Plata y CONICET

Resumen

En An ´alisis de Supervivencia se analizan datos referidos al tiempo final de ocurrencia de un evento,T , y asociado a ´este se recogen un vector de variables explicativas independientes o “covariates”, Z. Lo que se desea es modelar la relaci ´on entreT y Z, y el enfoque m ´as com ´un para ´esto se basa sobre la funci ´on de intensidad o tasa de riesgo, definida como:

λ(t) := l´ım

ǫ↓0

ProbT ≤ t + ǫ|T > t

ǫ .

Una generalizaci ´on de los modelos para la funci ´on de riesgo incluye variables regresoras. ´Estos pueden ser formadas de varias maneras y los tres modelos semiparam´etricos m ´as utilizados y a los que hacemos referencia aqu´ı son: de riesgo proporcional, de tiempo de falla acelerado y de riesgo aditivo. El objetivo de esta revisi ´on es recopilar algunas propuestas de robustificaci ´on realizadas hasta el momento para los modelos proporcional, de falla acelerado y aditivo, a fin de proponer una manera natural de abordar la robustificaci ´on del modelo aditivo que, a nuestro entender, no hay nada propuesto hasta el momento para eventos simples.

1.

Introducci ´

on.

Para analizar datos referidos al tiempo final de ocurrencia, T , de un evento, ´este se refiere como tiempo de falla. El evento que se analiza puede ser recurrente o no, y adem ´as su tiempo de falla puede ser causado por varias motivos. Asociado a cada tiempo de falla del evento se recogen un vector de covariates Z que puede incluir variables cuantitativas, cualitativas, que dependan o no del tiempo e incluso pueden ser variables externas (independientes del proceso del evento recurrente) y/o internas (si no es externa).

Para modelar y determinar la distribuci ´on de T , F (t), que la suponemos continua en todo este tra-bajo (es decir, F (t) = Rt

0f (u) du) se definen dos funciones importantes y ´utiles en las aplicaciones de

supervivencia:

la funci ´on de supervivencia:S(t) = 1 − F (t);

la funci ´on de riesgo o funci ´on de intensidad de falla:λ(t) = f (t)/S(t) = −d ln(S(t))/dt.

Nosotros nos focalizamos s ´olo en los modelos basados sobre la funci ´on de intensidad. Esta funci ´on, antes ya definida, tambi´en se la puede definir a trav´es del proceso de conteo de la ocurrencia del evento, {N(t) : t ≥ 0}. La funci´on de intensidad de un individuo para el proceso del evento es definida como

λ(t|H(t)) = l´ım ∆t↓0 P r∆N(t) = 1|H(t) ∆t , (1) donde∆N (t) = N (t + ∆t− ) − N(t−

) y H(t) = {N(s) : 0 ≤ s < t} es la historia de los eventos antes de t del individuo. Esto es,λ(t|H(t))∆t es, para ∆t chico, la probabilidad aproximada de que un evento ocurra en (t, t + ∆t−] dado la historia del proceso antes de t.

Una generalizaci ´on de los modelos para la funci ´on de intensidad del tiempo de fallaT asociada con el vector Z incluye variables regresoras. ´Estas pueden ser formadas de varias maneras y las tres m ´as comunes y las cuales nos referiremos aqu´ı, para cada individuo con covariate Z, son:

(2)

2 MODELO DE RIESGO MULTIPLICATIVO 2 1. Modelo de riesgo proporcional o riesgo multiplicativo de Cox:

λ(t|Z) = λ0(t) exp(β′0Z(t))

2. Modelo de tiempo de falla acelerado:

λ(t|Z) = λ0 t exp(β′0Z(t)) exp(β ′ 0Z(t))

3. Modelo de riesgo aditivo:

λ(t|Z) = λ0(t) + β′0Z(t)

donde β0 ∈ Rp es el vector de par ´ametro de regresi ´on, λ0(t) = λ(t|Z = 0) es la funci´on baseline,

des-conocida, arbitraria y no negativa en funci ´on del tiempo. En los tres casos se desea estimar el vector de par ´ametro de regresi ´on y la funci ´on baseline, λ0(t). Estos modelos son semiparam´etricos ya que se

supone un modelo param´etrico solamente para el efecto de la variable independiente Z, mientras que la funci ´on λ0 es tratada de forma no param´etrica. Observar que la funci ´on de intensidad es modificada por

una proporci ´on (modelo de Cox), una reescalaci ´on (modelo de falla acelerado) y una traslaci ´on (modelo aditivo).

Haremos, para cada uno de los modelos anteriores, una revisi ´on y an ´alisis de algunos trabajos fo-caliz ´andonos s ´olamente sobre los resultados estad´ısticos de la estimaci ´on del par ´ametro de regresi ´on, motivados por la b ´usqueda de estimadores menos sensibles a observaciones extremas y de alta palanca y/o a perturbaciones en la distribuci ´on de F , que se han estudiado hasta el momento en las siguientes secciones.

En la siguiente secci ´on desarrollamos las propuestas de estimaci ´on del par ´ametro para el modelo de riesgo proporcional en el que exponemos, para el caso en que el evento sea simple, el conocido estimador de m ´axima verosimilitud parcial (o estimador de Cox (1972 y 1975)) y dos propuestas robustas, la de Sasieni (1993 A y B) y la de Bednarski (1993). Tambi´en desarrollamos la extensi ´on del estimador de Cox, que realizan Huang y Chen (2003), a eventos recurrentes. En la Secci ´on 3 desarrollamos las propuestas robustas (para eventos simples) de Locatelli, Marazzi y Yohai (2011), y (para eventos recurrentes) de Lin, Wei y Ying (1998) y Strawderman (2005) para el modelo de falla acelerado. Por ´ultimo, en la Secci ´on 4 para la estimaci ´on en el modelo aditivo daremos las ideas de Lin y Ying (1994), para eventos simples y Sun, Park y Sun (2006) para eventos recurrentes.

2.

Modelo de riesgo multiplicativo

En el modelo cl ´asico de riesgo proporcional de Cox (1972), se considera que los datos provienen de un evento simple y donde la variable explicativa es externa e independiente del tiempo. Se consideran m individuos independientes, se observan los tiempos de falla de cada unoti en el intervalo de tiempo finito

[0, τ ] y se define Ni(t) como el n ´umero total de tiempos de falla en(0, t] del evento del individuo i donde

Ni(0) = 0. Luego el proceso estoc ´astico {Ni(t) : t ≥ 0} es un proceso de conteo para la ocurrencia del evento.

Sea Hi(t) = {Ni(s) : 0 ≤ s < t} la historia de los eventos antes de t del individuo i, (i = 1 : m). Entonces

para este modelo, para el tiempo de supervivenciatidel individuoi con vector de variables independientes

Zi∈ Rp, la funci ´on de intensidad es de la forma

λ(ti|Zi) = λ0(ti) exp(β′0Zi) , (2)

donde β0 es unp−vector de coeficientes de regresi´on desconocido y λ0, la funci ´on de riesgo para Zi = 0

(3)

2 MODELO DE RIESGO MULTIPLICATIVO 3 La funci ´on de verosimilitud condicional sobre Hi(τ ) de m individuos independientes, bajo el modelo

(2), es: LC(β0, λ0) = m Y i=1 λ0(ti) exp(β′0Zi) exp  − Z τ 0 λ0(u) exp(β′0Zi) du  = m Y i=1 λ0(ti) exp(β′0Zi) exp  − exp(β′0Zi) Z τ 0 λ0(u) du  = m Y i=1

λ0(ti) exp(β′0Zi) exp − Λ0(τ ) exp(β′0Zi), (3)

dondeΛ0(t) =R0tλ0(u) du es la funci ´on de baseline acumulada. Observemos que esta funci ´on de

verosimi-litud depende del par ´ametro β0 y de la funci ´onλ0, ambas desconocidas.

Cox (1975), para estimar β0 en (2), por la falta de conocimiento de λ0(·) en (3), propuso un m´etodo

de estimaci ´on denominado m ´axima verosimilitud parcial (MVP). La verosimilitud parcial no es una vero-similitud en el sentido usual ya que fue motivada condicionando sobre los tiempos de fallas observados ti, donde la probabilidad condicional de que el individuoi falle en ti dado que los individuosk tales que

tk≥ tiy que solo uno de ellos falle enti es

λ(ti|Zi)

P

tk≥tiλ(ti|Zk)

. Luego la funci ´on de MVP es:

LP(β) = m Y i=1 λ(ti|Zi) P tk≥tiλ(ti|Zk) = m Y i=1 exp(β′Zi) P tk≥tiexp(β ′ Zk) , (4)

y es tratada como la verosimilitud usual. Notar que el numerador depende ´unicamente de la informaci ´on del individuo quien experiment ´o el evento, mientras que el denominador utiliza informaci ´on sobre todos los individuos quienes no han experimentado el evento (incluyendo algunos individuos quienes ser´ıan luego censurados).

Entonces, el estimador de MVP de β0, ˆβ, es soluci ´on de la siguiente ecuaci ´on de score

UP(β) := m X i=1 ( Zi− P tk≥tiZkexp(β ′Z k) P tk≥tiexp(β ′ Zk) ) = 0, (5)

que, bajo ciertas condiciones de regularidad, es asint ´oticamente normal.

Andersen y Gill (1982) extienden el modelo de Cox para eventos recurrentes y para variables explicati-vas externas que dependen del tiempo. Consideran el proceso de conteo multivariado dem componentes N = (N1, . . . , Nm) de la vida de m individuos, donde Ni es la cantidad de eventos observados en la vida

deli-´esimo individuo, i = 1 : m sobre el intervalo [0, τ ]. Suponen que Ni(τ ) es casi seguro finito. Adem ´as,

asumen queN tiene un proceso de intensidad aleatorio λ = (λ1, . . . , λm) tal que

λi(t|Zi) = Yi(t)λ0(t) exp(β′0Zi(t)), (6)

dondeYi(t) es el proceso {0, 1} continuo a derecha, que indica con 1 cuando el i−´esimo individuo est ´a bajo

observaci ´on en el tiempo t, y que el vector de dimensi ´on p de procesos de variables independientes Zi =

(Zi1, . . . , Zip) es predecible y localmente acotado.

Observar que la representaci ´on del funcional del score UP(β), bajo el modelo (6), es:

UP(β) := m X i=1 Z τ 0 Zi h dNi(t) − Yi(t)dΛi(t; Zi) i , (7) dondeΛi(t; Zi) = Rt 0λi(t|Zi).

(4)

2 MODELO DE RIESGO MULTIPLICATIVO 4 El estimador de MVP de β0en (6), ˆβ, que es consistente, se define como la soluci ´on de la ecuaci ´on

UAG(β) = m X i=1 Z τ 0 Zi(s) dNi(s) − Z τ 0 Pm

i=1Zi(s)Yi(s) exp(β′Zi(s))

Pm

i=1Yi(s) exp(β′Zi(s))

d ¯N (s) = 0, (8)

donde ¯N = Pm

j=1Nj. Adem ´as, bajo ciertas condiciones de regularidad y utilizando resultados de

martin-galas locales, obtienen la normalidad asint ´otica del estimador.

Pero el estimador de MVP, ˆβ, pierde eficiencia con respecto al estimador de m ´axima verosimilitud cuando β0 se aleja del cero (Ver la Figura 1), y tiene funci ´on de influencia no acotada (Reid y Cr´epeau,

1985) haci´endose sensible a observaciones extremas.

Figura 1: Gr ´afica de la eficiencia relativa asint ´otica del estimador de MVP comparada con el estimador de m ´axima verosimilitud, para un problema de dos muestra (Z = 0, 1), con ausencia de censura y λ(t|Z) = λ0exp(β0Z) (Efron (1977)), donde p representa la proporci ´on de 1 en la muestra.

Uno de los autores que buscaron estimadores robustos a partir del estimador de MVP, fue Sasieni (1993A). ´El propone una versi ´on pesada del estimador MVP, es decir, le asigna m ´as importancia a lo que sucede en algunos tiempos de fallas que en otros a trav´es de una funci ´on de peso, w(t, Pm), donde

Pm es la medida emp´ırica del tiempo de falla con masa 1/m en cada punto, tal que w(·, Pm) : [0, ∞) →

[0, ∞) sea predecible, localmente acotada y tal que exista una funci´on w medible tal que kwk∞ < ∞ y

kw(·, Pm) − w(·)k∞ Prob

→ 0. Formalmente, Sasieni propone un estimador de β pesado, ˆβw que es soluci ´on de US(β; w) := m X i=1 ∆iw(ti, Pm) ( Zi(ti) − Pm j=1Yj(ti)Zj(ti) exp(β′Zj(ti)) Pm j=1Yj(ti) exp(β′Zj(ti)) ) = 0 . (9) ´

Este resulta ser, bajo ciertas condiciones, consistente de tasa√m y asint ´oticamente normal.

Sasieni propuso que w(t, Pm) = ˆS(t, ˆβ), donde ˆS(t, 0) es el estimador de Kaplan-Meier (1958) de la

funci ´on de supervivencia marginal (es decir, ignorando las variables explicativas) y a ´este estimador, asumiendo que las covariates son acotadas, lo llama el estimador de Wilcoxon (por la analog´ıa que tiene con respecto al test de Wilcoxon). Con esta funci ´on de peso, Sasieni logra dar menos peso a observaciones posteriores y se convertir ´a m ´as eficiente en censuras crecientes. Pero el estimador de Kaplan-Meier no

(5)

2 MODELO DE RIESGO MULTIPLICATIVO 5 es robusto (Reid (1981) analiz ´o como cambia la funci ´on de influencia del estimador de MVP al agregar una observaci ´on), es decir va a ser sensible a observaciones at´ıpicas. Adem ´as, al utilizar un estimador preliminar de β0la funci ´on de pesow(t, Pm) dejar ´a de ser predecible.

Cuando el modelo de Cox se verifica, el estimador de MVP (cuandow = 1) es eficiente (tiene m´ınima varianza en la clase de estimadores pesados) (Begun, Hall, Huang y Wellner, (1983), Efron (1977)) y adem ´as tiene funci ´on de influencia no acotada. Cuando la funci ´on de peso no depende de la muestra y w 6= 1, y cuando depende de la muestra (w(t, Pm)) el estimador tiene la misma eficiencia asint ´otica

con respecto al estimador MVP de Cox pero ambos son menos eficientes que ´este. Sasieni calcul ´o la eficiencia relativa asint ´otica (ARE) de su estimador con funci ´on de pesow(t, Pm) con respecto al estimador

de m ´axima verosimilitud parcial de Cox para el caso de que Z no dependa del tiempo. Realiz ´o una simulaci ´on para ver el desempe ˜no de la ARE del estimador de Wilcoxon frente a censuras crecientes. Lo que se observa en el gr ´afico del ARE en funci ´on de β0es que en todos los casos la funci ´on crece a medida

que β0se aleja del cero y adem ´as va aumentando su eficiencia a medida que se aumenta el porcentaje de

censura. Por ejemplo, si no hay censura el ARE va de 0.75 a 0.80 y cuando la censura es del 10% va de 0.80 a 0.90.

En cuanto a la funci ´on de influencia, Sasieni nota que el problema de que el estimador de MVP tenga funci ´on de influencia alta (no acotada asint ´oticamente) es por dos potenciales razones: una, por los valores de Z “extremos” y, la otra, por los individuos que m ´as sobrevivieron, es decir, por los valores grandes de T . El primero no se soluciona sin importa la funci ´on de peso w(t, Pm) que se seleccione, ya

que ´esta s ´olo depende de los tiempos de falla y de su distribuci ´on emp´ırica. Entonces asumiendo que Z est ´a acotado, cuando el estimador es el de Wilcoxon se obtiene un estimador con funci ´on de influencia acotada sin importar de que Pm sea o no un miembro de Cox (P es un miembro del modelo de Cox con

par ´ametro β0, y lo denotamos P∈ P(β0), si existen Tu,Tcindependientes condicionalmente dado Z tal que

T = m´ın(Tu, Tc), ∆ = I(Tu≤ Tc) y el riesgo proporcional de Tudado Z en t es λ(t|Z) = λ

0(t) exp(β′0Z(t))).

Por lo tanto, para el m´etodo propuesto por Sasieni la selecci ´on de la funci ´on de pesow(t, Pm) a menudo

ser ´a una compensaci ´on entre eficiencia y robustez.

Por otro lado, en otro trabajo de Sasieni (1993B) amplia la familia de los estimadores anteriormente ex-puestas permitiendo funciones de pesos que no s ´olo dependan de los tiempos de falla y de su distribuci ´on emp´ırica sino tambi´en que dependan de Z. Esta familia m ´as grande de estimadores la llam ´o estimadores

de claseK y los defini ´o de la siguiente manera: Sea K una funci ´on medible de Rp× R

+× Q → Rp, donde Q

es una extensi ´on de P(β0), que lo contiene y a todas las posibles distribuciones emp´ıricas Pm, entonces,

bajo ciertas condiciones, el estimador de claseK, ˆβK, es soluci ´on de:

m X i=1  K(Zi, Ti, Pm)Zi− Pm k=1K(Zk, Ti, Pm)Yk(Ti)Zkexp(β′Zk) Pm k=1Yk(Ti) exp(β′Zk)  = 0. (10)

El estimador ˆβK es consistente de tasa√m y asint ´oticamente normal.

Observaci ´on 1. Esta clase de estimadores fueron primero propuestos por Ritov y Wellner (1988) pero

utili-zaron funciones que solo depend´ıan de Z yT .

Otro trabajo en el que se modific ´o la ecuaci ´on de estimaci ´on de score del riesgo proporcional (5) para obtener un estimador robusto, fue el de Bednarski (1993). Las modificaciones no solo producen estimadores consistentes y asint ´oticamente normales de β0 para el modelo de riesgo proporcional sino

que tambi´en para peque ˜nos entornos del modelo, definidos como {G : kG − F k∞≤ ǫ/√m}, donde F es la

funci ´on de distribuci ´on acumulada “verdadera” de(T, Z, τ ) del modelo de Cox. La herramienta importante que utiliza Bednarski es la diferenciabilidad Fr´echet, con la que logra una funci ´on de influencia acotada y la norma del supremo del funcional del estimador conduce a un punto de ruptura no nulo.

(6)

2 MODELO DE RIESGO MULTIPLICATIVO 6 funci ´on de pesoA(t, z) (suave no negativa que vale 0 para valores grandes de t y de β′z) como sigue:

UB(β; A) := n X j=1 A(tj, Z(j)) " Z(j)− P tk≥tjA(tj, Zk)Zkexp(β ′Z k) P tk≥tjA(tj, Zk) exp(β ′Z k) # ∆j= 0, (11)

donde ∆j := I(Tj ≤ τ). El efecto de la funci´on A(t, z) que est ´a a la izquierda es para pesar hacia abajo

las observaciones no censuradas con valores grandes det exp(β′z) y en las sumas del cociente, A(t, z) es calculada para las observaciones artificiales combinando tiempotj con variables explicativas Zk (tk≥ tj),

as´ı pesa hacia abajo todas las observaciones con valores relativamente grande de β′zentre todas aquellas contk≥ tj. Con esta “doble poda” logra dar consistencia al estimador.

Por ejemplo, Bednarski (1993), Minder y Bednarski (1996), Bednarski y Nowak (2003), Bednarski y Mocarska (2006) y Bednarski (2007) proponen las siguientes funcionesA(t, z):

M − m´ın M, t exp(β′z), (12) M − m´ın M, Λ(t) exp(β′z), exp −Λ(t) exp(β ′ z) αM  ,

dondeM es una constante seleccionada apropiadamente y α es un factor de escala. Con estas funciones de peso, el estimador se calcula iterativamente y se estabiliza despu´es de la tercera o cuarta iteraci ´on. Es decir, por ejemplo, primero se toma a β= β1como un estimador preliminar (que puede ser el de MVP de

Cox), se evaluaM como un percentil (el 80 o 90 %) de la muestra T1exp(β′1Z1), T2exp(β′1Z2), . . . , Tnexp(β′1Zn)

y luego tomando A(t, z), como en (12), se calcula un nuevo estimador β2utilizando (11). ´Esto se repite 2

veces y se considera a β4 como el estimador robusto final.

Por otro lado, cuando los datos provienen de un evento recurrente es usual modelarlos con intervalos de tiempo entre sus recurrencias. Es decir, seanTi1< . . . < Tinilos tiempos continuos de fallas observados

dondeni:= Ni(Ci) =Pj≥1∆ij (con ∆ij := I(Tij ≤ Ci)), es el n ´umero de fallas del individuoi en el intervalo

de tiempo [0, Ci], donde Ci es el tiempo de censura del individuo i (con i = 1 : m). Luego se definen

Xij := Ti(j)− Ti(j−1) como los tiempos de espera entre arribos o intervalos de tiempo entre el (j − 1) y

j−´esima ocurrencia para el individuo i, y j = 1 : ni+ 1, donde Ti0:= 0 y Ti,ni+1:= Ci.

Dentro de este marco, Huang y Chen (2003) desarrollan un m´etodo que, si bien no es robusto, lo desctacamos por ser una buena t´ecnica para extender cualquier m´etodo para eventos simples a eventos recurrentes y es utilizado por varios autores. Su trabajo se focaliza sobre el desarrollo de un modelo de riesgo multiplicativo marginal para el tiempo entre las ocurrencias de un evento recurrente, en el hecho de que la correlaci ´on entre individuos puede no ser totalmente explicada por las covariates observadas. Ellos trabajan con Z independiente del tiempo y asumen que:

1. cada proceso del evento recurrente es un proceso de renovaci ´on, 2. el modelo de la funci ´on de intensidad es de la forma (2), y

3. dado Z, el intervalo de tiempo es independiente del tiempo de censura.

Ellos argumentan (al igual que el trabajo de Wang y Chang (1999) en el que estiman la funci ´on de supervivencia marginal de los tiempos entre dos eventos sucesivos) que las suposiciones 1 y 3 implican que, para el individuo i y, dado ni y Xi,ni+1, los intervalos de tiempo observados completos, Xij (j =

1 : ni), est ´an id´enticamente distribuidos. Ya que el primer intervalo de tiempo est ´a sujeto a la censura

independiente, la intercambiabilidad de los intervalos de tiempo observados completos sugiere que un subconjunto de los datos observados puede ser tratado como datos observados de supervivencia en clases; sin embargo, aparentemente el tama ˜no de la clase es informativo. Espec´ıficamente, parani> 0 remueven

los intervalos censurado del conjunto de intervalosXij, es decir, s ´olo tienen en cuenta los intervalos Xij

conj = 1 : n∗

(7)

3 MODELO DE TIEMPO DE FALLA ACELERADO 7 Adem ´as, las suposiciones 2 y 3 determinan que el procedimiento de regresi ´on de Cox est ´andar puede ser aplicado a los datos del primer intervalo de tiempo, o sea, sobre el conjunto de datos{Xi1, δi, Zi}i=1:m,

dondeδi := I(ni > 0). Entonces, para estos datos, la representaci ´on del funcional de la funci ´on de score

parcial normalizada dada por Huang y Wang (2000) (que proponen un m´etodo de estimaci ´on consistente para el modelo de riesgo multiplicativo bajo un modelo de medici ´on de error aditivo para las covariates para eventos simples) es:

UHW(β) := Z τ 0    d ˆEiZiδiI(Xi1≤ s) − ˆ Ei h Ziexp(β′Zi) ˜Yi1(s) i ˆ Ei h exp(β′Z i) ˜Yi1(s) i d ˆEiδiI(Xi1≤ s)     , (13)

donde ˜Yi1(s) := I(Xi1 ≥ s), ˆEi representa el promedio emp´ırico sobre i = 1 : m y τ es una constante

preestablecida tal que Prob(X(1) ≥ τ) > 0 (en la pr ´actica τ es usualmente tomado como el tiempo de

seguimiento m ´as largo).

Como se coment ´o antes, el primer intervalo de tiempo de cada individuo puede ser reemplazado por una selecci ´on aleatoria de la misma clase. Es decir, podemos generar Qm

i=1n ∗

i conjuntos diferentes de

intervalos para reemplazarlo a {Xi1}i=1:m. Si bien con ´esto se lograr ´a una estimaci ´on m ´as eficiente, no

obstante es una aproximaci ´on muy costosa computacionalmente. Entonces, Huang y Chen, proponen estimar β utilizando la siguiente funci ´on de score:

UHCh(β) := Z τ 0    d ˆK1(s) − ˆ Eij h Ziexp(β′Zi) ˜Yij(s) i ˆ Eij h exp(β′Zi) ˜Yij(s) i d ˆK0(s)    , (14)

donde ˜Yij(s) := I(Xij≥ s), ˆK0(s) = ˆEij[δiI(Xij ≤ s)], ˆK1(s) = ˆEij[ZiδiI(Xij ≤ s)], ˆEij := ˆEiEˆjy ˆEjrepresenta

el promedio emp´ırico sobrej = 1 : n∗

i. Con ´esto logran un estimador consistente, asint ´oticamente normal

y m ´as eficiente que el que s ´olo utiliza el primer intervalo.

Nosotros hemos realizado una simulaci ´on para comparar el estimador de Huang y Chen utilizando s ´olo el primer intervalo de tiempo con el que utiliza todos los intervalos de tiempo. Lo que obtuvimos, en varios casos analizados, fue que al utilizar todos los intervalos de tiempo observados no censurados se logra una mejor estimaci ´on que la que s ´olo utiliza el primer intervalo de tiempo observado (en los casos analizados obtuvimos una diferencia entre 0.48 y 0.93 en las estimaciones).

3.

Modelo de tiempo de falla acelerado

En an ´alisis de supervivencia los modelos de regresi ´on de tiempo de falla acelerado son una ´util alterna-tiva al modelo de riesgo multiplicativo en algunos contextos. Ellos son ejemplos de modelos transformados del tiempo que puede ser utilizado tanto en el marco de eventos simples como en eventos recurrentes. Es-te modelo es un caso particular del modelo de tiempos transformados ya que el efecto de Z es transformar la escala del tiempot a exp(β′0Z)t. Adem ´as, este modelo es log-lineal para T , ya que

log T = β′0Z+ U, (15)

dondeU es la variable error. Luego T = exp(β′0Z) ˜T donde ˜T = eU > 0 tienen funci ´on de riesgo λ0(˜t), que es

independiente de β0. Entonces la funci ´on de riesgo deT es de la forma

λ(t|Z) = λ0 t exp(β′0Z(t)) exp(β ′

0Z(t)). (16)

La ecuaci ´on (15) permite aplicar procedimientos robustos de modelos de regresi ´on de falla acelerado para hallar los estimadores. Por eso, destacamos el reciente trabajo de Locatelli, Marazzi y Yohai (2011). Ellos proponen estimadores robustos para modelo de tiempo de falla acelerado con distribuci ´on de error asim´etrica (o sim´etrica) y observaciones censuradas. Asumen que el modelo de error pertenece a una

(8)

3 MODELO DE TIEMPO DE FALLA ACELERADO 8 familia de distribuci ´on log posici ´on escala. O sea, consideran un modelo de tiempo de falla acelerado, m ´as general que el (15):

˜

Ti= β′0Zi+ σ0Ui, i = 1 : m, (17)

donde ˜Ti es el tiempo de falla sobre la escala de logaritmo. Los erroresUi son iid e independientes de la

covariate Zi, β0 es el vector de coeficientes desconocidos y σ0 es un par ´ametro de escala desconocido.

Adem ´as, la distribuci ´on de los Zi es desconocida. Por otro lado, consideran censuras simples, Ti∗ =

m´ın( ˜Ti, Ci) donde Ci son tiempos de censura iid e independientes de los ˜Ti. Entonces son observadas

(T∗

i, Zi, ∆i), donde ∆i vale 1 si el tiempo observado no fue censurado y vale 0 en caso contrario.

En el modelo (17) se desea estimar β0 yσ0. Pero comoσ0 es necesario para el c ´alculo de la esperanza

condicional (una herramienta utilizada para la estimaci ´on, comportamiento asint ´otico y punto de ruptura) de la respuestaT = exp( ˜T ), Locatelli, Marazzi y Yohai no lo tratan como un par ´ametro auxiliar, como es lo usual. Luego, el procedimiento de estimaci ´on propuesto consta de tres etapas:

ETAPA 1. Se calcula unS-estimador inicial, (˜βm, ˜σm), con alto punto de ruptura y consistente.

ETAPA 2. El estimador “inicial” (˜βm, ˜σm) quiz ´as sea ineficiente. Entonces, para obtener un estimador

“final” con el mismo punto de ruptura que ´este pero que sea altamente eficiente hay que rechazar los outliers. Es decir, se rechazan las observaciones cuya verosimilitudes bajo el modelo inicial son m ´as chicas que un valor de cota dado,ϑm.

ETAPA 3. Se calcula el estimador final (ˆβn, ˆσn), de m ´axima verosimilitud pesado cuya funci ´on de peso

depende de ϑm. Este estimador es una extensi ´on natural del estimador de m ´axima verosimilitud

truncado para observaciones no censuradas propuesto por Marazzi y Yohai (2003).

Con este procedimiento obtienen estimadores con eficiencia completa con respecto al de MV y mantienen el punto de ruptura del estimador inicial, logrando as´ı un estimador robusto con respecto a outliers en la respuesta y en puntos con alta palanca.

En los estudios sobre eventos recurrentes a menudo el inter´es se centra en modelar la distribuci ´on del tiempo de falla entre la recurrencia de un evento (o intervalo de tiempo) o en la distribuci ´on de los tiempo de cada falla. Adem ´as existen procedimientos de inferencia basados en m´etodos marginales y m´etodos basados en intensidad. Los m´etodos marginales habitualmente se focalizan sobre la funci ´on de tasa acumulada o funci ´on de la media y no hacen condici ´on sobre la historia del evento completo. Un ejemplo de ´esto lo veremos en el trabajo que realizan Lin, Wei y Ying (1998). En cambio, los m´etodos de intensidad especifican como la probabilidad de recurrencia posterior depender ´a de la historia del evento pasado. Aqu´ı destacaremos el trabajo de Strawderman (2005).

Lin, Wei y Ying (1998) trabajan con los tiempos de falla, es decir, para i = 1 : m y j = 1, . . ., sea Tij el

j−´esimo tiempo de falla del evento para el sujeto i−´esimo. Asumen que los sujetos son independientes, pero no se impone ninguna estructura de dependencia sobre los tiempos de recurrencia del mismo sujeto. Definen a N∗

i(t) como el n ´umero de fallas que han ocurrido sobre el sujeto i en el tiempo t en ausencia

de censura, esto es N∗ i(t) =

P

k≥1I(Tik≤ t). Adem ´as suponen que la funci´on media del proceso de conteo

N∗

i(t) asociado al vector de variable explicativa Zi∈ Rp, que la suponen acotada, es de la forma:

E Ni∗(t)|Zi = µ0 exp(β′0Zi) t, (18)

donde β0 es un p−vector de par ´ametros de regresi´on desconocido, y µ0 es una funci ´on continua no

especificada. De acuerdo a este modelo, el n ´umero esperado de eventos en el tiempo t bajo Zi = z es

igual al n ´umero esperado de eventos en el tiempot exp(β′0z) bajo Zi= 0. En otras palabras, el conjunto de

(9)

3 MODELO DE TIEMPO DE FALLA ACELERADO 9 la escala del tiempo en aquellas ocurrencias de eventos por un factor multiplicativo deexp(β′0Zi) relativo

a aquel de un vector de covariate cero.

Sea Ci el tiempo de censura del sujeto i, que lo asumen independiente de Tik condicionado sobre

Zi. Luego el proceso de conteo Ni(t) de los tiempos de fallas censurados, se pueden expresar como

Ni(t) =Pk≥1I(Tik≤ t ∧ Ci).

Motivados por la funci ´on de score de la verosimilitud parcial para el modelo de proceso de Poisson de intensidad proporcional (Andersen y Gill, 1982) y las funciones de estimaci ´on de rango pesado para el modelo log-lineal (15) (Prentice, 1978; Tsiatis, 1990; Wei, Ying y Ling, 1990), proponen la siguiente clase de funciones de estimaciones para β0:

U(β) := m X i=1 Z ∞ 0 Q(t; β)Zi− ¯Z(t; β) dNi t exp(−β′Zi), (19)

dondeQ(t; β) tiene variaci ´on acotada y converge casi seguro a una funci ´on continua y ¯ Z(t; β) = Pm j=1I(t exp(−β ′ Zj) ≤ Cj)Zj Pm j=1I(t exp(−β ′ Zj) ≤ Cj) .

Ellos se refieren a U(β) como la funci ´on de estimaci ´on log-rango si Q ≡ 1 y como la funci´on de estimaci´on de Gehan si Q(t; β) = Pm

i=1I(t exp(−β ′

Zi) ≤ Ci)/m. Para la primer funci ´on de peso, como en el caso de

estimaci ´on de rango para el modelo log-lineal (15), la funci ´on de estimaci ´on U(β) es una funci ´on constante a trozos de β, entonces definen el estimador ˆβcomo un cero de U(β) o como un m´ınimo de kU (β)k2. Para

la funci ´on de estimaci ´on de Gehan, (19) se convierte en U(β) = 1 m m X i=1 m X j=1 X k≥1 ∆ik(Zi− Zj) I log τ log Tik≥ β′(Zi− Zj), (20)

y as´ı obtienen ˆβminimizando la funci ´on: 1 m m X i=1 m X j=1 X k≥1

∆ikm´ax log τ − log Tik− β′(Zi− Zj), 0 .

El estimador resultante puede ser ligeramente diferente al m´ınimo de kU (β)k2, pero son asint

´otica-mente equivalentes.

El estimador ˆβ, soluci ´on de U(β) = 0, resulta ser consistente y asint ´oticamente normal. Pero, resolver la ecuaci ´on de estimaci ´on U(β) = 0 puede en general ser arduo cuando p (la dimensi ´on de Z) es grande. Entonces, proponen ˆβ⋆como soluci ´on de

U(β) = m X i=1 Di(ˆβ)Gi, donde Di(β) := Z ∞ 0 Q(t; β)Zi− ¯Z(t; β) d h Ni t exp(−β′Zi) − Z t 0 I(t exp(−β ′ Zi) ≤ Ci)dˆµ0(s; β) i , con ˆ µ0(t; β) = m X i=1 Z t 0 dNi t exp(−β′Zi)  Pm j=1I(t exp(−β ′Z j) ≤ Cj)

y(G1, · · · , Gn) son v.a. normales est ´andar independientes. Tambi´en se puede obtener ˆβ ⋆

como soluci ´on de U(β) = G, donde G es normal con media cero y matriz de covarianzaPm

i=1Di(ˆβ)Di(ˆβ)′. Luego√m(ˆβ− ˆβ ⋆

) tiene la misma distribuci ´on l´ımite que √m(ˆβ− β0) y adem ´as la matriz de covarianza de ˆβ puede ser estimada por la matriz de covarianza emp´ırica de ˆβ⋆.

Cuando el modelo se ajusta razonablemente a los datos, Lin, Wei y Ying proponen que el estimador de la ecuaci ´on de estimaci ´on de Gehan (soluci ´on de U(β) = 0 o U (β) = G, que se puede resolver de manera

(10)

3 MODELO DE TIEMPO DE FALLA ACELERADO 10 eficiente), puede ser utilizado como un estimador inicial para estimaciones con funciones de peso m ´as generales, ya que la soluci ´on de la ecuaci ´on de estimaci ´on de Gehan ser ´a similar a las soluciones de la ecuaci ´on de estimaci ´on con pesos m ´as generales. Adem ´as, para la mayor´ıa de los efectos pr ´acticos, es suficiente hacer inferencias basadas sobre la estimaci ´on de Gehan.

El trabajo de Strawderman (2005) desarrolla un nuevo modelo semiparam´etrico para el efecto de las variables explicativas, independientes del tiempo, sobre la intensidad condicional de un proceso de conteo de evento recurrente. Su modelo es una extensi ´on del modelo del tiempo de falla acelerado para datos de supervivencia univariado, intervalos de tiempo entre eventos, y la estimaci ´on del par ´ametro de regresi ´on esta motivada por las consideraciones de eficiencia semiparam´etricas.

Primero considera un sujeto con un vector de covariate Z de dimensi ´on p independiente del tiempo, que experimenta el evento recurrente en los tiempos 0 =: T0 < T1 < T2 < . . .. Define el j-´esimo intervalo

de tiempo como Xj = Tj− Tj−1,j ≥ 1. Sean V1,V2,. . . variables aleatorias iid con funci ´on de distribuci ´on

F0, tal queF0(t) =R0tf0(s)ds donde f0tiene primer derivada continua y segunda derivada acotada. Asume

que, dado Z, sus intervalos de tiempos, X1,X2,. . . son variables aleatorias independientes donde

Xj= Vjexp(−β′0Z),

siendo β0el vector de par ´ametro de regresi ´on. Notar que Z acelera o desacelera las intervalos de tiempo

Vj como sucede con los modelos de tiempos de falla acelerado.

Luego la funci ´on de riesgo deXj, dado Z es

λ0 x exp(β′0Z) exp(β′0Z),

donde λ0 es la funci ´on de riesgo asociada a F0. Entonces, en ausencia de censura y dado Z, el proceso

N (t) := m´ax{n :Pn

j=1Xj≤ t} es un proceso de renovaci´on.

Ahora suponem sujetos independientes, donde cada uno es observado en el intervalo de tiempo finito [0, Ci]. Entonces los datos observados son {Ni(u ∧ Ci), ∆i(u), Zi, u ≥ 0} para i = 1 : m, donde ∆i(u) = I(u ≤

Ci). Adem ´as asumen que Z1es casi seguro acotado y E[(N1(C1))6+ǫ] < ∞ para alg ´un ǫ > 0.

El trabajo de Strawderman fue motivado por los trabajos de Prentice (1978) (quien sugiri ´o estimar β0

del modelo (16) semiparam´etrico invirtiendo una clase de estad´ısticos de rango lineal pesado), de Tsiatis (1990) (quien estableci ´o las propiedades asint ´oticas de la clase de estimadores porpuesto por Prentice) y de Ritov (1990) (quien estableci ´o una correspondencia directa entre las funciones estimadas por Prentice y Tsiatis y las basadas sobre consideraciones de eficiencia semiparam´etrica para modelos de regresi ´on lineal ccensurados). ´El propone la clase pesada de funciones de estimaci ´on, mediante la siguiente funci ´on de score: ¯ SW(β) := 1 m m X i=1 ni X j=1 W ( ˜Xij(β)|β) " Zi− Pm k=1ZkPnr=1k+1I˜kr( ˜Xij|β) Pm k=1 Pnk+1 r=1 I˜kr( ˜Xij|β) # , (21)

donde ˜Xij(β) = Xijexp(β′Zi) para j = 1 : ni+ 1, ni= Ni(Ci), ˜Ikr(t|β) := I( ˜Xkr(β) ≥ t) y W (t|β) con t ∈ [0, ¯τ]

(τ satisface que ´ınf{t ∈ [0, ¯τ] : E(¯ Pni+1

j=1 I˜kr(t|β))} > 0) y β en alg ´un entorno de β0, es de variaci ´on acotada

y existe una funci ´on determin´ıstica continua y acotada w(t|β) tal que |W (t|β) − w(t|β0)| converge a 0

uniformemente en probabilidad.

Como (21) es una funci ´on de estimaci ´on basada en rango, el estimador ˆβpuede ser definido como un cero de ¯SW(β) o un m´ınimo de k ¯SW(β)k2. Sin embargo, puede existir varios m´ınimos porque ¯SW(β) no

es necesariamente mon ´otona. Pero, si W (u|β) =Pm

i=1

Pni+1

j=1 I˜ij(u|β)/m (denominado peso de Gehan), ´esta

dificultad desaparece. Y en este caso, (21) se reduce a ¯ SG(β) := 1 m2 m X i=1 ni X j=1 m X k=1 (Zi− Zk) nk+1 X r=1 ˜ Ikr( ˜Xij|β), (22)

(11)

4 MODELO ADITIVO: 11 que es el gradiente de la funci ´on objetivo convexa

LG(β) := 1 m2 m X i=1 ni X j=1 m X k=1 nk+1 X r=1

m´axn log ˜Xkr(β) − log ˜Xij(β), 0

o

, (23)

Los minimizadores deLG(β) y k ¯SG(β)k son asint´oticamente equivalentes (Fygenson y Ritov, 1994). Luego

Strawderman toma ˆβG= arg m´ın LG(β) y resulta ser consistente de tasa√m y asint ´oticamente normal.

Para este ´ultimo estimador Strawderman comenta que “notablemente no se asume que el intervalo de tiempo sea acotado, es una ´util consecuencia de la convexidad asociada con la funci ´on de peso de Gehan”. Adem ´as, da un algoritmo para calcular ˆβG y ˆΓG, un estimador consistente de la corvarianza de

m(ˆβ

G− β0).

Para pesos generales, Strawderman propone un estimador ˆβW de un paso a partir del ˆβG, que tambi´en resulta ser consistente de tasa√m y asint ´oticamente normal.

4.

Modelo aditivo:

Por ´ultimo, veremos los resultados estad´ısticos del modelo de riesgo aditivo para la funci ´on de inten-sidad que es de la forma:

λ(t|Z) = λ0(t) + β′0Z(t) (24)

donde β0 es el vector de par ´ametro de regresi ´on yλ0(t) = λ(t|Z = 0) es la funci´on baseline, desconocida,

arbitraria y no negativa en funci ´on del tiempo. ´Este modelo propuesto por Lin y Ying (1994) es una alternativa al modelo de Aalen (1980) en el cual el par ´ametro de regresi ´on depende de los tiempos de falla, es decir, la funci ´on de intensidad es de la forma

λ0(t) + β0(t)′Z(t) = (λ0(t), β0(t))′(1, Z(t)).

Primero plantearemos aqu´ı las distintas funciones de verosimilitud para el modelo aditivo s ´olo para el caso de eventos simples.

La funci ´on de verosimilitud condicional sobre Hi(τ ) de m individuos con funci ´on de intensidad (24),

dondet1≤ . . . ≤ tmson los tiempos de falla observados en[0, τ ] y Zi corresponde al sujetoi, es

LC(β, λ0) = m Y j=1 λ(tj|Zj) exp  − Z τ 0 λ(u|Z j) du  = = m Y j=1 λ0(tj) + β′0Zj(tj) exp  − Z τ 0 λ0(u) + β′0Zj(u) du  = = m Y j=1 λ0(tj) + β′0Zj(tj) exp −Λ0(τ ) + β′0Z∗j(τ ) , (25) donde Z∗j(t) = Rt

0Zj(u) du y Λ0(t) =R0tλ0(u) du. Luego,

lC(β, λ0) = log LC(β, λ0) = m X j=1 n logλ0(tj) + β′0Zj(tj) − Λ0(τ ) + β′0Z ∗ j(τ ) o , (26) entonces ∂ ∂β0 lC(β, λ0) = m X j=1  Z j(tj) λ0(tj) + β′0Zj(tj)− Z ∗ j(τ )  . (27)

Observemos que (27) depende del par ´ametro de regresi ´on β0 y de la funci ´onλ0(·), lo cual complicar´ıa

(12)

4 MODELO ADITIVO: 12 Por otra parte, la funci ´on de verosimilitud parcial es

LP(β, λ0) = m Y j=1 λ(tj|Zj) P k∈Rjλ(tj|Zk) = m Y j=1 λ0(tj) + β′0Zj(tj) P k∈Rjλ0(tj) + β ′ 0Zk(tj) , (28)

dondeRj es el conjunto de riesgo en el tiempotj. Entonces

lP(β, λ0) = log LP(β, λ0) = m X j=1    logλ0(tj) + β′0Zj(tj) − log   X k∈Rj  λ0(tj) + β′0Zk(tj)       = = m X j=1    logλ0(tj) + β′0Zj(tj) − log  rjλ0(tj) + β′0 X k∈Rj Zk(tj)      = = m X j=1 n logλ0(tj) + β′0Zj(tj) − log rjλ0(tj) + β′0SZj o , (29)

donderj es el cardinal del conjuntoRj ySZj:=Pk∈RjZk(tj). Por lo tanto,

∂ ∂β0 lp(β, λ0) = m X j=1  Zj(tj) λ0(tj) + β′0Zj(tj)− SZj rjλ0(tj) + β′0SZj  . (30)

Notar que la funci ´on de verosimilitud parcial (28), para este modelo no puede aplicarse como se hizo para el caso del modelo de riesgo multiplicativo (2), pues en este caso no se eliminar´ıa λ0(t) para la

estimaci ´on de β0, (ver la funci ´on de score (30)).

Sin embargo, hay varios autores que han podido estimar β0 sin la necesidad de recurrir a las cl ´asicas

funciones de verosimilitud condicional y/o parcial antes descritas. Entre estos autores hemos conside-rado el trabajo de Lin y Ying (1994) en el cual imitaron la caracter´ıstica de martingala de la funci ´on de score de la verosimilitud parcial del modelo multiplicativo del par ´ametro β0 logrando construir una

sim-ple funci ´on de estimaci ´on permitiendo expresar en forma expl´ıcita al estimador ˆβ0 (´esto no sucede en los modelos multiplicativo y de falla acelerado).

Formalmente, Lin y Ying (1994) consideranm sujetos independientes y recogen en el proceso de conteo del sujetoi, {Ni(t); t ≥ 0} el n ´umero de eventos observados hasta el tiempo t. Bajo el modelo (24), la funci´on

de intensidad paraNi(t) esta dada por

Yi(t) dΛ(t; Zi) = Yi(t)dΛ0(t) + β′0Zi(t) dt, (31)

dondeYi(t) indica con 1 si el sujeto i est ´a en riesgo en el tiempo t y en en caso contrario con 0 y Λ0(t) =

Rt

0λ0(u) du. Ellos proponen estimar β0 imitando la funci ´on de score de la verosimilitud parcial del modelo

multiplicativo (7), que bajo (31), es de la forma U(β) = m X i=1 Z ∞ 0 Zi(t) h dNi(t) − Yi(t)dˆΛ0(β, t) + β′Zi(t) dt i , donde ˆΛ0 es el estimador deΛ0del modelo (24) definido como

ˆ

Λ0(ˆβ, t) =

Z t

0

Pm

i=1dNi(u) − Yi(u)ˆβ ′

Zi(u) du

Pm

i=1Yi(u)

, (32)

siendo ˆβun estimador consistente de β0. Luego, U(β) es equivalente a

ULY(β) := m X i=1 Z ∞ 0 Zi(t) − ¯Z(t) dNi(t) − Yi(t)β′Zi(t) dt, (33) donde ¯Z(t) =Pm

j=1Yj(t)Zj(t)/Pmj=1Yj(t). Entonces el estimador queda definido expl´ıcitamente como

ˆ β= m X i=1 Z ∞ 0 Yi(t)Zi(t) − ¯Z(t) ⊗2 dt !−1 m X i=1 Z ∞ 0 Zi(t) − ¯Z(t) dNi(t) ! (34)

(13)

REFERENCIAS 13 ´

Este estimador resulta ser consistente de tasa√m y asint ´oticamente normal.

Por ´ultimo en el caso de eventos recurrentes destacamos el trabajo de Sun, Park y Sun (2006) en el que ajustan un modelo de riesgo aditivo λ(t|Zi) = λ0(t) + β′0Zi utilizando los intervalos de tiempo entre

las ocurrencias de los tiempo de falla y toman a la covariate independiente del tiempo, adem ´as de asumir que E||Z||2< ∞. Ellos extienden la idea de Lin y Ying (1994) a eventos recurrentes aplicando los mismos

argumentos y suposiciones que realizan Huang y Chen (2003) adem ´as de introducirle una funci ´on de peso a la funci ´on de score de estimaci ´on.

Siguiendo los mismos argumentos y las mismas notaciones que utilizamos al describir el trabajo de Huang y Chen (2003), Sun, Park y Sun proponen la ecuaci ´on de estimaci ´on USP S(β) = 0 para estimar el

par ´ametro de regresi ´on β0, donde

USP S(β) := Z τ 0 Q(s) ( d ˆK1(s) − ˆ G1(s) ˆ G0(s) d ˆK0(s) − " ˆ EijZ′iZiI(Xij ≤ s) − ˆ G1(s)′Gˆ1(s) ˆ G0(s) # βds )

siendoQ(s) un proceso de peso (que puede depender de los datos) con variaci ´on acotada y que converge casi seguro a una funci ´on determin´ıstica uniformemente sobre [0, τ ], ˆG0(t) = ˆEij[I(Xij ≥ t)] y ˆG1(t) =

ˆ

Eij[ZiI(Xij ≥ t)].

Luego el estimador de β tambi´en se puede expresar de forma expl´ıcita como: ˆ β= ( Z τ 0 Q(s) " ˆ EijZ′iZiI(Xij ≤ s) − ˆ G1(s)′Gˆ1(s) ˆ G0(s) # ds )−1( Z τ 0 Q(s) " d ˆK1(s) − ˆ G1(s) ˆ G0(s) d ˆK0(s) #) , (35)

que es consistente de tasa√m y asint ´oticamente normal.

Ellos, al igual que Huang y Chen, tambi´en proponen un estimador que solo utiliza el primer intervalo de tiempo de cada individuo pero es menos eficiente que aquel que utiliza todos los intervalos (al igual que pasa en Huang y Chen). Adem ´as comentan que “un problema que necesita ser estudiado a futuro es la selecci ´on de un proceso de peso Q(t) que da el estimador m ´as eficinete de β0 para una situaci ´on

particular”. Para el estudio de simulaci ´on que se realiz ´o, se obtuvieron resultados similares paraQ ≡ 1 y Q(t) =Pm

i=1I(Ci≥ t)/m.

Referencias

[1] Aalen, O. O. (1980). A model for non-parametric regression analysis of counting processes. Lecture Notes on Mathematics Statistics and Probability. Springer-Verlag, New York, pp. 1-25.

[2] Andersen, P. K. and Gill, R. D. (1982). Cox’s regression model for counting processes: a large sample

study. The Annals of Statistics Vol. 10, No. 4, pp. 1110-1120.

[3] Andersen, P. K., Borgan, Gill, R. D. and Keidireg (1993) Statistical models based on counting processes. Springer, New York.

[4] Bednarski, T. (1993). Robust estimation in Cox’s regression model. Scandinavian Journal of Statistics, Vol. 20, pp. 213-225.

[5] Bednarski, T. and Nowak, M. (2003). Robustness and efficiency of Sasieni-type estimators in the Cox

model. Journal of Statistical Planning and Inference, Vol. 115, No. 1, pp. 261-272.

[6] Bednarski, T. and Mocarska, E. (2006). On robust model selection within the Cox model. Ecometrics Journal, Vol. 9, pp. 179-290.

[7] Bednarski, T. (2007). On a robust modification of Breslow’s cumulated hazard estimator. Computational Statistics and Data Analysis, Vol. 52, pp. 234-238.

(14)

REFERENCIAS 14 [8] Begun, J. M., Hall, W. J., Huang, W. M. and Wellner, J. A. (1983). Information and Asymptotic Efficiency

in Paramtric-Nonparametric Models. The Annal of Statistics, Vol. 11, No. 2, pp. 432-452.

[9] Cox, D.R. (1972). Regression Models and Life-Tables (with discussion). Journal of the Royal Statistical Society. Series B (Methodological), Vol. 34, No. 2, pp. 187-220.

[10] Cox, D.R. (1975). Partial Likelihood. Biometrika, Vol. 62, pp. 262-276.

[11] Efron, B. (1977). The efficiency of Cox’s likelihood function for censored data. Journal of the American Statistical Association, Vol. 72, No. 359, pp. 557-565.

[12] Fygenson, M. and Ritov, Y. (1994). Monotone Estimations for Censored Data. The Annals of Statistics, Vol. 22, No. 2, pp. 732-746.

[13] Huang, Y. and Wang, C.Y. (2000). Cox regression with accurate covariates unascertainable: A

nonparametric-correction approach. Journal of the American Statistical Association, Vol. 95, pp. 1209-1219.

[14] Huang, Y. and Chen, Y. Q. (2003). Marginal regression of gaps between recurrent events. Lifetime Data Analysis, Vol. 9, pp. 293-303.

[15] Kalbfleisch, J. D. and Prentice, R. L. (1973) Marginal likelihoods based on Cox’s regression and life

model. Biometrika, Vol. 60, No. 2, pp. 267-278.

[16] Kaplan, E. L. and Meier, P. (1958) Nonparametric estimation from incomplete observations. Journal of the American Statistical Association, Vol. 53, pp. 457-481.

[17] Karlin, S. and Taylor, H. M. (1975). A first course in Stochastic Processes, Academic Press, Inc. Lon-don.

[18] Lin, D. Y. and Ying, Z. (1994). Semiparametric analysis of the additive risk model. Biometrika, Vol. 81, No. 1, pp. 61-71.

[19] Lin, D. Y., Wei, L. J., Yang, I. and Ying, Z. (2000). Semiparametric regression for the mean and rate

functions of recurrent events. Journal of the Royal Statistical Society, Series B, Vol. 62, No. 2, pp. 711-730.

[20] Locatelli, I., Marazzi, A. an Yohai, V. J. (2011). Robust accelerate failure time regression. Computatio-nal Statistics and Data AComputatio-nalysis, Vol. 55, pp. 874-887.

[21] Marazzi, A. and Yohai, V. (2003). Adaptively truncated maximun likelihood regression with asymmetric

errors. Journal of Statistical Planning and Inference, Vol. 122, pp. 271-291.

[22] Minder, C. E. and Bednarski, T. (1996). A robust method for proportional hazards regression. Statistics in Medicine, Vol. 15, pp. 1033-1047.

[23] Prentice, R.L. (1978). Linear rank tests with right censored data. Biometrika, Vol. 65, pp. 167-179. [24] Reid, N. (1981). Influence functions for censored data. The Annals of Statistics, Vol. 9, No. 1, pp.

78-92.

[25] Reid, N. and Crepeau, H. (1985). Influence functions for proportional hazards regression. Biometrika, Vol. 72, No. 1, pp. 1-9.

[26] Ritov, Y. and Wellner, J. A. (1987). Censoring, Martingala and The Cox Model. Technical Report, University of Washington, Department of Statistics, No. 108.

[27] Ritov, Y. (1990). Estimation in a linear regression model with censored data.The Annals of Statistics, Vol. 18, No. 1, pp. 303-328.

(15)

REFERENCIAS 15 [28] Sasieni, P. (1993A). Maximum Weighted Partial Likelihood Estimators for the Cox Model. Journal of

the American Statistical Association, Vol. 88, No. 421, pp. 144-152.

[29] Sasieni, P. (1993B). Some new estimators for Cox reggression. The Annals of Statistics, Vol. 21, No. 4, pp. 1721-1759.

[30] Strawderman, R. L. (2005). The accelerated gap times model. Biometrika, Vol. 92, pp. 647-666. [31] Sun, L. Liu, J. Sun Ji. and Zhang M. (2006). Modeling the subdistribution of a competing risk.

Statis-tica Sinica, Vol. 16, pp. 1367-1385.

[32] Tsiatis, A.A. (1990). Estimating regression parameters using linear rank tests for censored data. The Annals of Statistics, Vol. 18, No. 1, pp. 354-372.

[33] van der Vaart (1998). Asymptotic Statistics. Cambridge University Press, Cambridge.

[34] Wang, M.C. and Chang, S.H. (1999). Nonparametric estimation of a recurrent survival function. Jour-nal of the American Statistical Association, Vol. 94, pp. 146-153.

[35] Wei, L.J., Ying, Z. and Ling, D.Y. (1990). Linear regression analysis of censored survival data based

Referencias

Documento similar

El inconveniente operativo que presenta el hecho de que la distribuci´ on de probabilidad de una variable aleatoria es una funci´ on de conjunto se resuelve mediante el uso de

El contar con el financiamiento institucional a través de las cátedras ha significado para los grupos de profesores, el poder centrarse en estudios sobre áreas de interés

Fuente de emisión secundaria que afecta a la estación: Combustión en sector residencial y comercial Distancia a la primera vía de tráfico: 3 metros (15 m de ancho)..

La campaña ha consistido en la revisión del etiquetado e instrucciones de uso de todos los ter- mómetros digitales comunicados, así como de la documentación técnica adicional de

La ra´ız cuadrada del error cuadr´atico medio (RMSE) de la estimaci ´on del re- tardo de la se ˜nal desde la estaci ´on m ´ovil a la estaci ´on base depende, tanto para el

Calcular los l´ımites

Cedulario se inicia a mediados del siglo XVIL, por sus propias cédulas puede advertirse que no estaba totalmente conquistada la Nueva Gali- cia, ya que a fines del siglo xvn y en

Entre nosotros anda un escritor de cosas de filología, paisano de Costa, que no deja de tener ingenio y garbo; pero cuyas obras tienen de todo menos de ciencia, y aun