Libro Gerencia en Mantenimiento

(1)

Genaro Mosquera Castellanos

José de Jesús Rivero Oliva

Jesús Salomón Llanes

Conrado Valhuerdi Debesa

Antonio Torres Valle

Manuel Perdomo Ojeda

CENTRO DE ALTOS ESTUDIOS GERENCIALES ISID

Caracas, Venezuela 1995

(2)

DISPONIBILIDAD Y CONFIABILIDAD

DE SISTEMAS INDUSTRIALES

CENTRO DE ESTUDIOS GERENCIALES

INSTITUTO SUPERIOR DE INVESTIGACION Y DESARROLLO Caracas - Venezuela.

(3)

Copyright, 1995. ISBN 980 00 0889 6

2ª. Edición Adaptada como herramienta computacional.

Centro de Altos Estudios Gerenciales ISID

Empresa de la Fundación Educativa “María Castellanos” Femaca e-mail: [email protected]

En asociación con Cybercentrum Las Mercedes C.A. y Edukami U.S.A.

(4)

INDICE

1.1. CONSIDERACIONES GENERALES... 8

1.2. COSTOS ASOCIADOS... 9

1.3. PARÁMETROS DE MANTENIMIENTO... 10

2.1. CONFIABILIDAD... 12

2.1.1. Indices cuantitativos de confiabilidad... 14

2.1.2. Relaciones entre los índices cuantitativos de confiabilidad... 17

2.1.3. Variación de la confiabilidad de los elementos en función del tiempo. ... 19

2.2. DISTRIBUCIONES DE PROBABILIDAD DE LAS FALLAS DE LOS COMPONENTES DE UN SISTEMA. ... 22

2.2.1. Distribuciones de probabilidad de Fallas... 22

2.3. BASES DE DATOS DE CONFIABILIDAD. ... 33

2.3.1. El teorema de Bayes y la confiabilidad...33

2.4. TIPOS DE COMPONENTES. EXPRESIONES PARA LA EVALUACIÓN DE SU CONFIABILIDAD. ... 36

3.1. TÉCNICA DE ÁRBOLES DE FALLAS. ... 45

4.1. ANÁLISIS DE IMPORTANCIA Y DE SENSIBILIDAD... 73

4.1.1. Análisis de importancia... 73

4.1.2. Análisis de Sensibilidad por indisponibilidad media. ... 80

4.2. ANÁLISIS DE INDISPONIBILIDAD INSTANTÁNEA. ... 83

4.2.2. Análisis de sensibilidad por indisponibilidad instantánea... 87

4.2.3. Análisis en puntos aislados del tiempo... 94

5.1. CONTROL DE CONFIGURACIÓN... 96

5.2. PRIORIZACIÓN POR MANTENIMIENTOS... 98

5.3. PRIORIZACIÓN POR AOT. ... 99

5.4. OPTIMIZACIÓN DE ESPECIFICACIONES TÉCNICAS. ... 99

5.5. OPTIMIZACIÓN DEL MONITOREO... 100

5.6. OPTIMIZACIÓN DEL INVENTARIO DE PIEZAS DE REPUESTO... 100

5.7. ESTUDIO DE LA INFLUENCIA DEL ENVEJECIMIENTO DE LOS COMPONENTES SOBRE LA DISPONIBILIDAD DE LA INSTALACIÓN... 101

5.8. INDICADORES BASADOS EN RIESGO. ... 101

(5)

6.1. PREPARACIÓN DEL ESTUDIO DE APS PARA SU INTRODUCCIÓN A LA INDUSTRIA... 104

6.2. DESARROLLO DE UN EJEMPLO PRÁCTICO UTILIZANDO EL SISTEMA ARCON. ... 105

6.2.1. Descripción de la tarea. ... 105

A.1. PAPEL DEL ANÁLISIS DE DATOS EN LOS ANÁLISIS DE CONFIABILIDAD... 123

A.2.1. MODOS DE FALLA... 123

A.2.3. MODELOS DE COMPONENTES... 129

A.3. BASES DE DATOS_{... 131}

C.1. INTRODUCCIÓN... 141

C.2. PROPÓSITO DEL FMEA... 142

C.3. REQUISITOS PARA EJECUTAR UN FMEA... 142

C.4. PASOS DEL ANÁLISIS... 143

C.5. FORMATO DE PRESENTACIÓN DEL ANÁLISIS. ... 143

D.1. INTRODUCCIÓN. ... 145

D.2. TRATAMIENTO DE LAS FALLAS DEPENDIENTES... 145

(6)

PROLOGO

Dentro del marco de un convenio suscrito entre la Universidad Nororiental Gran Mariscal de Ayacucho y el Instituto Superior de Ciencia y Tecnología Nucleares, se ha instrumentado un proyecto de investigación y desarrollo tecnológico en el área de Ingeniería de Mantenimiento, Como consecuencia de dicho desarrollo, y dentro de los acuerdos de cooperación institucional, se ha venido trabajando en un sistema de medición de parámetros de mantenimiento, dentro de los cuales destacan los aspectos teóricos y aplicados de la teoría de confiabilidad y esquemas asociados a los sistemas gerenciales de mantenimiento industrial.

Los aspectos mencionados fueron conceptualizados y aplicados a una variada gama de sistemas industriales, dando origen a paquetes computacionales, preparados para la formación profesional de los ingenieros en el campo del mantenimiento y de los aspectos probabilísticos de seguridad industrial. Sus aplicaciones condujeron a la creación de un sistema preparado en ambiente de computadoras personales, soportados en un esquema interactivo. Su trabajo requirió la revisión de los aspectos conceptuales en el campo de la Ingeniería, Estadística e Informática, lo cual condujo a la preparación de los manuales de operación de los sistemas y a la elaboración de un textos que recogiesen los esquemas teóricos con sus respectivas aplicaciones, cumpliendo el doble propósito de sistematizar las investigaciones y desarrollos tecnológicos y, al mismo tiempo, contribuyera a proporcionar una guía para el estudio a nivel profesional de pregrado y postgrado, de un tema que adquiere enorme importancia en la industria moderna.

Todos los paradigmas incluidos en el texto corresponden a la propuesta innovadora de un grupo de profesores, especialistas en diversas disciplinas técnicas, de cuyo esfuerzo se pudo lograr un verdadero aporte científico que, sin lugar a dudas, redunda en beneficio de los ingenieros y especialistas en ingeniería de mantenimiento industrial. La interdisciplina funcionó en este libro, no sólo como elemento de complementariedad profesional entre los autores, sino que pudo traducir de manera armónica los esfuerzos internacionales entre dos universidades para el bien común de nuestros pueblos, y seguramente de otras latitudes latinoamericanas. Cabe destacar como el esfuerzo de la comunidad científica internacional puede concretar tan rápidamente la experticia de sus profesionales, si en el ánimo de sus líderes los objetivos estratégicos se conciben adecuadamente. En este sentido, debe destacarse el esfuerzo interistitucional de la Dra. Elizabeth de Caldera, Ministra de Educación de Venezuela en 1993, con su visión e iniciativa, juntaron el esfuerzo de dos instituciones representadas por el Dr. Edwin Pedrero González, Rector del Instituto Superior de Ciencia y Tecnología Nucleares y el Dr. Genaro Mosquera, Rector de la Universidad Gran Mariscal de Ayacucho. Esta iniciativa produjo una relación poderosa en el campo de la creación de conocimientos y del intercambio tecnológico de dos pueblos, los cuales se tradujeron en aportes concretos del desarrollo profesional gerencial.

Este esfuerzo se hizo posible con el concurso de los autores del libro: Genaro Mosquera, José de Jesús Rivero, Jesús Salomón, Conrado Valhuerdi, Antonio Torres y Manuel

(7)

Perdomo. Alrededor de ellos, un entusiasta grupo de colaboradores en las respectivas instituciones permitió darle forma a tan particular tema de investigación; en Venezuela, vale la pena destacar a los ingenieros Luis A. Martínez y Carlos Alezones quienes desde la Gerencia de Sistemas y la Escuela de Ingeniería de la Universidad, permitieron concretar este proyecto de publicación en beneficio de tantos usuarios de nuestras universidades y de la comunidad profesional y científica internacional.

Los autores de esta obra desean manifestar público reconocimiento al Ing. José Guillermo Nápoles (g), a quien se debe el inicio de los estudios de APS en América Latina y el desarrollo del sistema computarizado ARCON.

(8)

I. Gerencia de los sistemas de mantenimiento.

1.1. Consideraciones generales.

Las aplicaciones científico-tecnológicas han derivado en los últimos años en una proporción significativa hacia la Gerencia, tomando un enfoque cuantitativo sustentado en el desarrollo de modelos estadístico matemáticos. Dentro de este marco general, la Gerencia Técnica ha adquirido un enorme impulso, apoyada particularmente por el procesamiento de datos a gran velocidad, utilizando los ordenadores electrónicos los cuales son hoy en día de gran versatilidad, especialmente las computadoras personales. La gerencia de mantenimiento ha venido transformándose en una actividad cada vez más importante dentro de los complejos industriales y ha adquirido en los últimos años importancia vital, para lograr que las instalaciones y equipos sean mantenidos en las mejores condiciones operacionales dentro de un ambiente de óptimo costo. El análisis y estudio de las relaciones globales dentro de una organización y de su entorno requieren de experticias específicas examinando variados factores, entre los cuales está la misma organización estructural, el uso de los recursos materiales y financieros, la operación de los sistemas, el control de los costos, y el soporte logístico y técnico asociado.

Dentro de ese marco referencial, y ante la diversificación técnica, producto de la diversidad tecnológica y organizacional de los complejos industriales, los sistemas de mantenimiento han adquirido un enfoque especializado, soportado sobre desarrollos tecnológicos que los han convertido, para la Administración del Mantenimiento, en herramientas absolutamente necesarias para la dirección global de dichas organizaciones. El perfil de las mismas se ha hecho cada vez más complejo ya que la tendencia es la estar integradas por equipos generalmente grandes, variados, ubicados en diferentes frentes de las cadenas de producción, con operaciones automatizadas y vinculadas a sistemas logísticos para el reabastecimiento de insumos cada día más sofisticados en su manejo y operación. A estos aspectos se une la experticia profesional y artesanal, lo cual requiere programas de capacitación y entrenamiento continuos.

Los elementos mencionados hacen aparecer a la función de mantener como una actividad dinámica donde actúan gran cantidad de variables y relaciones funcionales, dentro de un esquema de aleatoriedad que caracteriza al sistema de mantenimiento. En 1967, el Dr. Howard Finley (1) introdujo el concepto de Efectividad de un Sistema como método para modelar las actividades del mantenimiento a objeto de optimizar su gerencia, en este sentido lo definió como:

"La probabilidad que un sistema opere a toda capacidad durante un período de tiempo determinado"

(9)

1.2. Costos asociados.

El concepto de efectividad de un sistema fue asociado a las variables de costo involucradas en el sistema y consecuencialmente se definieron los conceptos de costo directo de mantener, costo redundante y costo de penalización.

El concepto de costo directo de mantener se refiere a la totalidad de los costos necesarios para mantener los equipos operables incluyendo los servicios, reparaciones, inspección y reparaciones mayores. Con relación al costo redundante, éste se refiere a un costo adicional por la condición de mantener equipos en espera, para ponerlos en funcionamiento cuando el equipo principal sale de servicio. Por último el costo de penalización se refiere a las pérdidas de producción, cuando los equipos primarios salen de servicio y no existen equipos en espera.

Las interacciones funcionales de los costos mencionados son sumamente complejas; pero en todo caso, la gerencia define su esquema de actuación conducente a identificar la mejor combinación de los subsistemas asociados al sistema, a objeto de minimizar el costo total de la operación y a optimizar los esfuerzos de mantener un complejo industrial en particular en la mejor condición operacional, dentro de un tiempo determinado.

El esfuerzo de mantener en primer lugar, está asociado de manera directa al tiempo fuera de servicio de una instalación; al efecto, el costo total resultante en la operación es relación directa al esfuerzo de mantener. Por lo tanto, a mayor esfuerzo se comprometen recursos económicos y materiales, razón por la cual se incrementará funcionalmente el tiempo fuera de servicio. Se desprende de esta consideración que por mucho esfuerzo realizado el costo no necesariamente será el óptimo, es más, se podrá incluso hacer anti-económico.

Por otro lado, la caída de un sistema por fallas del mismo o de sus componentes, inducirá un costo de penalización como consecuencia de la pérdida del valor de la producción no colocada en los mercados o comprometida; así se desprende que este costo está exponencialmente asociado al tiempo fuera de servicio y que sumarizado con el costo de mantener determina que el costo directo de mantener se incremente. El costo total, función a su vez del esfuerzo de mantener, tendrá un entorno óptimo, que habrá que determinar técnicamente con la ayuda del análisis de los parámetros de mantenimiento los cuales contribuyen a mantener la efectividad del sistema preparado para su operación en un período de tiempo determinado.

El concepto de sistema se define de la manera siguiente:

"el conjunto de elementos discretos o componentes que interactúan para el cumplimiento de una función determinada".

(10)

1.3. Parámetros de mantenimiento.

La efectividad de un sistema, es función de dos conceptos muy importantes dentro de un enfoque cuantitativo de análisis de la función de mantenimiento: se trata del concepto de disponibilidad.

El concepto de disponibilidad se define como:

"la probabilidad que un sistema, subsistema o equipo este disponible para su uso durante un tiempo dado".

Esta probabilidad, asociada a la probabilidad de tener sistemas, sub-sistemas o equipos instalados con una redundancia determinada, al estar disponibles para su funcionamiento cuando el sistema, subsistema o equipo sale de servicio, permite la obtención de una relación funcional que determina el comportamiento de la Efectividad del sistema.

El concepto de disponibilidad como medida probabilística de que un sistema esté disponible a requerimiento del sistema operativo, es de extraordinaria importancia para la gerencia de mantenimiento. El complemento de este concepto o indisponibilidad de un sistema, subsistema o equipo, se utilizará con frecuencia en los análisis de mantenimiento por la forma práctica que toma el concepto en las aplicaciones computarizadas.

La disponibilidad como parámetro de mantenimiento a su vez es función de dos elementos muy importantes: en primer lugar de la confiabilidad de un sistema, subsistema o equipo y en segundo lugar de la mantenibilidad. El primer elemento se define técnicamente de variadas maneras.

Conejero (2) la define como:

"la característica de un elemento expresada por la probabilidad que cumpla sus funciones específicas durante un tiempo determinado cuando se coloca en las condiciones del medio exterior".

Finley (3) la define como:

"la probabilidad que un equipo no falle mientras esté en servicio durante un período de tiempo dado".

Por último, Valhuerdi y Quintero (4) la definen como:

"la propiedad de un sistema de cumplir las funciones para él previstas, manteniendo su capacidad de trabajo bajo los regímenes y condiciones de explotación prescritos y durante el intervalo de tiempo requerido".

(11)

El segundo elemento, es decir, mantenibilidad se define como:

"la probabilidad que un sistema, subsistema o equipo que ha fallado pueda ser reparado dentro de un período de tiempo determinado".

La determinación de los parámetros confiabilidad y mantenibilidad son determinantes para calcular la disponibilidad de un sistema, sub-sistema, equipo, parte o pieza de una estructura industrial. Ello proporciona los datos fundamentales para el análisis de la función de mantener y de una gerencia efectiva, dentro de un ambiente de sistema total que genera gran cantidad de información técnica y que requerirá de evaluación permanente con ayuda de sistemas computarizados. Este sistema total esta conformado por multitud de factores gerenciales, entre los cuales destacan: la organización, y las políticas, y procedimientos, tales como: control de trabajos, control de costos y reportes gerenciales.

A un mayor esfuerzo en el conocimiento de los indicadores de la gestión de mantener, habrá entonces correlativamente mayor efectividad del sistema, asociado a menores costos de penalización y costos totales mínimos; para tales propósitos, se desprende la necesidad de un monitoreo constante de los parámetros de mantenimiento mediante un sistema de información y de cálculo de variables, utilizando modelos estadístico matemáticos que sirva de apoyo técnico para la planeación y programación de las acciones de mantener.

(12)

II. Confiabilidad de componentes.

2.1. Confiabilidad.

A modo de introducción, abordaremos brevemente los conceptos y términos principales de la teoría de confiabilidad de componentes y sistemas.

Sistema: Conjunto de elementos discretos o componentes que interactúan para el cumplimiento de una función determinada. Subconjuntos de estos componentes pueden, a su vez, denotarse como subsistemas.

Los conceptos de sistema y subsistema son conceptos relativos y dependen de la función que sea objeto de estudio. De acuerdo con la función que se defina pueden variar los límites considerados del sistema y los subsistemas. Lo que en un estudio es sistema, puede que en otro sea subsistema. De igual forma, la definición de los elementos discretos o componentes de un sistema también es relativa y depende del grado de detalle con que queramos descomponer el sistema para su estudio y, en última instancia, de las posibilidades que ofrezca la base de datos disponible. Así, en el caso de un sistema de enfriamiento, uno de los componentes podría ser la bomba, mientras que si disponemos de los datos necesarios, la bomba podría en otro caso considerarse como sistema y sus piezas como componentes.

Confiabilidad: Es la propiedad de un sistema (elemento, componente o pieza) de cumplir las funciones para él previstas, manteniendo su capacidad de trabajo bajo los regímenes y condiciones de explotación prescritos y durante el intervalo de tiempo requerido. Dicho de otra forma, la confiabilidad es la propiedad del sistema de mantenerse sin experimentar un suceso de falla durante el tiempo y las condiciones de explotación establecidos.

Falla: Suceso después del cual el sistema tecnológico deja de cumplir (total o parcialmente) sus funciones. La falla es la alteración de la capacidad de trabajo del componente o sistema.

Las fallas pueden ser clasificadas de acuerdo con una serie de índices, que se recogen de manera general en la tabla 2.1.1.

La falla catastrófica conduce a la alteración de la capacidad de trabajo. A este tipo de falla corresponden la ruptura y el cortocircuito; las fracturas, deformaciones y atascamiento de las piezas mecánicas, etc. Las fallas paramétricas son fallas parciales que conllevan a una degradación de la capacidad de trabajo, pero no a su interrupción total.

Las fallas, como hechos casuales, pueden ser independientes o dependientes. Si la falla de un elemento cualquiera de un sistema no motiva la falla de otros elementos, éste será un hecho o acontecimiento independiente. Si la aparición de la falla en un

(13)

elemento o si la probabilidad de ocurrencia de la falla ha cambiado con la falla de otros elementos, esta falla será un hecho dependiente. Análogamente se definen como dependientes o independientes las fallas de sistemas con respecto a las de otros sistemas.

Indice de clasificación Tipos de fallas

catastrófica Según el grado de influencia en la capacidad de trabajo

paramétrica independiente Según la influencia de fallas de otros elementos

dependiente repentina Según el carácter de su proceso de aparición

gradual estable temporal Según el tiempo de permanencia del estado fallado

Intermitente de interrupción Según el momento en que se manifiesta

de bloqueo revelable Según la forma de su detección

oculta primaria secundaria comando Según la naturaleza de su origen o causas

modo común

Tabla 2.1.1. Clasificación de las fallas.

Las fallas repentinas (inesperadas) aparecen como consecuencia de la variación brusca (catastrófica) de los parámetros fundamentales bajo la acción de factores casuales relacionados con defectos internos de los componentes, con la alteración de los regímenes de funcionamiento o las condiciones de trabajo, o bien con errores del personal de servicio, etc. En las fallas graduales se observa la variación suave de los parámetros debido al envejecimiento y al desgaste de los elementos o de todo el sistema. Las fallas estables son aquellas que se eliminan sólo con la reparación o la regulación, o bien sustituyendo al elemento que falló. Las fallas temporales pueden desaparecer espontáneamente sin la intervención del personal de servicio debido a la desaparición de los motivos que la provocaron. Las causas de tales fallas frecuentemente son los regímenes y condiciones de trabajo anormales. Las fallas temporales que se repiten muchas veces se denominan intermitentes o alternantes. Ellas atestiguan la existencia de anormalidades en la calidad del equipamiento o en regímenes y condiciones de trabajo.

Las fallas de interrupción son las que se producen en el equipamiento en operación interrumpiendo su trabajo. Las fallas de bloqueo impiden el arranque o puesta en funcionamiento de sistemas o componentes sobre la demanda, es decir, bloquean la puesta en funcionamiento de sistemas que están a la espera.

(14)

Las fallas revelables son aquellas que se revelan al personal de operación inmediatamente después de su ocurrencia porque sus efectos se manifiestan directamente en los parámetros de funcionamiento de la instalación tecnológica o se detectan a través del sistema de control. Se trata de fallas de sistemas en funcionamiento, o a la espera con control de sus parámetros. Las fallas ocultas no se revelan al personal de operación por ninguna vía en el momento de su ocurrencia, pero la condición de falla permanente está latente hasta ser descubierta por una prueba o sobre la demanda de operación del sistema en cuestión. Se trata, por tanto, de fallas de sistemas que trabajan a la espera.

Las fallas primarias son intrínsecas del elemento y responden a sus características internas. Las fallas secundarias son debidas a condiciones ambientales o tensiones operativas excesivas impuestas a un elemento desde el exterior. Las fallas comando son las originadas por la operación indebida o la no operación de un elemento iniciador (elemento que controla o limita el flujo de energía que llega al elemento considerado). Dentro de las fallas secundarias y comando se pueden definir las fallas modo o causa común que son aquellas en que fallan varios elementos, producto de una misma causa. 2.1.1. Indices cuantitativos de confiabilidad.

Entre los parámetros fundamentales que caracterizan la confiabilidad de elementos y sistemas se tienen los siguientes:

Probabilidad de trabajo sin fallas o probabilidad de supervivencia: es la probabilidad de que en un intervalo de tiempo prefijado (o en los límites de las horas de trabajo dadas) con regímenes y condiciones de trabajo establecidos no se produzca ninguna falla, es decir, la probabilidad de que el dispositivo dado conserve sus parámetros en los límites prefijados durante un intervalo de tiempo determinado y para condiciones de explotación dadas. La denotaremos por Ps(t). De esta definición se infiere que la probabilidad de supervivencia es el índice a través del cual se cuantifica la confiabilidad de un sistema o elemento técnico. La cuantificación de la confiabilidad como una probabilidad está determinada por el carácter aleatorio del suceso al que está referida (aparición de la falla). Dicho suceso, aunque aleatorio, está condicionado por factores de diseño, calidad de la ejecución y explotación, etc., cuya influencia se refleja en su probabilidad. Por tanto, la influencia de estos factores sobre la confiabilidad también es susceptible de cuantificar.

Probabilidad de falla: es la probabilidad de que en un intervalo de tiempo prefijado se produzca al menos una primera falla. La denotaremos por Pf(t). Puesto que el trabajo defectuoso y el trabajo sin fallas son sucesos complementos, tendremos que:

(15)

Pf(t) = 1 - Ps(t) [2.1.1]

Desde el punto de vista matemático Ps(t) y Pf(t) constituyen funciones de distribución acumulada.

Densidad de fallas: es el número de fallas por unidad de tiempo, referido a la cantidad inicial de elementos de un lote o muestra dada N0. Se representa por f(t). Así:

dN/dt

f(t) = --  [2.1.2] N0

donde: N(t) es el número de componentes que no han fallado (se encuentran operables) al cabo de un tiempo t

N0 es el número inicial de elementos de la muestra en estudio - dN es el diferencial de elementos que fallan en el intervalo (t, t+dt)

Tomando en cuenta las definiciones anteriores de probabilidad de supervivencia y probabilidad de falla, resulta evidente que:

N(t) Ps(t) =  [2.1.3] N0 N0 - N(t) Pf(t) = - [2.1.4] N0

Por tanto, la densidad de fallas puede expresarse en función de Ps(t) o Pf(t), de la forma siguiente:

dPf(t) dPs(t)

f(t) =  = -  [2.1.5] dt dt

La densidad de fallas representa así la función de densidad de probabilidad asociada a la función de distribución acumulada Pf(t), por ello también se conoce como función de densidad de probabilidad de falla (o de la primera falla).

Intensidad de fallas o rata de fallas: es el número de fallas por unidad de tiempo, referido al número de elementos que se encuentran operables en el instante t, y se denota por R(t).

(16)

Así: dN/dt R(t) = - -- [2.1.6] N(t) Si expresamos [2.1.2] como: dN/dt N(t) f(t) = -  •  N(t) N0 resulta que f(t) R(t) =  “ [2.1.7] Ps(t)

Sustituyendo [2.1.5] en [2.1.7] y tomando en cuenta [2.1.1], la rata de fallas también puede expresarse como:

Ps'(t) Pf'(t) f(t)

R(t) = -  =  =  [2.1.8] Ps(t) 1 - Pf(t) 1 - Pf(t)

La intensidad o rata de fallas se expresa cuantitativamente en unidades de tiempo inversas (por lo general horas inversas: 1/h) y se puede interpretar como la probabilidad de que el elemento falle por unidad de tiempo a partir de un instante de tiempo t dado, con la condición de que no haya fallado hasta dicho instante. De ahí que esta magnitud también se identifique como rata de fallas condicional.

- Tiempo medio de operación o servicio (tiempo medio de trabajo sin fallas): número medio de horas de trabajo de un componente hasta la primera falla. Lo denotaremos como TMS (tiempo medio de servicio). Este se puede hallar aproximadamente como: N

_Σ

ti i=1

TMS =  [2.1.9] N

Donde: ti es el tiempo de trabajo sin fallas del i-ésimo elemento. N es el número de elementos del lote de componentes

con que se experimenta.

(17)

la precisión del valor determinado para TMS.

-Tiempo medio de reparación o tiempo promedio para reparar: es el tiempo medio, en horas, de duración de la reparación de un elemento después de experimentar una falla. El valor aproximado del tiempo promedio para reparar (TPPR) podemos hallarlo mediante la expresión: K

_Σ

ti i=1 TPPR =  [2.1.10] K Donde:

K es el número de fallas del elemento dado durante el tiempo de ensayo u observación

ti es el tiempo de duración de la reparación después de la falla i. La rata de reparación µ se define como el inverso de TPPR: 1

µ =  TPPR

2.1.2. Relaciones entre los índices cuantitativos de confiabilidad.

- Relación entre la rata de fallas R(t) y la probabilidad de supervivencia Ps(t).

Si integramos la expresión [2.1.8] como función de Ps(t) en los límites de 0 a t obtenemos:

considerando que para t=0, Ps(0)=1 (componente como nuevo), resulta:

)]

0 (

ln

)

(

ln

[

)

(

0

R

d

Ps

t

Ps

t

−

=

∫

τ

∫

− = tR d t Ps 0 ( ) ) ( ln τ τ

(18)

o sea:

para: R(t) = const. = R

Ps(t) = EXP(-Rt) [2.1.12] Por último, aplicando [2.1.1] se obtiene:

Pf(t) = 1- EXP(-Rt) [2.1.13]”

- Relación entre la densidad de fallas f(t) y la probabilidad de supervivencia Ps(t). Si integramos [2.1.5] se obtienen las siguientes expresiones:

- Relación entre la densidad de fallas f(t) y la rata de fallas R(t). De [2.1.7] se obtiene:

f(t) = R(t).Ps(t)

y sustituyendo Ps(t) por [2.1.11] arribamos a:

- Relación entre el tiempo medio de servicio y la rata de fallas.

El TMS se determina como el valor esperado del tiempo t hasta la falla, que sigue una función de densidad de probabilidad f(t). Así pues, su expresión general será:

[2.1.11] [2.1.14] [2.1.15] [2.1.16]

∫

−

=

Exp

t

R

d

t

Ps

0

(

)

(

)

(

τ

∫

=

t

f

d

t

Pf

0

(

)

(

τ

∫

−

=

t

f

d

t

Ps

0

(

)

1 )

(

τ

∫

− =R t Exp tR d t f 0 ( ) ) ( ). ( ) ( τ τ

(19)

Sustituyendo f(t) en función de Ps(t) tomando en cuenta [2.1.5], resulta:

Cuando esta expresión se integra por partes se obtiene:

Consideremos el caso particular en que la rata de fallas es constante. Bajo estas condiciones Ps(t) viene dada por [2.1.12] y [2.1.17] se transforma en:

de donde se obtiene finalmente:

TMS = 1/R [2.1.18]

Esta relación entre TMS y R (constante) es muy importante y determina que en la práctica R y TMS sean usados indistintamente como datos de partida para los análisis de confiabilidad.

2.1.3. Variación de la confiabilidad de los elementos en función del tiempo.

La curva de R(t) en función del tiempo para un elemento dado sigue en la mayoría de los casos un comportamiento típico como el mostrado en la figura 2.1.1, que por su forma característica recibe el nombre de "curva de la bañera". Esta curva puede dividirse en tres partes. La primera parte es el período inicial de trabajo del elemento donde pueden producirse fallas tempranas debido a deficiencias en el control de la

[2.1.17]

∫

∞ = 0 ) ( dtt tf TMS

∫

∞ − = 0 ) ( dtt Ps TMS

∫

∞ = 0 ) (t tdPs TMS

∫

∞ − = 0 ) ( Rt dt Exp TMS

(20)

calidad. Los fabricantes acostumbran someter a prueba los elementos durante este período para corregir tales fallas tempranas. La segunda parte se caracteriza por una rata de fallas aproximadamente constante. En esta parte de la curva podemos considerar las fallas como aleatorias e independientes del tiempo. Este es el período de vida útil del elemento, al cual podemos asociar una distribución de probabilidad de falla de tipo exponencial como la expresada por [2.1.13] La tercera parte de la curva, en la que se produce un aumento sostenido de R(t) corresponde a la salida de servicio acelerada de los elementos debido al desgaste y el envejecimiento.

Fig. 2.1.1. Comportamiento típico de la rata de fallas de un elemento.

Para el caso particular de sistemas de alta responsabilidad, como los sistemas de seguridad de industrias de alto riesgo, las fallas tempranas tienden a ser aleatorias (R constante) debido a los altos requerimientos del control de calidad, mientras que el mantenimiento y reposición de componentes contribuyen a alargar el período de vida útil, protegiendo los sistemas contra el desgaste y el envejecimiento. Por otro lado, cuando los dispositivos fallan de forma no frecuente y son complejos y costosos, no pueden ser realizadas muchas pruebas para caracterizar su confiabilidad. Solo se pueden realizar estimaciones de R(t). Por ello, lo usual en los análisis de confiabilidad y de cuantificación de la seguridad es asumir las fallas aleatorias, de modo que R(t) es igual a un valor constante R.

Ello determina que la distribución de probabilidad más usada para la modelación de la confiabilidad de componentes sea la distribución exponencial, caracterizada por las expresiones [2.1.12] y [2.1.13]. Esta es la que se emplea por lo general en los análisis de confiabilidad mediante árboles de fallas. Así, en la literatura internacional se acostumbra a caracterizar la confiabilidad de componentes mediante valores de ratas de fallas constantes expresadas en forma de fracciones simples o decimales que dan la probabilidad de fallas por hora de trabajo.

En la tabla 2.1.2 se ilustran ratas de fallas típicas para algunos componentes de sistemas industriales con índices elevados de confiabilidad y seguridad.

(21)

Componente [1/h] Bombas 3E-6 Tuberías 1E-9 Diesels 8E-5 Válvulas 3E-6 Instrumentos 3E-7

Tabla 2.1.2. Ratas de fallas para algunos tipos de componentes de sistemas industriales (5).

(22)

2.2. Distribuciones de probabilidad de las fallas de los

componentes de un sistema.

2.2.1. Distribuciones de probabilidad de Fallas.

A continuación se describen las distribuciones de probabilidad más frecuentemente utilizadas para la descripción de fallas de componentes.

2.2.1.1. Distribuciones discretas.

Dos de las distribuciones discretas de probabilidad más útiles usadas en análisis de fallas son las distribuciones binomial y de Poisson.

Dos parámetros de interés para cualquier distribución discreta de probabilidad P(x) de una variable aleatoria x son la media M y la varianza V(x). Para N salidas posibles, la media es definida como:

N

M =

_Σ

x P(x) [2.2.1] x=0

mientras la varianza, que mide la desviación de los valores alrededor de la media, es: N

V(x) =

_Σ

(x-M)2 P(x) [2.2.2] x=0

- Distribución Binominal.

En el más simple de los sistemas hay sólo dos salidas, o el sistema funciona a la demanda o falla. Estas dos probabilidades son complementarias por lo que:

P(D) = 1 - P(D) [2.2.3]

donde D es el suceso que representa el éxito y D la falla.

Supongamos que la actuación de un sistema no es conocida y que se va a realizar un experimento consistente de N demandas o ensayos. Se especifica que las demandas son independientes (ensayos Bernoulli) tal que P(D) es constante para cada ensayo. Para describir el experimento con la distribución binominal es necesario que el orden de los sucesos no afecte el resultado del experimento. Los posibles resultados corresponden a los diferentes términos del desarrollo binomial de la ecuación.

[P(D)+P(D)]N = 1 [2.2.4]

(23)

Sea q = P(D) la probabilidad de falla e introduzcamos la variable aleatoria discreta x, definida como el número de demandas para las que el sistema falla. Esta variable sigue la distribución binomial, con parámetro q e índice N. La probabilidad de que ocurran x fallas, es obtenida seleccionando al término apropiado del desarrollo binomial de la ecuación [2.2.4] y tiene la forma:

N!

P(x) =  qx(1-q)N-x [2.2.5] x! (N-x)!

Se puede demostrar que para la distribución binomial M = Nq [2.2.6]

V(x) = Nq(1-q) [2.2.7]

Otra distribución de probabilidad obtenida de la [2.2.5] es la función de distribución acumulada de que el sistema falle para Z o menos demandas. Se obtiene por adición de los términos apropiados en el desarrollo de la Ecuación [2.2.4]:

Z

P(x ≤ Z)=

Σ

P(x) [2.2.8] x=0

Así la probabilidad de que el sistema falle para Z+1 o más demandas sería, el complemento de P(x>=Z),

Z

P(x > Z)= 1 -

_Σ

P(x) [2.2.9] x=0

La distribución binomial es usada en ingeniería de confiabilidad para describir un componente único que opera a la demanda y puede ser reparado quedando en un estado "como nuevo" inmediatamente después de que falla. Entonces P(x) es la probabilidad de que el componente falle x veces en N demandas.

Una segunda aplicación de esta distribución para análisis de fallas se refiere al caso de N componentes idénticos, con una probabilidad de falla q igual para todos. Entonces P(x) describe la probabilidad de que fallen x de los N componentes del sistema.

- Distribución de Poisson.

La distribución de Poisson es similar a la binomial en el hecho de que describe fenómenos para los cuales la probabilidad promedio de un suceso es constante e independiente del número de sucesos previos. En este caso, sin embargo, el sistema experimenta transiciones aleatoriamente desde un estado con N ocurrencias

(24)

de un suceso a otro con N+1 ocurrencias, en un proceso que es irreversible. Es decir, el ordenamiento de los sucesos no puede ser intercambiado. Otra distinción entre las distribuciones binomial y de Poisson es que para el proceso de Poisson el número de sucesos posibles debe ser grande.

La distribución de Poisson puede ser deducida a partir de la identidad EXP(-M).EXP(M) = 1 [2.2.10]

donde el número más probable de ocurrencias del suceso es M.

Si el factor EXP(M) es expandido en un desarrollo de series de potencias, la probabilidad P(x) de que exactamente x ocurrencias aleatorias tengan lugar puede inferirse como el x-esimo término en la serie, de donde se obtiene:

EXP(-M).Mx

P(x) =  x = 0,1,2,3,... [2.2.11] x!

La media y la varianza de la distribución de Poisson son ambas iguales a M.

La función de distribución acumulada de que un suceso ocurra Z o menos veces, viene dada por la expresión general [2.2.8], tomando en cuenta que P(x) en este caso se describe mediante [2.2.11]. Así pues,

Z EXP(-M).Mx

P(x ≤ Z)=

Σ

 [2.2.12] x=0 x!

Por supuesto la probabilidad de que un suceso ocurra Z+1 o más veces es el complemento de [2.2.12], es decir, 1 - P(x>=Z).

La distribución de Poisson es útil para el análisis de la falla de un sistema que consta de un número grande de componentes idénticos que al fallar causan transiciones irreversibles en el sistema. Cada componente se asume que falla independientemente y aleatoriamente. Entonces M es el número más probable de fallas del sistema durante la vida útil.

2.2.1.2. Distribuciones continuas.

Para análisis de fallas los valores de la variable aleatoria tiempo hasta la falla se encuentran en el intervalo [0,ì“]. En este caso el valor medio de una distribución está dado por:

(25)

y la varianza

- Las distribuciones de Erlang y Exponencial.

La distribución de Erlang es la forma dependiente del tiempo de la distribución discreta de Poisson. Ella aparece frecuentemente en los cálculos de ingeniería de confiabilidad que consideran fallas aleatorias, esto es, aquellas fallas para las que la rata de fallas R(t) es una constante R. Su expresión puede deducirse a partir de la expresión [2.2.11] hasta obtener finalmente la distribución de Erlang como:

R.(Rt)x-1.EXP(-Rt)

f(t)=  R>0 , x>0 [2.2.15] (x-1)!

La distribución de Erlang es válida para un número entero de fallas x. El caso particular más importante es para x=1, en el que se obtiene la distribución exponencial. f(t)= R EXP(-Rt) [2.2.16]

La función de distribución acumulada de fallas para la distribución exponencial es:

Pf(t)= 1 - EXP(-Rt) [2.2.17] y los dos momentos son:

1 1

M =  , V(t) =  [2.2.18] R R2

- Distribución Logaritmo normal.

La distribución logaritmo normal de una variable t es una distribución para la cual el logaritmo de t sigue una distribución normal o gaussiana. La ecuación que

[2.2.13] [2.2.14]

∫

∞ = 0 tf( dtt) M

∫

∞

−

=

0 2

₍

₎

)

(

t

M

f

t

dt

V

(26)

describe la distribución de probabilidad de falla en este caso se puede escribir como: 1 ln2 (t/β)

f(t)=  EXP(-) [2.2.19] (2π)½αt 2 α2

El parámetro à“ (adimensional) y el parámetro á“ (en unidades de tiempo) determinan la forma de f(t).

La densidad de probabilidad de fallas se presenta en la figura 2.2.1 donde se puede apreciar que la distribución es oblicua hacia la derecha comparada con la distribución de Gauss, que es simétrica respecto a su valor medio. La oblicuidad se acentúa con valores crecientes de α.

La función de distribución acumulada se halla integrando la expresión [2.2.19], de donde se obtiene: 1 Pf(t) =  [ 1 – erf (z) ] para t<β 2 1 =  [ 1 + erf(z) ] para t>β [2.2.20] 2

donde Z se define como:

y erf es la función de error, que aparece tabulada.

La media y la varianza de la distribución logaritmo normal, obtenidas a partir de [2.2.13] y [2.2.14] son: M = β EXP( α2/2 ) V(t) = β2 EXP(α2 ) [ EXP(α2 ) - 1 ] [2.2.22] [2.2.21] α β 2 ) / ln(t Z =

(27)

Fig. 2.2.1. Densidad de probabilidad de fallas según la distribución logaritmo normal.

La distribución logaritmo normal aparece en procesos en los que el cambio en una variable aleatoria en el n-esimo paso es una proporción aleatoria de la variable en el paso (n-1)-esimo. Es decir, la distribución logaritmo normal se emplea cuando la variación está caracterizada por factores o porcientos. Así, si X representa una cantidad que puede variar con un factor de error f, abarcando un rango de valores desde X0 /f hasta X0 f, donde X0 es un punto medio de referencia dado, la distribución logaritmo normal es la distribución adecuada para describir el fenómeno.

La distribución logaritmo normal se aplica con frecuencia para describir las fallas en los análisis de confiabilidad y riesgo de sucesos raros (de baja probabilidad), en los que la información estadística limitada hace que las ratas de falla varíen por factores. Por ejemplo una rata de fallas estimada en 10-6/h puede variar de 10-5 a 10-7/h si el factor de error es 10. Cuando la rata de fallas se expresa como 10-x, donde x es un cierto exponente, el uso de la distribución logaritmo normal implica que el exponente satisface una distribución normal. Así, se puede ver la distribución logaritmo normal como apropiada para situaciones en las que hay incertidumbres grandes en los parámetros de fallas.

Otra característica de la distribución logaritmo normal es que la oblicuidad para tiempos mayores considera el comportamiento general de los datos para fenómenos poco probables ya que la misma tiene en cuenta la ocurrencia de valores poco frecuentes pero con una gran desviación, tales como ratas de fallas anómalas debido a defectos de lotes de producción, degradación ambiental y otras causas.

(28)

- Distribución de Weibull.

La distribución de Weibull es una distribución de fallas muy general y ampliamente difundida por su aplicabilidad a un gran número de situaciones diversas. La densidad de fallas es:

La función de distribución acumulada, el valor medio y la varianza, vienen dados por las siguientes expresiones:

Pf(t) = 1 - EXP[-(t / v )K] [2.2.24] M = v Γ(1 + K-1) [2.2.25]

V(t) = v2 {Γ (1 + 2K-1) - [Γ (1 + K-1)]2} [2.2.26]

donde Γ representa la función Gamma, que aparece tabulada.

La forma de la distribución depende primariamente del parámetro K, como se aprecia en la figura 2.2.2. Para K=1, se obtiene la distribución exponencial, con rata de fallas R = v-1. Al incrementarse K la distribución de Weibull tiende a la distribución normal siendo ambas casi indistintas para K mayor que 4. Un caso particular es la distribución de Rayleigh que se obtiene para K=2.

Las aplicaciones de la distribución de Weibull se pueden comprender más fácilmente a partir de la expresión de la rata de fallas para esta distribución:

Así pues, el modelo de Weibull es el apropiado para el ajuste de datos en los que la probabilidad condicional de fallas R(t) satisface una ley de potencia del tiempo. Ratas de fallas de este tipo se ilustran en la figura 2.2.3.

[2.2.23] [2.2.27]    −     = − v t Exp v t v K t f k 1 ) ( 1 ) ( −     = k v t v K t R

(29)

Fig. 2.2.2. Densidad de probabilidad de fallas según la distribución de Weibull.

Fig. 2.2.3. Rata de fallas según la distribución de Weibull.

La aplicación de la distribución de Weibull está sujeta a la cuantificación de los coeficientes "v" y "k" cuyas magnitudes dependen de la serie histórica de los tiempos de operación o corrida de un equipo o componente.

(30)

La cuantificación de los coeficientes o estimadores ha recibido importante atención de Khirosi y Mieko, 1963; Johnson, 1964; C.Cohen, 1965; Weibull 1964 y Finley 1977 (6). A partir de los métodos de Cohen y la aplicación del Método de Máxima Verosimilitud obtendremos soluciones aproximadas pero confiables de los coeficientes "v" y "k" y a partir de allí derivar las estimaciones de la rata de fallas, probabilidades de supervivencia y probabilidades de falla. Así mismo, evaluaciones matemáticas del comportamiento de estos indicadores para diferentes períodos de tiempo.

Sea la función de densidad de Weibull: K t

f(t) = . tK-1 EXP [ - ()K ] para t>0,K>0,v>0 vK v

Sea "L" la función de máxima verosimilitud, dependiente de una variable "A". La solución de la ecuación consiste en estimar el valor de "A" para el cual "L" asume un valor máximo.

Como "Log L" presenta un máximo al mismo valor de "A", la ecuación a resolver es: dLog L

 = 0 dA

Donde la función de verosimilitud, según H. Kramer, de una muestra de n observaciones es:

L(x1,x2,x3,...xn) = f(x1,A).f(x2,A).f(x3,A)...f(xn,A)

Si los valores de la muestra han sido dados y la función de "L" es de una variable "A", la función de verosimilitud para la muestra completa utilizando la función de Weibull es: N K ti

L(t1,t2,...tn) =

_Π

. ti.K-1 EXP [- () K] [2.2.28] I=1 v K v

tomando logaritmo y derivando con respecto a V y K e igualando a cero tenemos: δLn [L(ti,i=1...,n)] n.k k n ti

 = -  +  ⋅

Σ

()K = 0

(31)

δLn [L(ti,i=1...,n)] n n n ti ti  = -  - nlnv+

Σ

ln ti +

_Σ

ln  ()K = 0 δK K i=1 i=1 v v Eliminando V y simplificando: 1 n 1 n n 

Σ

ln ti = -  +

Σ

ti ln ti /

_Σ

ti K n i=1 K i=1 i=1 n ti K

v = [

_Σ

 ] 1/K [2.2.29]

i=1 n

Por iteraciones sucesivas, al efecto, una estimación de "K" se puede obtener mediante el método de Newton-Raphson cuya técnica numérica permite encontrar la raíz de una función F(x), y eliminar el error asegurando el valor de "K". Bajo estas condiciones si Ki es la aproximación de una raíz, una nueva estimación está dada por:

F(Ki)

Ki+1 = Ki -  [2.2.30] F'(Ki)

la función queda definida por: 1 1

F(k) =

_Σ

(ti) K.lnti - 

Σ

ti K - 

Σ

lnti.ti K k n

1 1

F'(x) =

_Σ

(ti) K.(lnti) 2 - 

Σ

lnti.ti K + 

Σ

ti K -... K K2

1

- 

Σ

ln ti

_Σ

lnti.ti K [2.2.31] n

donde:

Ki+1-Ki<e siendo e=error de aproximación.

0 F(Ki)≠

(32)

Prefijado e se limita el proceso iterativo para el cálculo de k, calculado éste se calcula v obteniendo la estimación por máxima verosimilitud de la función de Weibull. Con los estimados correspondientes se obtienen la rata de fallas, probabilidad de falla, de supervivencia y los estimados del promedio y la varianza. Los cálculos respectivos han permitido la construcción de un modelo para obtener los parámetros de confiabilidad, cuyo programa computarizado ha sido denominado PARAMAN.

A continuación definimos los datos de entrada, caracterizados por el tiempo de corrida al estado entre la base de la hora y fecha de arranque del equipo y la fecha y hora de parada caracterizando la razón de las fallas. Estos datos se convierten en variables xi de la muestra, se ordenan de manera creciente y finalmente se suavizan exponencialmente para mejorar en homogeneidad, logrado este aspecto se procede al cálculo de los indicadores de confiabilidad y se disponen para la respectiva simulación atendiendo a diferentes períodos de tiempo.

El modelo matemático computarizado PARAMAN, que forma parte de un Sistema de Información Gerencial de Mantenimiento, calcula la probabilidad que un equipo se encuentre en operación o sea reparado en un lapso determinado, a partir del comportamiento mismo del equipo, el cual se caracteriza por los tiempos de operación y los tiempos durante los cuales está detenido por reparación. La distribución de los tiempos de operación y de parada se asocian a funciones probabilísticas que permiten encontrar los parámetros de confiabilidad y mantenibilidad, cuya combinación da origen a la disponibilidad y ofrece, además la posibilidad de efectuar simulaciones sobre la base de diferentes períodos de tiempo.

El modelo PARAMAN determina la rata de fallas, el factor "k" que establece el ciclo de vida del equipo, la edad característica de corrida, y evalúa las probabilidades de supervivencia y de falla. Estos elementos entran en el cálculo de los tiempos medios entre paradas y su respectiva varianza.

En el caso de mantenibilidad, se define la función de probabilidades que calcula la posibilidad que un trabajo de mantenimiento se efectúe en un tiempo determinado, la edad característica para reparar, su varianza y los tiempos medios.

Resumiendo, el modelo PARAMAN permite obtener:

- Historial de un componente, equipo o planta ( arranques, paradas, causas de la parada)

- Probabilidades de supervivencia y falla - Tiempos de operación entre arranque y falla - Tiempos fuera de servicio

- Disponibilidad para cada corrida

- Tiempos medios entre fallas, fuera de servicio y disponibilidad total

(33)

- Parámetros de Weibull (tiempo de corrida característico "v", factor "k", desviación estándar del tiempo medio entre fallas, rata de fallas)

- Parámetros de Gumbel (Factor de forma "A", tiempo característico de parada "U")

- Probabilidades de falla y tiempos de reparación (calculados por simulación para diferentes valores de tiempo)

En (7) podrá encontrar una información más detallada sobre el sistema PARAMAN.

2.3. Bases de datos de confiabilidad.

2.3.1. El teorema de Bayes y la confiabilidad.

La determinación experimental de datos de confiabilidad de componentes para una industria en específico puede confrontar dificultades cuando las fallas son sucesos raros. Por ello en ocasiones es necesario recurrir a datos de componentes similares en otras industrias donde se disponga de una mayor estadística de fallas y hacer un proceso de "ajuste" de estos a la experiencia de explotación de la instalación que se analiza. Puede también darse el caso de datos genéricos para industrias de una tecnología dada que se quieren ajustar a los componentes análogos de la tecnología propia.

Para ello juega un papel importante el llamado Teorema de Bayes de la Teoría de las Probabilidades.

- Teorema de Bayes.

Sea un espacio muestral S, dividido en N sucesos A1...AN mutuamente excluyentes, tales que A1+A2+...+AN=S y otro suceso cualquiera B, subconjunto de S. Entonces, de acuerdo con la definición de probabilidad condicional, tenemos que:

P(Ai.B) = P(Ai/B).P(B) = P(B/Ai).P(Ai)

Igualando el segundo y tercer miembros y despejando obtenemos: P(Ai) P(B/Ai)

P(Ai/B) =  [2.3.1]

P(B)

Si P(B) se expresa a partir de los sucesos A1...AN, se obtiene finalmente la expresión del Teorema de Bayes:

(34)

P(Ai) P(B/Ai)

P(Ai/B) =  [2.3.2]

N

_Σ

P(Ai) P(B/Ai) i=1

La aplicación más importante de la expresión [2.3.2] en análisis de confiabilidad está dirigida al ajuste de datos genéricos o de otras industrias, para ser utilizados en la instalación propia, tomando en cuenta la estadística de fallas acumulada en esta última. Esta aplicación se ilustra en el siguiente ejemplo.

Ejemplo 2.3.1: Supongamos que queremos estimar la rata de fallas de una bomba de baja presión empleada en un sistema de enfriamiento. De la literatura internacional conocemos que las ratas de fallas para bombas similares en otras industrias oscilan en los órdenes 10-3, 10-4, 10-5 [1/h] . De la experiencia de explotación de la tecnología propia se tiene que para una muestra dada de bombas del tipo analizado no se han producido fallas durante 500 horas de trabajo en regímenes de prueba.

En este caso, adoptamos como sucesos Ai las ratas de fallas encontradas en la literatura: A1 es el suceso rata de fallas igual a 10-3, A2 igual a 10-4 , A3 igual a 10-5, las que serán nuestras hipótesis de partida.

El suceso B será el que nos aporta la experiencia propia: 500 horas de trabajo sin falla. Si la rata de fallas fuese 10-3/h, la probabilidad de B (500 horas de trabajo sin fallas) sería: P(B/A1) = (1 - 10-3 . )500

Siendo 10-3 la probabilidad de falla en una hora, 1-10-3 es la probabilidad de supervivencia o de ausencia de fallas en una hora. Este último término, elevado a la potencia 500, equivale a la probabilidad de que no se produzcan fallas en 500 horas, considerando independientes entre sí los sucesos de no falla en cada hora, por lo cual, se obtiene:

P(B/A1) =Exp(- 10-3 .500)= 0.6064

Cálculos similares permiten obtener los valores restantes de P(B/Ai) que se presentan en la tabla 2.3.1. Estos valores contienen el dato de la experiencia propia que combinado con las probabilidades P(Ai) asumidas de otras fuentes conducen a las probabilidades condicionales P(Ai/B).

Si para las probabilidades P(Ai) se asume una distribución uniforme tal que P(Ai)=1/3, aplicando [2.3.2] podemos hallar las probabilidades de que la rata da fallas de la bomba de nuestra industria sea 10-3, 10-4 o 10-5 dada la evidencia B de que no se producen fallas en 500h de trabajo. Estas son las probabilidades condicionales P(Ai/B) de la tabla 2.3.1 para la distribución previa uniforme.

(35)

I 1 2 3 Ai 10-3 10-4 10-5 P(B/Ai) 0.6064 0.9512 0.9950 Distribución previa uniforme P(Ai) 0.3333 0.3333 0.3333 P(Ai/B) 0.2376 0.3726 0.3898 Distribución previa no uniforme P(Ai) 0.1 0.3 0.6 P(Ai/B) 0.0643 0.3026 0.6330

Tabla 2.3.1. Cálculos bayesianos para el ejemplo 2.3.1.

Si hubiésemos sido más realistas en nuestra primera estimación de P(Ai), como muestra la distribución no uniforme de las probabilidades previas P(B/Ai) en la tabla 2.3.1, entonces, como puede apreciarse para el segundo caso de distribución previa no uniforme, la introducción de la información B tiene menor efecto sobre los valores previos P(Ai), pues se observa una mayor concordancia entre los valores de P(Ai) y P(Ai/B).

Los resultados de la tabla 2.3.1 nos permiten concluir que para la bomba del ejemplo 2.3.1 debe adoptarse una rata de fallas entre 10-4 y 10-5, más próxima a 10-5, como podría ser 3.10-5.

Una mayor certeza inicial podría obtenerse con un mejor conocimiento de las características y condiciones de trabajo de las bombas cuyas ratas de falla se tabulan en la literatura, lo que permitiría asociar mayores valores de probabilidad P(A) a las ratas de aquellas cuyas características y condiciones de trabajo se asemejen más a la propia. Así, el análisis bayesiano puede utilizarse para el ajuste de listados genéricos de datos de partida para los análisis cuantitativos de confiabilidad y seguridad, lo cual es muy frecuente en la práctica de realización de estos análisis.

(36)

2.4. Tipos de componentes. Expresiones para la evaluación de su

confiabilidad.

Para la cuantificación de la confiabilidad de componentes nos basaremos en el modelo exponencial, para el cual la rata de fallas es constante.

Al evaluar la confiabilidad de un componente es necesario tener en cuenta dos aspectos. En primer lugar el régimen de trabajo bajo el cual se evalúa la confiabilidad, lo cual determina el parámetro que la caracteriza, y en segundo lugar, la posibilidad de restitución de la capacidad de trabajo del componente después de una falla, es decir, si el componente es o no reparable, lo cual determina la expresión a utilizar para el cálculo del parámetro que corresponda.

En lo adelante al referirnos a la confiabilidad o al evaluarla, lo haremos en términos de probabilidad de falla. Ello se debe a un problema práctico. Los valores de confiabilidad de componentes y sistemas de instalaciones de alta responsabilidad, y por tanto de altas exigencias en su calidad, son elevados, muy próximos a la unidad (decimales con varios 9 consecutivos), mientras que su complemento, la probabilidad de falla, son valores muy próximos a cero, fácilmente expresables como potencias negativas de 10.

En cuanto al régimen de trabajo de los componentes existen dos posibles: el régimen de espera, durante el cual el componente permanece listo para entrar en funcionamiento cuando se le requiera, y el régimen de operación. El primero es típico de los sistemas de seguridad o aquellos que permanecen como reserva, los cuales durante la operación de la planta se mantienen a la espera de cualquier suceso accidental o falla que requiera su actuación.

El segundo es típico de los sistemas de operación normal y corresponde también a los sistemas de seguridad durante el período de tiempo que dure el cumplimiento de su función de seguridad después que son demandados (sistemas de seguridad activos).

Las ratas de fallas utilizadas para modelar los componentes deben estar diferenciadas de acuerdo con su régimen de trabajo. Así existen ratas de falla a la espera y ratas de fallas en operación.

También debe tomarse en cuenta la correspondencia del régimen de trabajo con el tiempo analizado. Para el régimen de espera deberá utilizarse, por tanto, la rata de fallas a la espera y el tiempo a la espera (tiempo durante el cual el componente se mantiene "listo" para entrar en funcionamiento) y para el régimen de operación se usará la rata de fallas en operación y el tiempo analizado será el período necesario de operación del componente.

Seguidamente se describen las expresiones para el cálculo de la probabilidad de falla de componentes, según su clasificación en modos de falla a la espera y en operación y de acuerdo a los tipos de componentes que emplea el algoritmo base para los

(37)

modelos computarizados denominado Análisis de Riesgo y Confiabilidad (sistema ARCON).

- Componentes a la espera.

Para la evaluación de la probabilidad de falla de componentes a la espera definiremos una nueva magnitud que es la disponibilidad del componente.

La disponibilidad se define como la probabilidad de que el componente esté apto o listo para actuar u operar en el momento que sea requerido. Por razones similares a las planteadas para la fiabilidad trabajaremos no con la disponibilidad de los componentes sino con su complemento (1 - disponibilidad) que llamaremos indisponibilidad y denotaremos por q(t).

Así, la indisponibilidad q(t) se define como la probabilidad de que un componente esté en estado fallado en el instante t y no sea posible su actuación si es requerida (falla de bloqueo). Como se aprecia, se trata de una magnitud puntual que evalúa la probabilidad del estado fallado en un instante t, a diferencia de la probabilidad de falla para sistemas en operación dada por [2.1.13], que es una función de distribución acumulada que da la probabilidad de falla (falla de interrupción) para un intervalo de tiempo de 0 a t.

- Componentes tipo 1. Probabilidad de falla fija.

En este caso la indisponibilidad del componente es un valor constante en el tiempo, de modo que:

q(t) = q = cte. [2.4.1]

Los componentes tipo 1 se emplean para modelar aquellos modos de falla, cuya probabilidad es uniforme en el tiempo, así como en aquellos casos en que no se cuenta con información suficiente para determinar una ley de variación de la indisponibilidad en el tiempo de acuerdo a otro modelo.

Un modo de falla al cual se aplica este modelo es al error humano, por ejemplo, el suceso de una válvula manual dejada en posición incorrecta después de un mantenimiento. En este caso un valor típico es q=2.10-2, lo que representa que en 100 demandas al componente, éste se encontrará como promedio 2 veces en posición incorrecta (indisponible), por el error humano.

- Componentes tipo 2. No controlable.

Se aplica a componentes cuyo estado no es controlado durante todo el tiempo en que el sistema se encuentra a la espera, y que al presentarse la demanda pueden fallar por mecanismos de fallas ocultas. El sistema ARCON da, además, la posibilidad de adicionar a la indisponibilidad de este tipo de componentes una probabilidad

(38)

adicional de falla a la demanda por carga de impacto sobre el componente en el momento que se requiere su actuación.

Así, de la expresión [2.1.13], que corresponde a componentes no reparables cuyo tiempo hasta la falla sigue una distribución exponencial, se obtiene adicionando la indisponibilidad por carga de impacto qad:

q(t) = 1 - EXP(-Rt) + qad [2.4.2]

En ARCON también se incluye un tiempo previo Tpr que el componente haya estado a la espera con anterioridad, sin recibir ningún tipo de mantenimiento que permita considerarlo como nuevo al inicio de nuestro período de observación. Esto modifica [2.4.2] de la siguiente manera:

q(t) = 1 - EXP[-R(Tpr+t)] +qad [2.4.3]

La expresión [2.4.3] tiene un crecimiento exponencial con el tiempo, de modo que la indisponibilidad del componente será una función del instante en que se produzca la demanda. En muchos casos se requiere hallar un valor de indisponibilidad medio, representativo del comportamiento del componente durante el tiempo a la espera T, también conocido como tiempo de observación.

Para el cálculo de la indisponibilidad media del componente aplicamos la expresión general:

Sustituyendo [2.4.3] e integrando, se obtiene finalmente: _ 1

q = 1 -  {EXP[-RTpr] - EXP[-R(Tpr+T)]} + qad [2.4.4]

RT

- Componentes tipo 3. Controlado de forma continua.

Se aplica a los componentes cuya falla se detecta en cuanto se produce y son sometidos de inmediato a la reparación. Para un sistema a la espera este puede ser un tanque, cuyo salidero se detecta inmediatamente por un medidor de nivel con indicación o señal de alarma en un panel. Se trata por tanto de una falla revelable.

En este caso la indisponibilidad del componente se determina a partir del balance entre los procesos de rotura y reparación, dados por la ecuación diferencial:

q(t+dt)= [1 - q(t)].Rdt + q(t).[1 - µdt] [2.4.5]

∫

= Tq t dt T q 0 ( ) 1

(39)

En [2.4.5] se determina la indisponibilidad en t+dt correspondiente al miembro de la izquierda a partir de la indisponibilidad que había en t mediante los dos términos del miembro de la derecha. De ellos, el primero representa la probabilidad que tiene el componente de estar disponible en t y fallar en t+dt, mientras que el segundo corresponde a la probabilidad de estar fallado en t y no ser reparado en t+dt. Integrando [2.4.5] y teniendo en cuenta la condición inicial q(0)=0, se obtiene finalmente:

R

q(t) =  { 1 - EXP[-( R + µ ) t ] } + qad [2.4.6]

R + µ

En [2.4.6] se incorporó además la probabilidad de falla adicional que eventualmente puede tomar en cuenta posibles cargas de impacto sobre el componente en el instante de la demanda.

El componente tipo 3 tiene una indisponibilidad inicialmente creciente en el tiempo, pero que se estabiliza rápidamente en su valor asintótico. Por ello, en el cálculo de la indisponibilidad de este tipo de componentes se emplea habitualmente la expresión [2,4.7], que es el valor asintótico de [2.4.6].

_ R

q =  + qad [2.4.7] R + µ

- Componentes tipo 4. Probado periódicamente.

Este es el caso de los componentes cuyo estado se comprueba cada cierto tiempo Tp mediante una prueba o ensayo de duración τ que permite detectar las fallas del componente. En los casos en que el componente se encuentra fallado se procede a su reparación.

La prueba puede tener una cierta ineficiencia, de modo que de la rata de fallas total sólo se detecta una fracción que llamaremos ineficiencia de la prueba y denotaremos por Inef. Así, la rata de fallas se desdobla en dos componentes, la rata de fallas detectables Rdet y la rata de fallas no detectables Rno, cuyas expresiones son:

Rdet = R.(1-Inef). [2.4.8]

Rno = R.Inef. [2.4.9]

La indisponibilidad de un componente de este tipo tiene un carácter periódico, y puede dividirse en tres zonas principales:

(40)

- Durante la prueba. La contribución de la prueba a la indisponibilidad viene dada por la expresión: τ qp =  pnt [2.4.10] Tp

donde el cociente representa la probabilidad de que al presentarse una demanda el componente este en prueba y pnt es la llamada probabilidad de no-tránsito del estado de la prueba al estado del componente para el cumplimiento de su misión. La probabilidad pnt representa la indisponibilidad del componente durante la prueba.

- Durante la reparación posterior a la prueba (sí se detecta fallado).

Al realizar la prueba, el componente ha permanecido a la espera durante un tiempo Tp - τ. La probabilidad de llegar a la prueba fallado, será, de acuerdo con [2.1.13], 1-EXP[-Rdet(Tp-τ)], expresión que se aproxima a Rdet(Tp-τ) para valores de Rdet(Tp- τ) menores que 0.1, lo cual resulta completamente válido en todos los casos de interés.

Tomando en cuenta lo anterior, se puede establecer la siguiente expresión para la indisponibilidad por reparación:

Tr qr = Rdet(Tp- τ) [ .( 1 - phe) + phe ] [2.4.11] Tp- τ donde

Tr es el tiempo medio de reparación del componente(=1/µ); phe es la probabilidad de error humano total, que incluye tanto la probabilidad de no detectar la falla por error en la prueba phep como la probabilidad de que el componente quede indisponible por un error en la reparación pher.

phe = phep + ( 1 - phep ) pher

En la expresión [2.4.11] el primer factor es la probabilidad de que el componente llegue fallado a la prueba. El primer sumando entre corchetes representa la probabilidad de que se produzca la demanda cuando el componente está en reparación, dado que el componente se detecta fallado y se repara correctamente. El segundo sumando es la probabilidad total de error en la prueba o la reparación, que hacen que el componente permanezca indisponible durante todo el tiempo Tp- τ que media hasta la próxima prueba.

Si la expresión [2.4.11] se transforma convenientemente, se obtiene finalmente: