Pasos para la construcción de una Línea base

2. MARCO TEORICO

2.1 METODOLOGÍA PARA LA DETERMINACION Y AJUSTE DE LÍNEA BASE

2.1.2 Pasos para la construcción de una Línea base

2.1.2.1 Definición del periodo base (anual, semestral, trimestral)

Llamamos periodo base a aquel que cubre la influencia de las variables relevantes sobre el consumo de energía. Por ejemplo:

• Si hay influencia de las estaciones del año, debe ser anual.

• Si hay influencia del tipo de referencia producida, debe ser tal que incluya la producción de todas las referencias.

• Si hay influencia de los turnos de operación, debe incluir todos los turnos de operación.

2.1.2.2 Definición de la muestra de datos mínima

• Estimación inicial del número de datos de la muestra: La estimación inicial de los datos de la muestra se realizará cuando no se tiene el valor de . Este se estimará con la siguiente ecuación:

= +

Donde:

0 es la estimación inicial del tamaño de muestra necesario, antes de comenzar el muestreo.

es el coeficiente de varianza, que se define como la desviación estándar de las lecturas dividida por la media. Hasta que pueda estimarse real y la desviación estimación inicial para el .

es el nivel deseado de precisión.

es el valor de distribución normal estándar respecto a la Tabla siguiente, con un número infinito de lecturas y para el nivel de confianza deseado.

Por ejemplo, tiene un valor de 1,96 para un nivel de confianza del 95% (1,64 para

el 90%, 1,28 para el 80% y 0,67 para el 50% de confianza). En la Tabla 2 No se

encuentra el origen de la referencia. se presentan los valores de z utilizados para

diferentes tamaños de muestra y diferentes niveles de confianza, sin embargo, para

los cálculos de tamaño de muestra se utiliza los valores correspondientes a un nivel

de confianza del 95% a menos que se indique lo contrario.

43 Tabla 2. Valores de Z para diferentes tamaños de muestra.

N° de Lecturas Nivel de Confianza N° de Lecturas Nivel de Confianza (Tamaño

muestra) 95% 90% 80% 50% (Tamaño

muestra) 95% 90% 80% 50%

2 12,71 6,31 3,08 1,00 17 2,12 1,75 1,34 0,69

3 4,30 2,92 1,89 0,82 18 2,11 1,74 1,33 0,69

4 3,18 2,35 1,64 0,76 19 2,10 1,73 1,33 0,69

5 2,78 2,13 1,53 0,74 20 2,09 1,73 1,33 0,69

6 2,57 2,02 1,48 0,73 21 2,09 1,72 1,33 0,69

7 2,45 1,94 1,44 0,72 22 2,08 1,72 1,32 0,69

8 2,36 1,89 1,41 0,71 23 2,07 1,72 1,32 0,69

9 2,31 1,86 1,40 0,71 24 2,07 1,71 1,32 0,69

10 2,26 1,83 1,38 0,70 25 2,06 1,71 1,32 0,68

11 2,23 1,81 1,37 0,70 26 2,06 1,71 1,32 0,68

12 2,20 1,80 1,36 0,70 27 2,06 1,71 1,31 0,68

13 2,18 1,78 1,36 0,70 28 2,05 1,70 1,31 0,68

14 2,16 1,77 1,35 0,69 29 2,05 1,70 1,31 0,68

15 2,14 1,76 1,35 0,69 30 2,05 1,70 1,31 0,68

16 2,13 1,75 1,34 0,69 ? 1,96 1,64 1,28 0,67

Fuente: Ecopetrol S.A.

Un ejemplo del cálculo y análisis del tamaño de muestra mínima se presenta a continuación. Para un 90% de confianza con el 10% de precisión y un de 0,5, la estimación inicial del tamaño de muestra necesario ( 0 ) es:

= 1,64 + 0,5

0,1 = 67

El valor mínimo obtenido es 67, sin embargo, es recomendable tener una fuente de datos entre este valor y 20 veces el mismo, o sea: 67< fuente de datos < 20*67.

El valor 67 solo sirve en un año, cuando la población de los datos son horarios (8760 datos horarios posibles > 67*20 = 1.340). En el caso de frecuencias diarias, semanales, mensuales, de consumo de un año, este valor (1.340) es mayor que el de la población y se requiere ajustar.

El coeficiente de varianza es una medida estadística que indica qué tan grande es

la desviación estándar en relación con la media. Se utiliza para comparar la

variabilidad que existe entre dos conjuntos de datos, siempre que ambos tengan la

misma distribución. Se calcula dividiendo la desviación estándar entre la media.

44 =

= ∑ ( − ) _!

" − 1 Donde:

es la desviación estándar la cual se calcula como la raíz cuadrada de la varianza.

Es una medida de dispersión para variables de razón (variables cuantitativas o cantidades racionales y de intervalo).

̅ es la media de la población analizada.

Se debe tener en cuenta que, para determinar el número mínimo de datos de la muestra, se asume un coeficiente de varianza de 0,5.

Para que el número mínimo de datos de la muestra se mantenga, se debe verificar que los datos reales tomados tienen el valor de asumido o menor.

En caso de que no sea así, se debe ampliar la muestra de datos hasta llegar al asumido o recalcular el número mínimo de datos con el real calculado de la muestra tomada.

Cuando se tenga el valor de , el número de datos de la muestra será calculado y no estimado.

• Ajustar la estimación inicial del tamaño de muestra para grupos de datos requeridos: Puede aplicarse el ajuste de población finita. Este ajuste reduce el tamaño de muestra ( ) como sigue:

= ∗ "

+ "

Donde:

0 es el valor de la estimación del tamaño de muestra necesario, antes de comenzar el muestreo.

" es el valor de la población total del periodo representativo del proceso.

45 Tabla 3. Ejemplo de estimación inicial de tamaño de muestra para grupo de datos requeridos.

Frecuencia Población en un

año No. De Datos mínimos

ajustado Rango de datos requeridos

Horaria ⁸⁷⁶⁰ 67*20=1340 67 – 1340

Diaria ³⁶⁵ n=67*365/(67+365)=56,2 57 – 1140

Mensual ¹² n=67*12/(67+12)=10,2 11 - 200 Fuente: propia

2.1.2.3 Filtrado de datos

Para realizar el filtrado físico de datos se debe:

• Identificar los datos operacionales atípicos. Ejemplo: datos iguales a cero, negativos o valores incoherentes para las variables analizadas, eficiencias superiores a 1 y menores a 0 (fuera de rango del proceso), procesos con disminución de entropía, y valores no consecuentes con la realidad del proceso.

• Identificar las causas de ocurrencia de los datos operacionales atípicos.

• Eliminar los datos.

Una vez realizado el filtrado físico se debe determinar si se requiere realizar un filtrado estadístico de los datos. Lo anterior se realiza cuando los datos obtenidos del primer filtro generan un modelo estadístico cuyo grado de significancia entre el consumo de la energía y la variable independiente no es válido.

2.1.2.4 Definición de las variables para elaborar la línea base

Se debe establecer un modelo de predicción entre las variables no controlables del proceso (asociadas a la producción) y el consumo de energía, y uno para las variables controlables (asociadas a la operación y mantenimiento) y el consumo de energía.

Realizar en ambos casos, el análisis de significancia por p-value y determinar las variables más relevantes. De las variables relevantes asociadas a la operación y mantenimiento, se establecen criterios para el control operacional del proceso de producción.

Las variables que se utilizarán en la construcción de la línea base deben cumplir las siguientes condiciones:

• Ser variables relevantes para el consumo energético (determinadas en la revisión energética).

• Ser variables que no dependen de la gestión de la operación y del

mantenimiento.

46 • Ser variables sobre las cuales no podemos actuar, por tanto, deben ser normalizadas para el cálculo del cambio del consumo de energía.

Figura 8. Ejemplos de variables para la construcción de la línea base.

Fuente: propia

El grado de significancia entre la variable relevante y el consumo de energía se determina por una prueba de hipótesis denominada prueba de no asociación o independencia (p-value).

La significancia es la probabilidad de que la relación encontrada entre la variable independiente y el consumo de energía no sea casual y realmente responda a un comportamiento natural del proceso. Lo anterior se expresa cuantitativamente mediante el cálculo del p-value. Esta herramienta se aplica de la siguiente forma:

• Se parte de la hipótesis de que no existe relación entre la variable independiente y el consumo de energía.

• Para que esta hipótesis sea cierta, el valor de p-value debe ser mayor que 0,05, es decir, se requiere un valor de probabilidad de que sea cierta mayor al 5%.

• Si el valor de la probabilidad es inferior a 5%, entonces se rechaza la hipótesis nula (hipótesis de independencia) y se acepta que existe relación entre la variable independiente y el consumo de energía.

Para los casos donde el p-value sea mayor a 0,05, se propone la elaboración de un

gráfico de control para el consumo de energía en el periodo analizado (ver numeral

2.1.2.7)

47 2.1.2.5 Establecer el modelo lineal de línea base energética

Se establece el modelo matemático que se utilizará para describir y estimar el consumo del proceso y/o USEn de acuerdo con las condiciones establecidas por la operación. El modelo se puede representar de la siguiente forma:

• Para un modelo matemático univariable:

= ∗ + %

Donde:

m es la pendiente, expresada en unidades de energía por unidad de producción, o producción equivalente, según el caso.

V es la producción asociada en el periodo establecido.

b es el intercepto de la línea en el eje y, que significa la energía no asociada a la producción promedio en el periodo establecido.

• Para un modelo multivariable:

= + + ⋯ + +

Los modelos multivariables no se pueden presentar en gráficos bidimensionales, por lo que se requiere realizar un arreglo matemático con el fin de mostrar un modelo multivariable como un modelo univariable. Para lograr esto, se toma una de las variables independientes del modelo multivariable como variable de referencia. El resto de las variables independientes se convierten en variables equivalentes de esta variable de referencia, de manera que todas las variables quedan en función de una esta. Una vez que el modelo multivariable se ha convertido en un modelo univariable en función de la variable de referencia, puede representarse en un gráfico cartesiano.

2.1.2.6 Gráfico de dispersión

Modelo múltiple de regresión, se identifican las variables relevantes y se generan

los gráficos de dispersión de consumo de energía vs cada una de las variables

relevantes. Lo anterior se realiza con el objetivo de analizar el comportamiento de

estas variables sobre el consumo de energía.

48 2.1.2.7 Gráfico de control

Este método se propone como alternativa para la elaboración de un modelo de línea base, en los casos donde la variable de interés (producción) resulte con un p-value mayor a 0.05, o la energía tenga un comportamiento estable en todo el rango de valores de producción.

Consiste en realizar un gráfico de tendencia de consumo de energía en el periodo analizado. La línea base es equivalente al promedio del consumo de energía, y la línea meta se elabora a partir de los puntos que se encuentren por debajo de la línea base.

Figura 9. Gráfico de control para el caso de un pozo de extracción por bombeo electrosumergible.

Fuente: propia

2.1.2.8 Análisis de resultados de la línea base Los atributos estadísticos del modelo matemático son:

• El coeficiente de las variables independientes representa la razón de cambio del consumo de energía con el cambio de la variable independiente. Esta razón de cambio incrementa si existe una mayor dependencia del consumo de energía con la variable independiente.

• El valor de la constante del modelo significa el consumo de energía base no

asociado al cambio de las variables independientes. Este consumo de energía

se produce para cualquier valor que tomen las variables independientes. El

consumo de energía base está asociado a otros factores que no son las

variables independientes y que se mantienen fijos en el sistema. Por ejemplo, la

49 iluminación no cambia con el nivel de producción, la climatización o ventilación no cambia con el nivel de producción, la carga en vacío de motores o la carga térmica en vacío de hornos y calderas no cambia con el nivel de producción, la carga en vacío de las bandas transportadoras no cambia con el peso del material transportado, las cargas de recirculación fijas no cambian con el flujo principal bombeado, el consumo por levantamiento de la columna de crudo en un pozo no cambia con el flujo, etc.

El porcentaje del valor del consumo de energía base que entrega el modelo del consumo promedio de energía se denomina porcentaje de energía no asociada a la producción. Mientras menor sea este valor, más eficiente es el proceso y menor es el consumo de energía por unidad de producto realizado.

• La significación del modelo, es decir, si el modelo pasa la hipótesis de que las variaciones de Y son consecuencia por las variaciones de X.

& − '() < 0,05

Mientras menor sea el p-value, más significativa es la relación entre la variable dependiente y la independiente.

• El valor de + o coeficiente de correlación, el cual indica el nivel de la fortaleza de la relación entre , y . Este puede tomar valores entre -1 y 1; es decir, la relación entre las variables puede ser directa o inversa, y entre más se acerque a -1 o1, más fuerte será dicha relación.

• El valor de RRRR ² o coeficiente de determinación representa el porcentaje de las variaciones que puede explicar el modelo; mientras más cercano sea RRRR ² ^{de 1,} mayor cantidad de los cambios de , pueden ser explicados con los cambios de . En caso de los modelos multivariables, el valor de RRRR ² ajustado se utiliza para ver el grado de intensidad o efectividad que tienen las variables independientes en explicar la variable dependiente.

• El nivel de confianza, es decir, el porcentaje de la población que puede ser representada por el modelo con el grado de precisión obtenido.

/ _{01234 1} '( )('56 ≫ / _{01234 1} 5 /'%('

• La precisión absoluta del modelo la cual se define como el intervalo de confianza en que se encuentra el valor real con respecto al estimado calculado por el modelo, para una confiabilidad dada.

89 :;:ó '%;6()/' = / _{01234 1} ∗ 9969 /í&: 6

• La precisión relativa del modelo, la cual es la precisión absoluta expresada en

porcentaje del valor medio de Y (consumo energético).

50 89 :;:ó 9 ('/: ' = 89 :;:ó '%;6()/'

6 ;) 6 5:6 ;/: '56 ∗ 100%

El consumo medio estimado se calcula al evaluar la línea base con la media de las

variables independientes del modelo.

In document ISO 50001 PARA EL MEJORAMIENTO DE (página 42-50)

Pasos para la construcción de una Línea base

2. MARCO TEORICO

2.1 METODOLOGÍA PARA LA DETERMINACION Y AJUSTE DE LÍNEA BASE

2.1.2 Pasos para la construcción de una Línea base

2.1.2.1 Definición del periodo base (anual, semestral, trimestral)

Llamamos periodo base a aquel que cubre la influencia de las variables relevantes sobre el consumo de energía. Por ejemplo:

• Si hay influencia de las estaciones del año, debe ser anual.

• Si hay influencia del tipo de referencia producida, debe ser tal que incluya la producción de todas las referencias.

• Si hay influencia de los turnos de operación, debe incluir todos los turnos de operación.

2.1.2.2 Definición de la muestra de datos mínima

• Estimación inicial del número de datos de la muestra: La estimación inicial de los datos de la muestra se realizará cuando no se tiene el valor de . Este se estimará con la siguiente ecuación:

= +

Donde:

0 es la estimación inicial del tamaño de muestra necesario, antes de comenzar el muestreo.

es el coeficiente de varianza, que se define como la desviación estándar de las lecturas dividida por la media. Hasta que pueda estimarse real y la desviación estimación inicial para el .

es el nivel deseado de precisión.

es el valor de distribución normal estándar respecto a la Tabla siguiente, con un número infinito de lecturas y para el nivel de confianza deseado.

Por ejemplo, tiene un valor de 1,96 para un nivel de confianza del 95% (1,64 para

el 90%, 1,28 para el 80% y 0,67 para el 50% de confianza). En la Tabla 2 No se

encuentra el origen de la referencia. se presentan los valores de z utilizados para

diferentes tamaños de muestra y diferentes niveles de confianza, sin embargo, para

los cálculos de tamaño de muestra se utiliza los valores correspondientes a un nivel

de confianza del 95% a menos que se indique lo contrario.

43

Tabla 2. Valores de Z para diferentes tamaños de muestra.

N° de Lecturas Nivel de Confianza N° de Lecturas Nivel de Confianza (Tamaño

muestra) 95% 90% 80% 50% (Tamaño

muestra) 95% 90% 80% 50%

2 12,71 6,31 3,08 1,00 17 2,12 1,75 1,34 0,69

3 4,30 2,92 1,89 0,82 18 2,11 1,74 1,33 0,69

4 3,18 2,35 1,64 0,76 19 2,10 1,73 1,33 0,69

5 2,78 2,13 1,53 0,74 20 2,09 1,73 1,33 0,69

6 2,57 2,02 1,48 0,73 21 2,09 1,72 1,33 0,69

7 2,45 1,94 1,44 0,72 22 2,08 1,72 1,32 0,69

8 2,36 1,89 1,41 0,71 23 2,07 1,72 1,32 0,69

9 2,31 1,86 1,40 0,71 24 2,07 1,71 1,32 0,69

10 2,26 1,83 1,38 0,70 25 2,06 1,71 1,32 0,68

11 2,23 1,81 1,37 0,70 26 2,06 1,71 1,32 0,68

12 2,20 1,80 1,36 0,70 27 2,06 1,71 1,31 0,68

13 2,18 1,78 1,36 0,70 28 2,05 1,70 1,31 0,68

14 2,16 1,77 1,35 0,69 29 2,05 1,70 1,31 0,68

15 2,14 1,76 1,35 0,69 30 2,05 1,70 1,31 0,68

16 2,13 1,75 1,34 0,69 ? 1,96 1,64 1,28 0,67

Fuente: Ecopetrol S.A.

Un ejemplo del cálculo y análisis del tamaño de muestra mínima se presenta a continuación. Para un 90% de confianza con el 10% de precisión y un de 0,5, la estimación inicial del tamaño de muestra necesario ( 0 ) es:

= 1,64 + 0,5

0,1 = 67

El valor mínimo obtenido es 67, sin embargo, es recomendable tener una fuente de datos entre este valor y 20 veces el mismo, o sea: 67< fuente de datos < 20*67.

El valor 67 solo sirve en un año, cuando la población de los datos son horarios (8760 datos horarios posibles > 67*20 = 1.340). En el caso de frecuencias diarias, semanales, mensuales, de consumo de un año, este valor (1.340) es mayor que el de la población y se requiere ajustar.

El coeficiente de varianza es una medida estadística que indica qué tan grande es

la desviación estándar en relación con la media. Se utiliza para comparar la

variabilidad que existe entre dos conjuntos de datos, siempre que ambos tengan la

misma distribución. Se calcula dividiendo la desviación estándar entre la media.

44

=

= ∑ ( − ) !

" − 1 Donde:

es la desviación estándar la cual se calcula como la raíz cuadrada de la varianza.

Es una medida de dispersión para variables de razón (variables cuantitativas o cantidades racionales y de intervalo).

̅ es la media de la población analizada.

Se debe tener en cuenta que, para determinar el número mínimo de datos de la muestra, se asume un coeficiente de varianza de 0,5.

Para que el número mínimo de datos de la muestra se mantenga, se debe verificar que los datos reales tomados tienen el valor de asumido o menor.

En caso de que no sea así, se debe ampliar la muestra de datos hasta llegar al asumido o recalcular el número mínimo de datos con el real calculado de la muestra tomada.

Cuando se tenga el valor de , el número de datos de la muestra será calculado y no estimado.

• Ajustar la estimación inicial del tamaño de muestra para grupos de datos requeridos: Puede aplicarse el ajuste de población finita. Este ajuste reduce el tamaño de muestra ( ) como sigue:

= ∗ "

+ "

Donde:

0 es el valor de la estimación del tamaño de muestra necesario, antes de comenzar el muestreo.

" es el valor de la población total del periodo representativo del proceso.

45

Tabla 3. Ejemplo de estimación inicial de tamaño de muestra para grupo de datos requeridos.

Frecuencia Población en un

año No. De Datos mínimos

ajustado Rango de datos requeridos

Horaria 8760 67*20=1340 67 – 1340

Diaria 365 n=67*365/(67+365)=56,2 57 – 1140

Mensual 12 n=67*12/(67+12)=10,2 11 - 200 Fuente: propia

2.1.2.3 Filtrado de datos

Para realizar el filtrado físico de datos se debe:

= ∑ ( − ) _!

Horaria ⁸⁷⁶⁰ 67*20=1340 67 – 1340

Diaria ³⁶⁵ n=67*365/(67+365)=56,2 57 – 1140

Mensual ¹² n=67*12/(67+12)=10,2 11 - 200 Fuente: propia

/ _{01234 1} '( )('56 ≫ / _{01234 1} 5 /'%('

89 :;:ó '%;6()/' = / _{01234 1} ∗ 9969 /í&: 6