• No se han encontrado resultados

APLICACIÓN DE PROCESOS DE MINERÍA DE DATOS PARA LA OBTENCIÓN DE MODELOS PREDICTIVOS DE INACTIVACIÓN DE Listeria EN ALIMENTOS

N/A
N/A
Protected

Academic year: 2020

Share "APLICACIÓN DE PROCESOS DE MINERÍA DE DATOS PARA LA OBTENCIÓN DE MODELOS PREDICTIVOS DE INACTIVACIÓN DE Listeria EN ALIMENTOS"

Copied!
11
0
0

Texto completo

(1)

APLICACIÓN DE PROCESOS DE MINERÍA DE DATOS PARA LA

OBTENCIÓN DE MODELOS PREDICTIVOS DE INACTIVACIÓN

DE Listeria EN ALIMENTOS

Francisco J. Garcés1, Bernadette Klotz2*

1,2 Universidad de La Sabana, Facultad de Ingeniería, Campus Universitario del Puente

del Común, km. 7, Autopista Norte de Bogotá, Teléfono: 861 6666 Extensión: 2543.

*bernadette.klotz@unisabana.edu.co, francisco.garces@unisabana.edu.co

RESUMEN

Las enfermedades transmitidas por alimentos y bebidas (ETA) siguen siendo un problema importante de salud pública con un alto impacto social y económico. El US Agricultural Research Service (ARS) estima que el costo de brotes de listeriosis es de US$1.270 por persona infectada. Para la industria de alimentos como para los entes reguladores es claro que las medidas de control deben incluir estrategias eficaces de prevención. La microbiología predictiva con sus herramientas de modelación y bases de datos permite vaticinar el comportamiento de los microorganismos a lo largo de la cadena de producción de un alimento, desde su producción primaria hasta el consumidor. El presente estudio tuvo como propósito utilizar la minería de datos como proceso para extraer información implícita de bases de datos para construir modelos de predicción. De la base de datos ComBase se seleccionaron 316 conjuntos de datos de inactivación de Listeria monocytogenes y L. innocua en caldo de cultivo y leche. Después de analizar sus características de dispersión, valores atípicos o nulos, 262 conjuntos de datos de entrada se utilizaron para generar el modelo de predicción. Las curvas de sobrevivencia presentaron comportamiento lineal (70%), el 30% restante presentan hombros o colas de corta duración con la siguiente distribución: hombros (23%), colas (3%) y hombros y colas (4%). De acuerdo con estas cinéticas de inactivación se evaluó el ajuste del modelo de Weibull y lineal (Bigelow y Esty, 1920) siendo este último el de mejor desempeño. La estimación de la tasa máxima de inactivación (kmax) a diferentes condiciones de temperatura y pH permitió la generación de una superficie de respuesta (R2=0.90), en donde los parámetros del modelo polinómico se estimaron a través de un algoritmo de Levenberg-Marquard. El desempeño del modelo fue satisfactorio con Af de 1.32 y un Bf de 0.98. Estos resultados evidencian la utilidad de los procesos de minería de datos como estrategia preventiva para el control de ETA.

(2)

ABSTRACT

Food borne diseases continue to be a major public health problem with high social and economic costs. It is estimated that costs per person infected with listeriosis is about US$1270. For the food industry and the regulatory agencies is clear that preventive and effective control strategies urge to be implemented. Predictive microbiology with its modeling tools and data bases enables to forecast the behavior of microorganisms along the whole food supply chain, from farm to fork. The purpose of the present study was the construction of predictive models from the information contained in a large data base through a data mining process. A total of 316 sets of inactivation data of Listeria monocytogenes and L. innocua in broth and milk were selected. After the analysis of the experimental data in relationship to dispersion and atypical values, 262 sets of inactivation data were used in the development of the model. The survivor curves showed linear behavior (70%), the 30% showed shoulder or tails of short duration, with the following distribution: shoulders (23%), tails (3%), and shoulder and tails (4%). The goodness of fit of the Weibull and the linear models (Bigelow y Esty, 1920) was assessed in accordance to the observed kinetics of inactivation. The estimation of the maximum inactivation rate (kmax) at different

temperature – pH combinations allowed the construction of a surface response model (R2 = 0.90). The parameters of the polynomial model were estimated through the Levenberg-Marquard algorithm. The performance of the model was satisfactory with an Af of 1.32 and a Bf of 0.98. These results showed the usefulness of data mining processes as a proactive strategy in the control of food borne illnesses.

Key words:Listeria, predictive microbiology, inactivation models, data mining.

I. INTRODUCCIÓN

La Listeria es un patógeno

oportunista ubicuo y potencialmente puede contaminar la gran mayoría de las materias primas agrícolas y alimentos procesados. Desde principios de 1980 la presencia de Listeria en alimentos es una preocupación para la industria de alimentos y las autoridades sanitarias por causar listeriosis, enfermedad de naturaleza severa con niveles de letalidad altos (20 – 30%), especialmente entre mujeres embarazadas, niños y adultos mayores (World Healt Organization, 2007). Por otro lado los costos sociales y económicos establecidos para la enfermedad son altos; alcanzan los US $ 1.270 por persona infectada, de acuerdo con el estudio de Butzby y Roberts (1996).

Listeria es una bacteria Gram positiva, no esporulada, psicrótrofa

capaz de sobrevivir períodos prolongados en diferentes ambientes y por lo tanto puede contaminar un alimento en cualquier eslabón de la cadena de la granja a la mesa. Listeria

monocytogenes crece lentamente a

temperaturas de refrigeración (normalmente de 0 a 8 °C). Según la ICMSF (1996) los rangos de crecimiento para L. monocytogenes

son: temperatura mínima de -0.4 °C y máxima de 45 °C, pH mínimo de 4.39 y máximo de 9.4, actividad de agua mínima (aw) de 0.92.

Listeria monocytogenes no se

considera un organismo

termoresistente y por consiguiente la aplicación de tratamientos térmicos moderados, como es el proceso de pasteurización con temperaturas < 80 °C, es un mecanismo para el control de

(3)

& Brandã, 2009; Muñoz, Guevara, Palop, & Fernández, 2010). Sin embargo, estos trabajos han identificando limitaciones en el desarrollo y aplicabilidad de modelos, por la variabilidad en la sensibilidad a la temperatura de las poblaciones bacterianas y la presencia de poblaciones residuales resistentes (Miller, Gil, & Brandã, 2009). Por esta razón, este tipo de tratamientos térmicos ampliamente utilizados en la industria de alimentos deben optimizarse de acuerdo con las características del proceso y deben validarse para evitar el sobre-procesamiento sin comprometer la inocuidad del producto alimenticio.

La microbiología predictiva se ha consolidado en las últimas dos décadas como una herramienta en el diseño, evaluación y optimización de procesos, en el desarrollo de productos, en el establecimiento de vida útil y más recientemente como herramienta en procesos de evaluación cuantitativa de riesgo microbiano. En el proceso de generación de modelos matemáticos el diseño experimental es un factor crítico y la necesidad de tener un número importante de datos experimentales es esencial para el buen desempeño del modelo.

ComBase (http://www.combase.cc) es una base de datos con conjuntos de datos experimentales (> 50.474) de crecimiento e inactivación microbiana generados en gran parte por el Institute of Food Research (IFR, UK), la Food Standars Agency (UK), el Agricultural Research Service (ARS, USA) y el Food Safety Center (Australia). Esta base de datos es de gran ayuda para la industria de alimentos y las agencias reguladoras ya que permite establecer, a partir de los datos crudos, el posible comportamiento de un determinado microorganismo a combinaciones de diferentes de temperatura, pH y aw, entre otros. Adicionalmente, a partir de esta base de datos se pueden construir modelos primarios (describen la

respuesta del microorganismo a una combinación determinada de factores extrínsecos e intrínsecos) y

secundarios (describen el

comportamiento de los parámetros del modelo en función de las variables independientes) y mediante procesos de minería de datos se puede extraer información procesable que mediante un análisis matemático permite predecir patrones de comportamiento de los microorganismos (Baranyi, Tamplin, & Ross, 2004; Fayyad, Piatetsky-Shapiro, & Smyth, 1996).

La minería de datos es un proceso sistemático para extraer de una gran cantidad de datos información oculta, útil, de importancia estratégica que permite la toma de decisiones basada en conocimiento y un mejor el entendimiento de los fenómenos. Este proceso comprende las siguientes fases: la definición del problema, la preparación y selección de datos, el procesamiento de los datos, la generación y la validación de los modelos (MSDN, 2008).

Aunque la microbiología predictiva, en el contexto de garantizar la inocuidad de los alimentos, es de gran de interés científico con gran número de publicaciones por año, los trabajos en minería de datos son todavía muy incipientes. Koseki (2009) desarrolló a partir de la base de datos Combase una nueva base datos denominada MRV (Microbial Responses Viewer) que contiene datos límite de crecimiento de 30 diferentes microorganismos en diversas matrices.

(4)

desarrollo de modelos probabilísticos y cinéticos a partir de un proceso de minería de datos para predecir la concentración de Staphylococcus aureus a lo largo de la cadena de suministro láctea bajo condiciones fluctuantes de temperatura, pH y aw. El anterior trabajo hace parte del proyecto integrado BIOTRACER en el marco del

programa “EU's Framework

Programme for Research and Technological Development”. En su artículo Beulens y otros (2006) describen las posibilidades de aplicación de procesos de minería de datos para la generación de alarmas preventivas en las cadenas de

suministro para garantizar la calidad de los alimentos. Varias revisiones temáticas destacan el potencial y el valor de esta técnica en los procesos de aseguramiento y control del riesgo microbiológico en alimentos (McMeekin, y otros, 2006; Havelaar, Brul, de Jong, de Jonge, Zwietering, & ter Kuile, 2010).

Trabajos de minería de datos como los mencionados anteriormente se han enfocado a desarrollar modelos en el área de crecimiento microbiano como se muestra en la Figura 1 para el caso de Listeria.

Figura 1: Interfase del software MRV. La gráfica de contorno muestra los conjuntos de datos relacionados con Listeria dentro de los rangos de crecimiento contenidos en la base de datos ComBase.

El presente trabajo de minería de datos se realizó con el fin de desarrollar un modelo para predecir la tasa de inactivación de Listeria en función de la

(5)

II. MATERIALES Y MÉTODOS

Obtención de Datos Objetivo

Los datos de inactivación para L.

monocytogenes y L. inocua se

obtuvieron de Combase. Se seleccionaron las curvas de inactivación con tres o más puntos muestrales, pH entre 4.5 y 7.0, temperaturas entre 50 y 70 ºC y en condiciones aerobias.

Análisis Preliminar y Preparación de datos

Con la finalidad de entender el comportamiento de los conjuntos de datos se realizaron las gráficas de las curvas de inactivación. Por análisis visual se confirmó el comportamiento decreciente de la población bacteriana y se determinó la presencia de hombros o colas.

Ajuste de Datos a Modelos Primarios

El modelo lineal (Bigelow & Esty, 1920) y el modelo Weibull (Mafart, Gaillard, Couvert, & Leguerinel, 2002) fueron utilizados para el ajuste primario de los datos experimentales, utilizando la herramienta GInaFiT 1.5 (Geeraerd, Valdramidis, & Van Impe, 2005) que funciona como complemento de Excel®. La bondad de ajuste de los modelos se determinó en consideración del error cuadrado medio (ECM), el estimado de los parámetros y el coeficiente de determinación (R2) que mide el poder explicativo del modelo lineal.

Modelo Secundario

Se establecieron las relaciones entre el parámetro kmax del modelo lineal

primario, el pH y la temperatura mediante la construcción de una superficie de respuesta con un modelo polinómico de orden dos, utilizando la herramienta “Essential Regression 97 Versión 2.210”. A partir del ANOVA con

un intervalo de confianza del 95%, se establecieron los parámetros representativos del modelo secundario polinómico.

Desempeño de los Modelos

El desempeño del modelo se evaluó utilizando el factor bias (Bf) y el factor de exactitud (Af) (Ross T., 1996).

III. RESULTADOS Y DISCUSIÓN

(6)

del modelo de Weibull (Geeraerd, Valdramidis, & Van Impe, 2005). Por la anterior condición y por la aplicación del principio de parsimonia se decidió continuar con el desarrollo del modelo con la ecuación lineal que se

caracteriza por contener un solo parámetro, la tasa máxima de inactivación (kmax).

Figura 2. Distribución de los conjuntos de datos para Listeria contenido en la base de datos ComBase. Rango de temperatura 50 – 70 °C y rango de pH 4.5 – 7,0.

(7)

El modelo lineal se ajustó satisfactoriamente a los datos experimentales de inactivación de los 316 conjuntos de datos con un R2 entre 0.99 y 0.79 y un CME entre 0.002 y 1.70. A continuación se prosiguió con la generación del modelo final de superficie de respuesta que relaciona

Kmax con las variables independientes de pH y temperatura, utilizando el algoritmo Levenber-Marquard. A partir

del análisis de datos discordantes (outliers), con un criterio de valor absoluto del residuo estándar mayor a 3, se descartaron 54 datos de kmax. El

modelo de superficie de respuesta obtenido, que se muestra en la figura 4,

describe adecuadamente el

comportamiento del parámetro con un R2 de 0.93 y SE de 1.76 (Tabla 1).

Figura 4: Superficie de respuesta de inactivación de Listeria. Valores de kmax a las

diferentes combinaciones de temperatura y pH.

Se hace evidente el efecto sobre

kmaxde la temperatura y la ausencia de

efecto del pH especialmente en los valores de pH >5.4. Así mismo, el análisis de significancia de los parámetros del modelo mostró que solo el efecto de la temperatura es significativo (α=0.95). La figura 4 muestra un efecto visual de “valle” en valores de pH cercanos a 5 y a

temperaturas superiores a 55 ºC que está asociado a la dispersión de los datos en los diferentes pH (datos no presentados).

(8)

modelo de raíz cuadrada muestra un buen R2 con valor de 0.90 y un SE de 2.09 y una mejor estimación de parámetros (Tabla 1). Al hacer algunos cálculos de predicción con este modelo se obtuvieron valores cercanos a los reportados por diferentes fuentes. El

kmax, alcanza un valor de 0 a los 51.2 ºC y difiere aproximadamente en 4 ºC con el valor de límite inferior utilizado por el simulador “Pathogen Modeling Program”:

PMP,http://pmp.arserrc.gov/PMPOnline .aspx) para predecir inactivación de L. monocytogenes en una salsa de carne. Para los datos reportados por (Ross,

Dalgaard, & Tienungoonc, 2000) la diferencia en el valor de límite inferior de crecimiento es de aproximadamente 6 ºC. Sin embargo, estas diferencias se explican en la medida en que existe una zona entre 45 y 55 ºC aproximadamente, en que el

comportamiento de este

microorganismo depende de las condiciones de cultivo y la “historia” que tenga la cepa, presentando fenómenos tanto de crecimiento como de inactivación (Sergelidis & Abrahim, 2009; Bréand, Fardelc, & Flandroisa, 1998).

Tabla 1: Parámetros de las superficies de respuesta

b0 340.71 ± 35.60 237.63 ± 23.47

b1 -10.46 ± 1.104 -9.218 ± 0.798

b2 0.09505 ± 0.00899 0.08998 ± 0.00675

b3 -21.60 ± 3.498

b4 1.275 ± 0.235

b5 0.09911 ± 0.03411

R2 0.926 0.900

SE 1.764 2.088

Al evaluar el desempeño del modelo global se obtuvieron valores de 0.98 para Bf y 1.32 para Af. Estos valores indican que el modelo tiene una tendencia a subestimar en promedio un 2% por debajo de los valores observados, lo que hace que el modelo sea seguro por defecto. Al comparar los tiempos necesarios para alcanzar una reducción de seis ciclos logarítmicos (Tabla 2), entre el modelo obtenido y los datos reportados por Miller y colaboradores (2009), se

(9)

Tabla 2: Tiempo para alcanzar una reducción de 6 ciclos logarítmicos

Temperatura (°C) 6D

a

(min)

6Db

(min) Diferencia %

52.5 298.18 253.80 17.5%

55.0 105.50 70.20 50.3%

57.5 32.33 29.22 10.6%

60.0 11.61 10.98 5.8%

62.5 4.94 4.20 17.5%

65.0 2.40 1.92 24.9%

a

6D calculados a partir del modelo obtenido. b

6D calculados de acuerdo con Miller y colaboradores (2009).

Al analizar los datos de inactivación y particularmente los datos de kmax

obtenidos en los ajustes, se observó una dispersión mayor a tres desviaciones estándar en las temperaturas con mayor número de datos (60 y 70 °C) lo que repercute en la exactitud del modelo (Figura 5). Este comportamiento de correlación o

colinearidad entre la severidad y duración de los tratamientos y la dispersión de los parámetros de respuesta ha sido reportado previamente, tanto en los recuentos, como en los parámetros derivados de los modelos (Muñoz, Guevara, Palop, & Fernández, 2010; Miller, Gil, & Brandã, 2009; Kondjoyan & Portanguen, 2008).

(10)

IV. CONCLUSIONES

Los conjuntos de datos reportados en la base de datos ComBase presentan una gran variabilidad asociada a factores relacionados con las condiciones de inactivación térmica, cepa bacteriana y su estado fisiológico.

No obstante se pudo construir un modelo de superficie de respuesta con una estimación satisfactoria de valores de kmax a diferentes combinaciones de temperatura y pH, de utilidad exploratoria para optimización de procesos pasteurización. Como todo modelo debe de ser validado para su implementación confiable en las condiciones reales del proceso.

V. REFERENCIAS

Baranyi, J., Tamplin, M., & Ross, T. (2004). The ComBase initiative. Microbiology Australia , 25 (3), 32-33.

Beulens, A. J., Lil, Y., Kramer, M. R., & van der Vorst, J. G. (2006)., de http://www.iiasa.ac.at/~marek/ftppub/Pu bs/csm06/beulens_pap.pdf.

Recuperado el 20 de 06 de 2010

Bigelow, W. D., & Esty, J. R. (1920). The thermal death point in relation to typical thermophilic organisms. Journal of Infectious Diseases (27), 602-617.

Bréand, S., Fardelc, G., & Flandroisa, J. P. (1998). Model of the influence of time and mild temperature on Listeria

monocytogenes nonlinear survival

curves. International Journal of Food Microbiology (40), 185–195.

Butzby, J. C., & Roberts, T. (1996). ERS Updates U.S. Foodborne Disease Cost for Seven Pathogens. (U. ERS, Ed.) Food Review , 19 (3), 20-25.

Fayyad, U., Piatetsky-Shapiro, G., & Smyth, P. (1996). From Data Mining to Knowledge Discovery in Databases. AI Magazine, 37-54.

Geeraerd, A. H., Valdramidis, V. P., & Van Impe, J. F. (2005). GInaFiT, a freeware tool to assess non-log-linear microbial survivor curves. International

Journal of Food Microbiology, 102 (1), 95-105.

Havelaar, A. H., Brul, S., de Jong, A., de Jonge, R., Zwietering, M. H., & ter Kuile, B. H. (2010). Future challenges to microbial food safety. International

Journal of Food Microbiology (139), S79–S94.

ICMSF (International Commission on Microbiological Specifications for Foods) (1996). Microorganisms in Foods 5. Characteristics of Microbial Pathogens. Blackie Academic & Professionals.

Kondjoyan, A., & Portanguen, S. (2008). Effect of superheated steam on the inactivation of Listeria innocua

surface-inoculated onto chicken skin.

Journal of Food Engineering (87), 162–

171.

Koseki, S. (2009). Microbial Responses Viewer (MRV): A new ComBase-derived database of microbial responses to food environments. International Journal of Food Microbiology (134), 75-82.

Mafart, P., Gaillard, S., Couvert, O., & Leguerinel, I. (2002). On calculating sterility in thermal preservation methods: applications of the Weibull frequency distribution model. International Journal of Food Micrbobiology (72), 107-113.

McMeekin, T., Baranyi, J., Bowman, J., Dalgaard, P., Kirk, M., Ross, T., y otros. (2006). Review: Information systems in food safety management. International

Journal of Food Microbiology (112), 181–194.

(11)

Influence of strain and growth phase. Food Control (20), 1151–1157.

MSDN. (2008). Conceptos de minería de datos (Analysis Services - Minería

de datos)., de,

http://msdn.microsoft.com/es-es/library/ms174949.aspx Recuperado el 21 de 06 de 2010

Muñoz, M., Guevara, L., Palop, A., & Fernández, P. S. (2010). Prediction of time to growth of Listeria

monocytogenes using Monte Carlo

simulation or regression analysis, influenced by sublethal heat and recovery conditions. Food Microbiology (27), 468-475.

Pin, C., Gómez-Tomé, N., Barker, G., Sanaa, M., Rieu, E., Maffre, A., y otros. (2009). Predicting Staphylococcus

aureus in the dairy chain. 6th

International onference Predictive

Modeling in Foods, p. 95. Washington DC.

Ross, T. (1996). Indices for performance evaluation of predictive models in food microbiology. Journal of Applied Bacteriology (81), 501-508.

Ross, T., Dalgaard, P., & Tienungoonc, S. (2000). Predictive modelling of the growth and survival of Listeria in fishery products. International Journal of Food Microbiology (62), 231–245.

Sergelidis, D., & Abrahim, A. (2009). Review Adaptive response of Listeria monocytogenes to heat and its impact on food safety. Food Control (20), 1-10.

Referencias

Documento similar

[r]

[r]

[r]

Luis Miguel Utrera Navarrete ha presentado la relación de Bienes y Actividades siguientes para la legislatura de 2015-2019, según constan inscritos en el

Fuente de emisión secundaria que afecta a la estación: Combustión en sector residencial y comercial Distancia a la primera vía de tráfico: 3 metros (15 m de ancho)..

Abstract: This paper reviews the dialogue and controversies between the paratexts of a corpus of collections of short novels –and romances– publi- shed from 1624 to 1637:

La campaña ha consistido en la revisión del etiquetado e instrucciones de uso de todos los ter- mómetros digitales comunicados, así como de la documentación técnica adicional de

This section provides guidance with examples on encoding medicinal product packaging information, together with the relationship between Pack Size, Package Item (container)