CAPÍTULO V PROCESAMIENTO Y REPRESENTACIÓN DE LOS DATOS
5.2 Razones para diseñar un software en este trabajo
Este trabajo no fue la excepción, y la necesidad de contar con estas herramientas fue rápidamente identificada. Así es que durante este trabajo se desarrollaron las herramientas necesarias para poder procesar, analizar y visualizar los datos apropiadamente. A continuación se presenta un diagrama de flujo de datos, que es el utilizado por el software desarrollado en esta tesis. Como podemos ver en la figura 5.2.1, son muchos los pasos que se deben seguir para llegar a resultados de simple interpretación, e incluso varios de los pasos son opcionales y se deben aplicar dependiendo de las características de los datos.
161
Figura 5.2.1 Diagrama de flujo de datos utilizado en el software desarrollado para el procesamiento, análisis y detección de los datos obtenidos en los experimentos de LCxLC en línea.
162
A continuación se describen de forma general las características de los datos y los procedimientos correspondientes a las etapas numeradas del 1 al 8 en la figura 5.2.1.
1. Los datos son adquiridos por el software del fabricante de los componentes utilizados para ensamblar el instrumento, Chemstation de Agilent. El experimento bi- dimensional es adquirido como un único cromatograma que contiene todos los ciclos de la segunda dimensión en serie. Este cromatograma es exportado por el software a un archivo de valores separados por comas (CSV) que es leído por el software desarrollado y convertido a un vector que contiene en la primer columna el tiempo en minutos para el cual se obtuvo cada dato y en la segunda columna el valor de la señal en mili unidades de absorbancia (mAU) para cada punto correspondiente de la primera columna.
2. Con los parámetros del experimento, como tiempo de ciclo de la segunda dimensión y la frecuencia de la adquisición de datos del detector, se procede a eliminar la columna correspondiente al tiempo, y se “pliega” cada una de las corridas bi-dimensionales individuales para formar una matriz que contiene cada ciclo muestreado de la primera dimensión en las columnas y cada punto de la segunda dimensión tomado por el detector en las filas.
3. El alineamiento es opcional y puede ser interno o externo. Si es interno, se puede alinear, por ejemplo, cada cromatograma sucesivo de la segunda dimensión al cromatograma anterior, o a uno de referencia. Esto se implementó buscando minimizar el coeficiente de correlación entre el cromatograma a alinear y el de referencia. Si es externo, se busca alinear todo el cromatograma con otro cromatograma bi-dimensional de otro experimento. Esto suele ser de interés en la utilización de métodos quimiométricos como PARAFAC y no fue implementado aún.
163
En general, la alineación intenta solucionar problemas en el diseño o la falta de reproducibilidad del instrumento. Si bien ha sido de utilidad en ciertos casos, se considera que en la medida de lo posible, el problema debe ser corregido en lo instrumental en vez de desarrollar herramientas de software para solucionar problemas del instrumento.
4. La corrección de fondo se realiza a través del método de corrección ortogonal de fondo (oBGc) que se discute en detalle más adelante. Los parámetros permiten seleccionar el método más adecuado según el tipo de datos a procesar.
5. La detección de los picos cromatográficos se realiza en este caso a través de los máximos en la señal invertida obtenida luego de aplicar un filtro gaussiano de derivada segunda en modo de ventana deslizante. De esta forma, el máximo de la señal filtrada corresponde a la posición del máximo en el cromatograma original de donde se lee el valor de absorbancia. Los dos mínimos antes y después de cada máximo, corresponden a los puntos de inflexión de un pico (aproximadamente) gaussiano que pueden utilizarse para estimar el ancho del pico. Alternativamente se implementó un filtro gaussiano de derivada primera en modo de ventana deslizante para detectar los límites de integración según el método clásico.
6. Idealmente, la segunda dimensión debe ser lo suficientemente rápida como para poder tomar varias muestras de cada pico cromatográfico que eluye de la primera dimensión. Si esto no fuera así, durante el proceso de muestreo de la primera dimensión, estaríamos juntando lo que ya fue separado. Peters et al. (1) desarrollaron
un algoritmo para poder determinar si dos picos encontrados en cromatogramas sucesivos de la segunda dimensión, corresponden o no, al mismo pico cromatográfico de la primera dimensión. Los parámetros que se utilizan para la decisión son el criterio de superposición de los picos y el criterio de unimodalidad. En el software
164
aquí desarrollado se realizó una implementación del algoritmo como fue descripto en el trabajo antes mencionado.
7. Una vez detectados los picos individuales de cada cromatograma y agrupados según el criterio mencionado en el inciso anterior, se pueden obtener las características de los picos bi-dimensionales encontrados. En la implementación actual se pueden reportar los siguientes datos de los picos:
a. Tiempo de retención en la primera dimensión, calculado a través del promedio de los tiempos de retención, ponderados por la altura de los picos de fracciones sucesivas muestreadas para cada uno de los componentes de un único pico de la primera dimensión.
b. Tiempo de retención en la segunda dimensión representado a través del tiempo de retención del pico más alto de los picos agrupados.
c. Ancho del pico en la base para la segunda dimensión estimado a través del ancho en los mínimos de la derivada segunda ó alternativamente a través de la derivada primera.
d. Suma de la altura de todos los picos individuales que componen un pico bi- dimensional.
e. Número de picos agrupados para formar el pico bi-dimensional.
8. El resultado del procesamiento de los datos puede ser visualizado a través de imágenes y en un archivo generado como reporte de los picos detectados con los parámetros del experimento y las características de los picos mencionadas en el inciso anterior. Los gráficos generados siguen siendo de fundamental importancia ya que la inspección visual del cromatografista sigue siendo aún el mejor criterio de aceptación.
165
En la gran mayoría (si no la totalidad) de los software para cromatografía, cuando se analizan muestras complejas, es necesario el ajuste manual de los parámetros de detección e integración de los picos. En ese aspecto, la herramienta aquí propuesta no es la excepción a la regla.
A continuación se muestra una imagen de la interfaz gráfica del software desarrollado implementado en Matlab.
Figura 5.2.2 Interface gráfica del usuario para el software de procesamiento y representación de datos de cromatografía bi-dimensional desarrollado en Matlab.
166