Búsqueda de costo uniforme para el diagnóstico de variantes de procesos de negocio Uniform-cost search for diagnostics of business process variants

(1)

Búsqueda de costo uniforme para el diagnóstico de variantes de

procesos de negocio

Uniform-cost search for diagnostics of business process variants

Damián Pérez Alfonso

1*

,

Raykenler Yzquierdo Herrera

2

,

Eudel Pupo Hernández1

,

Reynaldo López

Jiménez1

.

1Universidad de las Ciencias Informáticas. Facultad 3. Carretera a San Antonio de los Baños, km 2 1⁄2, Reparto Torrens, Ciudad de la Habana, Cuba.

2_{Universidad de las Ciencias Informáticas. Dirección de Investigaciones. Carretera a San Antonio de los Baños, km 2} 1⁄2, Reparto Torrens, Ciudad de la Habana, Cuba.

*Autor para la correspondencia:

[email protected]

,

Resumen

Las técnicas de minería de proceso extraen conocimiento de los registros de eventos generados por los sistemas de información. El diagnóstico de procesos es un área de la minería de proceso que abarca el análisis de rendimiento del proceso, la detección de anomalías e inspección de patrones interesantes. Las técnicas disponibles para el diagnóstico suelen ser afectadas por el ruido, el número de tareas involucradas, las dimensiones y/o la complejidad del registro de eventos. Adicionalmente brindan poca información sobre los comportamientos infrecuentes del proceso o la incompletitud del registro de eventos. La utilización combinada de estas técnicas, es insuficiente para la comprensión del proceso en la fase de diagnóstico, ya que no facilitan la identificación y análisis de las anomalías y los patrones comunes en sus respectivos contextos. Se propone un nuevo enfoque para el diagnóstico del proceso, el cual persigue la construcción de variantes del proceso a partir de un registro de eventos, utilizando una búsqueda de costo uniforme. Además se presenta Variants Miner, la herramienta desarrollada para aplicar el enfoque propuesto. La búsqueda de costo uniforme permite identificar cuáles comportamientos deben ser descartados o asumidos para la construcción de una variante según un patrón de control de flujo determinado. Variants Miner obtiene información relevante relacionada con el proceso y las características presentes en el registro de eventos enmarcándolas en su contexto específico dentro del proceso.

Palabras clave: diagnóstico de procesos, minería de proceso, búsqueda de costo uniforme Abstract

Process mining techniques extract knowledge from event logs of information systems. Process diagnostics is a process mining topic that encompasses process performance analysis, anomaly detection and inspection of interesting patterns. Noise, number of activities, event log dimension and/or complexity usually affects process diagnostics tools. Also, poor information about process infrequent behavior or event log completeness is provided by these tools. Combine these techniques is insufficient for process understanding on diagnostics phase, because they don't make easy the pattern and anomalies identification and analysis on their corresponding contexts. The present paper proposes a new approach that, based on uniform-cost search aims to construct process variants from and event log. A tool that implements the

(2)

approach proposed, called Variants Miner, is presented also. Uniform-cost search allows identifying the assumed and/or discarded behavior needed for construct a variant according to a workflow pattern. Variants Miner extracts relevant process information and event log characteristics, framing it on its specific context within the process.

Keywords:process diagnostics, process mining, uniform-cost search.

Introducción

La ejecución de los procesos de negocio habitualmente es registrada por los sistemas de información empresarial. Estos registros almacenan la información de los eventos asociados a las actividades de los procesos de negocio y se denominan registro de eventos. Ante el desafío de aprovechar los datos de eventos para proveer un mejor entendimiento de los procesos y de cómo mejorar su rendimiento ha surgido la minería de proceso. Esta disciplina, impulsa el desarrollo de técnicas y herramientas para analizar los procesos partiendo de las trazas de su ejecución (Aalst 2011).

La minería de proceso brinda numerosas ventajas con respecto a las técnicas tradicionales de análisis y mejora de procesos, ofreciendo resultados en menor tiempo y con mayor fiabilidad (Jans, van der Werf, Lybaert, Vanhoof 2011). La consultora Gartner recomienda entre las buenas prácticas para organizaciones altamente adaptativas el análisis y descubrimiento de procesos y redes sociales en la organización (Betsy Burton 2012), los cuales están ampliamente soportados por la minería de proceso. Más de 100 casos de éxito apuntan a la minería de proceso como una alternativa útil para la gestión de procesos y la auditoría empresarial (Depaire, Swinnen, Jans, Vanhoof 2013). Importantes proveedores de software, universidades y empresas consultoras se han aliado junto al IEEE para la investigación y el desarrollo de esta área (Vossen 2012).

La minería de proceso resulta útil para el diagnóstico de procesos, su descubrimiento y el chequeo de conformidad entre la ejecución real de los procesos y sus modelos de referencia. El diagnóstico de procesos comprende el análisis de rendimiento, la detección de anomalías y la identificación de patrones comunes (Jagadeesh Chandra Bose, van der Aalst 2012). El diagnóstico ayuda a tener una visión general del proceso, de los aspectos más significativos del mismo y de las técnicas que pueden ser más útiles en su análisis posterior (Yzquierdo-Herrera, Silverio-Castro, Lazo-Cortés, Torres-Graña 2012).

Las técnicas de minería de proceso disponibles para el diagnóstico del proceso no cubren de forma integral las necesidades de esta etapa de la gestión de procesos. Dotted Chart Analyzer facilita el análisis del rendimiento del

(3)

Aalst 2007), maneja adecuadamente el ruido en el registro de eventos y aunque brinda información del control de flujo del proceso no describe los patrones presentes. Trace Alignment (Jagadeesh Chandra Bose, van der Aalst 2012) permite la identificación de anomalías en el proceso y las secuencias de actividades más comunes en el proceso, siempre que las dimensiones y complejidad del registro de eventos no afecten el análisis visual de la trazas alineadas. La Descomposición en Bloques de Construcción (Yzquierdo-Herrera, Silverio-Castro, Lazo-Cortés 2013, -) descompone el proceso jerárquicamente mediante patrones de control de flujo e identifica situaciones de ausencia de información, pero sin considerar el ruido presente en el registro de eventos, generando descomposiciones incorrectas de los subprocesos ante esta situación. Algoritmos de descubrimiento, como el Heuristics Miner, con resultados satisfactorios en entornos reales (De Weerdt, De Backer, Vanthienen, Baesens 2012), descubren un modelo del proceso, brindando los patrones de control de flujo predominantes, pero ninguna información sobre los comportamientos infrecuentes del proceso o la incompletitud del registro de eventos.

La utilización combinada de estas técnicas, a pesar de su complementariedad, es insuficiente en la comprensión del proceso en la fase de diagnóstico, ya que no facilitan la identificación y análisis de las anomalías y lo patrones comunes en sus respectivos contextos. De forma general, las técnicas disponibles para el diagnóstico suelen ser afectadas por el ruido, el número de tareas involucradas, las dimensiones y/o la complejidad del registro de eventos. Además solo permiten una comprensión fragmentada del proceso, desde la perspectiva única de cada herramienta y brindan poca información sobre los comportamientos infrecuentes del proceso o la incompletitud del registro de eventos.

Se propone una nueva herramienta (Variants Miner) para mejorar la comprensión de los procesos de negocio durante la etapa de diagnóstico. Variants Miner se basa en el descubrimiento de variantes del proceso, a partir de un registro de eventos, utilizando Búsqueda de costo uniforme (Russell, Norvig, Canny, Malik, Edwards 1995). La herramienta propuesta obtiene información relevante relacionada con el proceso y las características presentes en el registro de eventos enmarcándolas en su contexto específico dentro del proceso.

Desarrollo

Para posibilitar la comprensión de la propuesta se considera necesario presentar las siguientes definiciones:

Definición 1. Traza y registro de eventos: Denotemos A como el conjunto de las actividades del proceso P. Un evento e es una ocurrencia de una actividad: e ∈ A_P. Una traza t es una secuencia finita no vacía de eventos ejecutados en P: t ∈ A_P+. Un registro de eventos L_P es un conjunto de trazas sobre P.

(4)

unidad de trabajo lógica y coherente. Los subprocesos tienen sus propios atributos y metas, pero contribuyen a alcanzar la meta general del proceso. Un subproceso es también un proceso y la mínima expresión de un subproceso es una actividad.

Definición 3. Patrones de control de flujo: Un proceso se puede descomponer en múltiples subprocesos utilizando los siguientes patrones de control de flujo:



Secuencia (w_s): dos subprocesos se ejecutan secuencialmente si uno ocurre inmediatamente después del otro.



Selección exclusiva (w_x): dos subprocesos forman parte de una selección exclusiva si, en un punto de decisión, se puede ejecutar solamente uno de los dos.



Selección no exclusiva (w_o): dos subprocesos son opciones de una selección no exclusiva si, en un punto de decisión, pueden ejecutarse ambos o solamente uno de ellos.



Paralelismo (w_p): dos subprocesos se ejecutan en paralelo si ambos se ejecutan simultáneamente.



Lazo (w_l): dos subprocesos se encuentran en un lazo si se pueden repetir múltiples veces. Cada repetición comienza con la ejecución del primer subproceso (Do), continúa con el segundo (Redo) y termina con el Do. El Redo puede ser un subproceso vacío, por lo que el único repetido sería el Do.

Denotemos por S_Pal conjunto de los subprocesos del proceso P y W = {w_s,w_x,w_o,w_p,w_l} como el conjunto de los patrones de control de flujo. Un subproceso s_i∈ S_P se puede descomponer a través de diferentes w_j|∀w_j∈ W en varios

s_k| ∀ k≠i : s_k∈ S_P, hasta el nivel de actividad. Lo cual permite conformar un árbol en el que cada nivel representa un grado de abstracción inferior.

Definición 4. Comportamiento del proceso: El comportamiento del patrón de control de flujo w_j para el subproceso s_i ( denotado por β_wjsi|w_j∈ W) está compuesto por todas las posibles:

 Sucesiones directas (SD), se denomina sucesión directa entre la actividad a y la actividad b a la existencia en alguna traza de la secuencia ab.

 Sucesiones indirectas (SI), se denomina sucesión indirecta entre la actividad a y la actividad b, a la aparición en alguna traza de la actividad a seguida, inmediatamente o no, por la actividad b.

 Eventos que inician y/o finalizan trazas.

(5)

Siendo l_i ⊆ L_P la sección del registro de eventos relacionada al subproceso s_i ∈ S_P, el subconjunto de este comportamiento observable en l_ies el comportamiento del proceso de w_jen l_i :

𝛽

𝑤𝑗𝑙𝑖⊆

𝛽

𝑤𝑗𝑠𝑖 | wj∈ W. Por tanto, el comportamiento presente en la sección del registro de eventos l_i es

𝛽

_𝑙_𝑖

= 𝛽

_𝑤_𝑠_𝑙_𝑖

∪ 𝛽

_𝑤_𝑥_𝑙_𝑖

∪ 𝛽

_𝑤_𝑜_𝑙_𝑖

∪ 𝛽

_𝑤_𝑝_𝑙_𝑖

∪ 𝛽

_𝑤_𝑙_𝑙_𝑖.

Definición 5. Árbol de variantes: Un árbol de variantes es una representación de diferentes descomposiciones en subprocesos aplicadas al proceso P a partir de un registro de eventos. Está compuesto por dos tipos de nodos, los nodos subproceso y los nodos patrón.

Un nodo subproceso representa un subproceso sobre P y puede o no contener nodos patrones como hijos. Un nodo patrón representa una descomposición de su padre, de acuerdo a un patrón de control de flujo, por lo que un nodo patrón posee dos o más nodos subproceso como hijos. El nodo raíz es un nodo subproceso y está referido a todo el proceso. Los nodos hojas son siempre nodos de tipo subproceso.

Definición 6. Variantes de proceso: Las variantes de un modelo de procesos o variantes de proceso, son modelos de un proceso que describen el mismo proceso de negocio, y poseen algunas diferencias estructurales. Las diferencias están dadas por los patrones de control de flujo que se utilizan en secciones equivalentes del proceso y la presencia de determinadas actividades.

En la Figura 1, pueden apreciarse dos variantes (V1 y V2) de un proceso de negocio. En V1, la actividad Y se muestra en secuencia con el subproceso conformado por las actividades E, A, X y F; por otro lado en V2, la actividad Y aparece en selección exclusiva con el subproceso antes mencionado. Además la actividad Z, aparece en V1 , pero no en V2..

El objetivo perseguido por Variants Miner es construir variantes de proceso a partir de diferentes descomposiciones en subprocesos considerando patrones de control de flujo. Un subproceso puede descomponerse mediante un patrón de control de flujo específico descartando comportamiento infrecuente y/o asumiendo comportamiento ausente. Por consiguiente, cada subproceso puede descomponerse a través de varios patrones a la vez, en dependencia de los comportamientos descartados y/o asumidos.

(6)

Variants Miner. Algoritmo para el diagnóstico de variantes de procesos

La idea general de Variants Miner es encontrar las posibles variantes de descomposición de un subproceso dentro de un ámbito definido por el usuario. El ámbito se especifica en términos de umbrales para ruido (_Tn) y completitud (_Tc). A partir de un registro de eventos y un ámbito definido se genera el árbol de variantes. Al mismo tiempo se genera un perfil de diagnóstico para el árbol descubierto.

Los umbrales para ruido y completitud se definen como un número entre 0 y 100 y pueden ser especificados individualmente para cada patrón de control de flujo. Los valores por defecto están basados en el Principio de Pareto, siendo 20% para ruido y 80% para completitud. Por ejemplo, un umbral de 20% para ruido en el patrón secuencia significa que hasta el 20% del comportamiento expresado en el registro de eventos puede ser descartado para encontrar una descomposición mediante el patrón secuencia. De manera similar, un 80% de completitud para paralelismo indica que el subproceso puede ser descompuesto mediante ese patrón conteniendo solamente el 80% del comportamiento necesario para ser identificado.

Para cada nodo patrón en el árbol de variantes se genera una información de diagnóstico

(𝑑

_𝑖𝑤_𝑗

)

. El perfil de diagnóstico está compuesto por todas las informaciones de diagnóstico en el árbol de variantes. Cada

𝑑

𝑖𝑤𝑗contiene una estimación

de aptitud, una estimación de precisión, el comportamiento descartado y el comportamiento asumido. Estos comportamientos se refieren al subproceso (s_i) cuyo padre es el nodo patrón de acuerdo al patrón w_j en el sublog (l_i) relacionado a s_i. La relación entre el comportamiento descartado y el comportamiento del patrón w_j expresado en li

(𝛽

𝑤𝑗𝑙𝑖

)

se utiliza para realizar la estimación de aptitud. De la misma manera, la estimación de precisión está basada en

el comportamiento asumido y

𝛽

_𝑤_𝑗_𝑙_𝑖. Ambas estimaciones son expresadas como un valor entre 0 y 1, tal que mientras mayor el número, mejor es la evaluación.

El perfil de diagnóstico muestra además la manifestación del patrón de selección no libre. Las relaciones de dependencias indirectas y relaciones incorrectas son descritas utilizando reglas de negocio. La búsqueda para este patrón es realizada a partir de cada versión obtenida en el proceso de descomposición. Un ejemplo de regla de negocio es: a y

(7)

Descomposición en subprocesos.

El algoritmo de descomposición en subproceso utiliza un registro de eventos del proceso P y los umbrales definidos para construir un árbol de variantes _VP. Siendo _SPel conjunto de todos los subprocesos del proceso P, para cada nuevo subproceso _S'P⊆_SP,se busca una variante de descomposición según cada uno de los patrones de control de flujo. Para encontrar una variante de descomposición para un subproceso _si, se extrae el comportamiento del proceso

𝛽

_𝑙_𝑖 del sublog _li relacionado con _si. Denotemos como

𝛽

_𝑤′_𝑗_𝑠_𝑖al comportamiento del proceso para el patrón _wj en _si que no está en

𝛽

𝑙𝑖pero puede ser asumido dentro del umbral de completitud. Sea

𝛽

𝑙𝑖

′_⊂₍

_𝛽

𝑙𝑖 \

𝛽

𝑤𝑗𝑙𝑖) el comportamiento del proceso

que está presente en

𝛽

𝑙𝑖y puede ser descartado dentro del umbral de ruido. Para un patrón de control de flujo wj es

posible encontrar una variante si (

𝛽

_𝑤_𝑗_𝑙_𝑖\

𝛽

_𝑙′_𝑖) ∪

𝛽

_𝑤′_𝑗_𝑠_𝑖es equivalente a

𝛽

_𝑤_𝑗_𝑠_𝑖.

Para cada variante encontrada se genera un perfil de diagnóstico. El nuevo subproceso generado por cada descomposición es añadido a _S'P con el objetivo de que sea analizado posteriormente. Un subproceso _wj es analizado solo si el conjunto de actividades que contiene, denotado por

𝐴

𝑠𝑖, contiene más de una actividad.

Algoritmo 1: Descomposición en subprocesos.

Entradas: registro de eventos (_LP), umbrales de ruido y completitud (_TP) Salidas: árbol de variantes (_VP), perfil de diagnóstico.

1: procedure DECOMPOSE(_LP, _TP)

2: W ←{_{ws,wx,wo,wp,wl}} Patrones de control de flujo para la descomposición. 3:

𝑛

𝑠1← CREATESUB-PROCESS(LP) Crea el nodo raíz.

4: _VP ←

𝑛

_𝑠_𝑖

5: S′_P ←{

𝑛

_𝑠_𝑖} Crea una lista para los subprocesos nuevos.

6: while

𝑛

_𝑠_𝑖 ← extraer el primer nodo subproceso existente en S′_P do

7: if _si no es una actividad then

8:

𝛽

_𝑙_𝑖 ← EXTRACTBEHAVIOR(

𝑛

_𝑠_𝑖) Extrae el comportamiento contenido en _li.

9: for all _wj in W do

10: V ← FINDVARIANTS(wj,

𝛽

_𝑙

𝑖,TP)

11: if |V | > 0 then Si

𝑛

_𝑠_𝑖puede ser descompuesto por _wj bajo _TP.

12: for all nodo subproceso k en V do

13: adicionar el nodo k como hijo del nodo patrón

𝑛

𝑖𝑤𝑗

(8)

15: end for

16: adicionar el nodo

𝑛

𝑖𝑤𝑗como hijo del nodo subproceso

𝑛

𝑠𝑖.

17:

𝑑

𝑖𝑤𝑗← CREATEDIAGNOSISINFORMATION(ws,li,V)

18: adicionar

𝑑

_𝑖𝑤_𝑗al perfil de diagnóstico

19: end if

20: end for 21: end if 22: end while 23: end procedure

Búsqueda de costo uniforme para el descubrimiento de las variantes.

Siendo

𝛾

_𝑤_𝑗_𝑠_𝑖una posible descomposición para el subproceso

𝑠

_𝑖utilizando el patrón de control de flujo _wj y

𝐴

_𝑠_𝑖el conjunto de actividades presentes en _si, cualquier

𝛾

𝑤𝑗𝑠𝑖contiene n conjuntos disjuntos de actividades, pertenecientes a

𝐴

_𝑠_𝑖. Por cada patrón de control de flujo _wj y cada sublog _li, cada elemento de comportamiento bx ∈

𝛽

_𝑤_𝑗_𝑙_𝑖es procesado,

en una búsqueda en orden descendiente según la frecuencia de b ( denotada por φ(b)).

La búsqueda de variantes está basada en la Búsqueda de costo uniforme (Russell, Norvig, Canny, Malik, Edwards 1995). Este método de búsqueda expande el nodo que posea el menor costo de camino. En caso de que los costos de todos los pasos de un nodo a otro sean iguales, es idéntico a una búsqueda a lo ancho. Si el costo de cada paso es menor o igual que una constante ε, se garantiza la completitud y optimalidad del método. La complejidad temporal y espacial del peor caso de este método de búsqueda pueden ser descritas por la ecuación

𝑟

1+

𝐶

𝜀_{, donde}_r_{es el factor de ramificación del}

árbol y C es el costo del camino de la solución óptima.

En la búsqueda de variantes cada nodo en el espacio de búsqueda está definido por

𝛾

𝑤𝑗𝑠𝑖, el comportamiento no

procesado (

𝛽

_𝑤′_𝑗_𝑙_𝑖⊆

𝛽

_𝑤_𝑗_𝑙_𝑖), el comportamiento descartado

(𝜂

_𝑖𝑤_𝑗

)

y el comportamiento asumido

(𝜃

_𝑖𝑤_𝑗

)

. Se crea un nuevo nodo cuando, para

𝛾

𝑤𝑗𝑠𝑖, una

𝛾

𝑤𝑗𝑠𝑖

′ _{diferente puede ser creada al procesar un comportamiento}_b

x ∈

𝛽

_𝑤′_𝑗_𝑙_𝑖. También un nuevo nodo es creado si el comportamiento bx puede generar una

𝛾

_𝑤′_𝑗_𝑠_𝑖diferente, pero descartando

bx , o algún comportamiento by∈

𝛽

_𝑤_𝑗

puede ser asumido con el objetivo de mantener

𝛾

_𝑤_𝑗_𝑠_𝑖.

El costo del camino desde un nodo a alguno de sus vecinos es c = c(b_x) + c(b_y), donde:

(9)

El objetivo se alcanza cuando

𝛽

_𝑤_𝑗_𝑙_𝑖ha sido procesado completamente y la posible descomposición

𝛾

_𝑤_𝑗_𝑠_𝑖posee más de un conjunto disjunto.

Algoritmo 2: Búsqueda de variantes.

Entradas: patrón (_wj), comportamiento del proceso

(𝛽

_𝑙_𝑖

)

, umbrales de ruido y completitud (_TP) Salidas: variante de descomposición en subproceso según el patrón de control de flujo _wj 1: procedure FINDVARIANTS(_wj,

𝛽

_𝑙_𝑖, _TP)

2:

𝛽

_𝑤′_𝑗_𝑙_𝑖← SORTBYFREQUENCY(

𝛽

_𝑙_𝑖[wj]) Ordena comportamiento en orden descendente

3: _τwj ← _TP[_wj]

Umbrales para el patrón

_wj

4:

𝛾

_𝑤_𝑗_𝑠_𝑖 ← CREATEFIRSTDECOMPOSITIONPROPOSAL(_wj,

𝛽

_𝑤_𝑗_𝑙_𝑖, _τwj)

5: if

𝛾

_𝑤_𝑗_𝑠_𝑖 = ∅ then

𝛽

_𝑤_𝑗_𝑙_𝑖no es suficiente para crear una propuesta bajo _τwj

6: return ∅

7: end if

8: σ_{1 ←}CREATESEARCHNODE(

𝛽

_𝑤_𝑗_𝑙_𝑖,

𝛾

_𝑤_𝑗_𝑠_𝑖)

9: Σ ←{σ_1}

Cola de nodos abiertos ordenada por prioridad según el costo del camino.

10: while _σn ← extraer primer nodo en Σ do

11: if _σn es meta &

𝛽

_𝑤′_𝑗_𝑙_𝑖₌_∅_then

12: g ← _σn

13: break

14: else if _σn no está cerrado then

15: _Σn ← SEARCHNEIGHBORS(wj, σn,

𝛽

_𝑤

𝑗𝑙𝑖

′ _,_τwj₎

16: Σ ← Σ + _Σn

Adicionar vecinos como nodos abiertos.

17: end if

18: end while

19: if g es distinto de null then

20:

𝛾

_𝑤_𝑗_𝑠_𝑖← descomposición potentencial contenida en el nodo g

21: return CREATENEWSUB-PROCESSES(wj,

𝛾

_𝑤

𝑗𝑠𝑖,

𝛽

𝑙𝑖)

22: else

23: return ∅

24: end if 25: end procedure

La optimalidad y completitud de la búsqueda se garantizan con el costo asignado a los nodos generados. El procesamiento de los comportamientos en orden descendente de su frecuencia garantiza que se procesen primero aquellos que no pueden ser descartados según el umbral. Esto también garantiza la exploración de los estados más

(10)

prometedores primero: aquellos cuyos costos de camino son menores descartaron comportamientos poco frecuentes y poseen menos comportamiento por procesar. Las dimensiones del espacio de búsqueda pueden ser controladas por el usuario, a través de los umbrales de ruido y completitud.

Resultados y discusión

El algoritmo para identificar variantes de modelos de un proceso ha sido implementado como complemento del marco de trabajo ProM (Verbeek, Buijs, Van Dongen, Van Der Aalst 2011). Este complemento recibe como parámetro de entrada un registro de eventos y genera como salida un árbol de variantes. Los umbrales de ruido y completitud son seleccionados por el usuario al iniciar el complemento.

En la Figura 2 se muestra el

árbol de variantes generado

para el registro de eventos

repair_example.xes

.

Este

registro de eventos posee

11855 eventos, distribuidos

en 1104 casos, los cuales

hacen

referencia

a

12 actividades diferentes.

Se puede apreciar que en el segundo nodo se encontraron dos variantes de descomposición: una variante a través del patrón secuencia y otra a través del patrón paralelismo. Mediante el enfoque de las variantes es posible identificar, para cada nodo patrón, el comportamiento que debe ser obviado o asumido para la obtención de esa variante.

La variante de descomposición en secuencia, no posee ruido, pero sí una completitud del 90 %, esto se debe a que en el 10 % de las trazas no aparece el evento b. Las trazas incompletas son marcadas en rojo (Figura 3), para facilitar el diagnóstico de esta anomalía.

(11)

Por otra parte, la variante siguiendo la descomposición por el patrón paralelismo (Figura 4) posee un 13% de ruido y un 99% de completitud. En este caso, las trazas consideradas como ruido para la descomposición son marcadas en rosado, para facilitar su identificación visual. En este caso el comportamiento ausente puede ser descrito en términos de sucesiones indirectas, las cuales se muestra en la sección “MISSING BEHAVIOR”.

En este caso la variante que coincide en mayor medida con el registro de eventos, es la de la secuencia, ya que aunque posee un menor grado de completitud, no tiene ningún ruido.

Figura 3: Incompletitud

en la variante de descomposición por el patrón secuencia.

Figura 4: Incompletitud

y ruido en la variante de descomposición por paralelismo

(12)

De forma general se puede apreciar como Variants Miner combina la detección de patrones de control de flujo, ruido e incompletitud en el registro de eventos, enmarcando todos estos elementos en los subprocesos donde se manifiestan. Por lo cual se considera que facilita el diagnóstico del proceso, de forma integral y jerárquica.

El perfil de diagnóstico que ofrece la herramienta contiene todos los elementos necesarios para caracterizar un registro de eventos de tal forma que pueda ser utilizado para la recomendación de algoritmos de descubrimiento (Pérez-Alfonso, Yzquierdo-Herrera, Lazo-Cortés 2013). Esto abre facilita el camino para la resolución del problema de la recomendación de algoritmos de descubrimiento como un problema de clasificación.

Conclusiones

Las técnicas disponibles para el diagnóstico de proceso suelen ser afectadas por el ruido, el número de tareas involucradas, las dimensiones y/o la complejidad del registro de eventos. Además estas técnicas brindan poca información sobre los comportamientos infrecuentes del proceso o la incompletitud del registro de eventos y no facilitan la identificación y análisis de las anomalías y lo patrones comunes en sus respectivos contextos.

En este trabajo se presenta la herramienta Variants Miner para mejorar la comprensión de los procesos de negocio durante la etapa de diagnóstico. Variants Miner permite la obtención de diferentes variantes de descomposición jerárquica de un proceso asumiendo u obviando comportamiento contenido en el registro de eventos, según los distintos patrones de control de flujo. La búsqueda de costo uniforme utilizada permite identificar cuáles comportamientos deben ser descartados o asumidos para la identificación de una variante según un patrón de control de flujo determinado. La obtención de un árbol de variantes posibilita enmarcar las actividades y las características identificadas en su contexto específico dentro del proceso. Mediante un registro de eventos se ha mostrado que Variants Miner obtiene información relevante relacionada con el proceso y las características presentes en el registro de eventos.

Referencias

AALST, W M P van der, 2011.

Process Mining. Discovery, Conformance and Enhancement of Business

Processes

. S.l.: Springer, Heidelberg, Dordrecht, London et. al. ISBN 978-3-642-19344-6.

BETSY BURTON, 2012. BPM Best Practices of Highly Adaptive Organizations. En: [en línea]. Gartner.

2012. [Accedido 19 septiembre 2012]. Disponible desde:

(13)

[en línea]. S.l.: Springer Berlin Heidelberg. Lecture Notes in Business Information Processing, 132.

pp. 701-706. [Accedido 1 marzo 2013]. ISBN 978-3-642-36284-2, 978-3-642-36285-9. Disponible desde:

http://link.springer.com/chapter/10.1007/978-3-642-36285-9_69.

DE WEERDT, J., DE BACKER, M., VANTHIENEN, J. y BAESENS, B., 2012. A multi-dimensional

quality assessment of state-of-the-art process discovery algorithms using real-life event logs. En:

Information Systems

[en línea]. 2012. Vol. 37, no. 7, pp. 654-676. Disponible desde:

http://hinari-

gw.who.int/whalecomwww.scopus.com/whalecom0/inward/record.url?eid=2-s2.0-84861093725&partnerID=40&md5=b73a289aad8600e57203262c9aebb872.

GÜNTHER, C W y AALST, W M P van der, 2007. Fuzzy Mining: Adaptive Process Simplification Based

on Multi-Perspective Metrics. En: ALONSO, G, DADAM, P y ROSEMANN, M (eds.),

International

Conference on Business Process Management (BPM 2007)

[en línea]. S.l.: Lecture Notes in Computer

Science. Springer, Berlin. 2007. pp. 328-343. Disponible desde:

http://dl.acm.org/citation.cfm?id=1793114.1793145.

JAGADEESH CHANDRA BOSE, R.P. y VAN DER AALST, Wil M.P., 2012. Process diagnostics using

trace alignment: Opportunities, issues, and challenges. En:

Information Systems

[en línea]. abril 2012.

Vol. 37, no. 2, pp. 117-141. DOI 10.1016/j.is.2011.08.003. Disponible desde:

http://search.ebscohost.com/login.aspx?direct=true&db=iih&AN=66946821&site=ehost-live.

JANS, Mieke, VAN DER WERF, Jan Martijn, LYBAERT, Nadine y VANHOOF, Koen, 2011. A business

process mining application for internal transaction fraud mitigation. En:

Expert Systems with Applications

[en línea]. septiembre 2011. Vol. 38, no. 10, pp. 13351-13359. [Accedido 27 febrero 2013].

DOI 10.1016/j.eswa.2011.04.159. Disponible desde: http://uhdspace.uhasselt.be/dspace/handle/1942/12115.

LI, C., REICHERT, M. y WOMBACHER, A., 2011. Mining business process variants: Challenges,

scenarios, algorithms. En:

Data and Knowledge Engineering

[en línea]. 2011. Vol. 70, no. 5, pp. 409-434.

Disponible desde:

http://hinari-

gw.who.int/whalecomwww.scopus.com/whalecom0/inward/record.url?eid=2-s2.0-79955658959&partnerID=40&md5=4591be1e251ec2bc4774bb9c9ee45ce9.

MOLKA, Thomas, GILANI, Wasif y ZENG, Xiao-Jun, 2013. Dotted Chart and Control-Flow Analysis for a

Loan Application Process. En: ROSA, Marcello La y SOFFER, Pnina (eds.),

Business Process Management

Workshops

[en línea]. S.l.: Springer Berlin Heidelberg. Lecture Notes in Business Information Processing,

132. pp. 223-224. [Accedido 17 julio 2013]. ISBN 978-3-642-36284-2, 978-3-642-36285-9. Disponible

desde: http://link.springer.com/chapter/10.1007/978-3-642-36285-9_26.

PÉREZ-ALFONSO, Damián, YZQUIERDO-HERRERA, Raykenler y LAZO-CORTÉS, Manuel, 2013.

Recommendation of Process Discovery Algorithms: a Classification Problem. En:

RESEARCH IN

COMPUTING SCIENCE

[en línea]. 31 mayo 2013. Vol. 61, pp. 33-42. Disponible desde:

(14)