ISSN 0120-1980
Aplicación de bases de Gröbner en el problema de alcanzabilidad de estados de sistemas de eventos
discretos modelados por redes de Petri
Application of Gröbner bases to the problem of reachability of states of discrete-event systems modeled by Petri nets
Guelvis Mata1, Abdul Lugo2y Germalis Rojas1
1Universidad de los Andes
2Universidad Politécnica Territorial del Oeste de Sucre
RESUMEN. El centro de este trabajo es un enfoque alternativo para el problema de alcanzabilidad de estados en los sistemas de eventos discretos, fundamentado en la teoría de bases de Gröbner. En efecto, en este artículo expresamos procedimientos de bases de Gröbner dirigidos bajo la consideración de monomiales para representar marcaciones, transiciones y dinámica en una red de Petri reiniciable, con el objetivo de resolver el problema de alcanzabilidad de estados. Más precisamente, dado un estado inicial y otro estado arbitrario representados como productos de potencias, y dada una red de Petri representada como un conjunto de polinomios en varias variables, la alcanzabilidad del estado arbitrario desde el estado inicial es una congruencia módulo un ideal polinomial.
Palabras clave:sistemas de eventos discretos, redes de Petri, bases de Gröbner, alcan- zabilidad de estados.
ABSTRACT. The focus of this work is an alternative approach to the problem of reacha- bility of states in discrete-event systems, based on the theory of Gröbner bases. Indeed, in this article we express procedures of Gröbner bases routed under the consideration of monomials to represent markings, transitions and dynamics in a reversible Petri net, in order to solve the problem of reachability of states. More precisely, given an initial state and other arbitrary state, represented as products of powers, and given a Petri net represented as a set of polynomials in multiple variables, the reachability of the arbitrary state from the initial state is a congruence modulus a polynomial ideal.
Key words:discrete event systems, Petri nets, Gröbner bases, reachability of states.
2010 AMS Mathematics Subject Classification. 93C65, 13P10.
1. Introducción
Lossistemas de eventos discretos(SED) constituyen una clase de sistemas dinámi- cos cuyos comportamientos (dinámicas) corresponden a leyes generadas por el hombre (contrarias a las leyes físicas), pero en algún sentido dependientes de variables continuas.
Aquí, los cambios de estados se producen por la ocurrencia de eventos (acciones), y en consecuencia, la dinámica de los SED está constituida por sucesiones finitas de eventos o, equivalentemente, por sucesiones finitas de estados. Por ejemplo, los sistemas logísticos, industriales, de manufactura, de tráfico aéreo, de comunicación, etc., son SED.
En la literatura podemos encontrar diferentes modelos para representar los SED, entre los cuales están incluidos las redes de Petri (RP) [2, 6, 7, 8], los autómatas, procesos recursivos finitos, máquinas de Turing, de Mealy [5], etc. Todos ellos, de una u otra manera son propuestos para dar respuesta oportuna y eficaz a diversos problemas propios de los SED, tales como la alcanzabilidad de estados, el bloqueo o estancamiento, la persistencia, el sobreflujo de capacidad, etc. Por lo tanto, es necesario que los modelos usados para representar SED sean funcionales y permitan el análisis formal, cuyo objetivo es la verificación de propiedades mediante el análisis automático: enfoque algorítmico para construir herramientas de software.
En este artículo es tratado el problema de la alcanzabilidad de estados en SED: dado un estado inicial (estado en el cual comienza a evolucionar el sistema), ¿es algún otro estado arbitrario alcanzable desde dicho estado inicial? Este problema tiene solución automática usando un par de técnicas conocidas comoárbol de alcanzabilidadyenfoque matricial, construidas desde la propia estructura de una RP [8]; sin embargo, el objetivo de este trabajo es proponer un enfoque alternativo fundamentado en la teoría de bases deGröbner[1, 3, 4, 10]: procedimientos de bases de Gröbner dirigidos bajo la consideración de monomiales para representar marcaciones, transiciones y dinámica pueden ser aplicados a una RP reiniciable para resolver el problema de alcanzabilidad de estados. Más precisamente, dados un estado inicial y otro estado arbitrario representados como productos de potencias, y dada una RP representada como un conjunto de polinomios en varias variables, la alcanzabilidad del estado arbitrario desde el estado inicial es una congruencia módulo un ideal polinomial.
Contenido del artículo:
En la sección 2 daremos las definiciones básicas de la teoría de redes de Petri y esta- bleceremos la dinámica de su evolución, para finalmente expresar la alcanzabilidad como la reiniciabilidad en las RP.
En la sección 3 incluiremos los conceptos básicos de las bases de Gröbner, nece- sarios para el desarrollo del trabajo, junto con el algoritmo de Buchberger para la determinación de las mismas.
Finalmente, en la sección 4 se incluyen las relaciones más estrictas entre las RP y las bases de Gröbner, con lo cual se expresa que la alcanzabilidad es determinada usando bases de Gröbner.
2. Redes de Petri
Las redes de Petri fueron propuestas por CARLPETRIen la década de los años sesenta.
Esta es una herramienta matemática de modelado gráfico aplicable a los sistemas de eventos discretos. Gráficamente, pueden ser utilizadas para dar información dinámica del sistema.
Unared de Petries una 4-tuplaR = (L, T, E, S), dondeL = {l1, . . . , ln} es un conjunto finito de lugares,T ={t1, . . . , tm}es un conjunto finito de transiciones, con L∩T = ∅. Además, E : T → L∞ es una función de entrada: para cada tj ∈ T, E(tj)∈L∞es llamadopaquete de entradaatj(L∞denota el multiconjunto con número de ocurrencias ilimitado). Y finalmente,S:T →L∞es una función de salida: para cada tj∈S,S(tj)∈L∞es llamado paquetede salida detj.
Por su parte, unared de Petri marcadaes un parM = (R, m), dondeR= (L, T, E, S) es una red de Petri, ym :L→Nes una función de marcación, conN={0,1,2, . . .}:
para cadali∈L,m(li)∈Nserá llamadonúmero de fichas en el lugarli.
Las marcaciones representan el estado actual del sistema que establece las condiciones lógicas para la ocurrencia de eventos. Finalmente, una vez que ocurra un evento, las condiciones del sistema variarán para dar lugar a una nueva marcación o estado.
Las marcaciones en una red de Petri marcadaM = (R, m)pueden ser definidas como unn-vector, es decir,m = (m1, m2, . . . , mn)conn = |L|. Ambas definiciones están relacionadas porm(li) =mi;mtoma valores enNn =N×N×N× · · · ×N, el cual es numerable.
La representación gráfica de las redes de Petri marcadas se hace mediante grafos dirigidos bipartitos, donde los lugares son representados por círculos y las transiciones son representadas por barras. Si un lugarlies un lugar de entrada a una transicióntj; es decir,li ∈E(tj), entonces hay#(li, E(tj))arcos dirigidos del correspondiente círculo a la correspondiente barra. Si el lugar li es un lugar de salida de la transición tj; es decir,li ∈S(tj), entonces hay#(li, S(tj))arcos dirigidos de la correspondiente barra al correspondiente círculo. Las fichas son representadas por puntos en los círculos y la función de marcación es representada por el número de puntos en cada círculo o lugar.
La dinámica de una red de Petri determina las reglas de habilitación y disparo de las transiciones, lo cual da paso a nuevas marcaciones para la ocurrencia de nuevos eventos en el sistema. Más precisamente, una transicióntj ∈ T en una red de Petri marcada M = (R, m)es llamadahabilitadaenm, sim(li)≥#(li, E(tj)), para todo lugarli∈L.
En este caso también diremos que la transicióntjes habilitada por la marcaciónm.
El conjunto de transiciones habilitadas por la marcaciónm es dado porE(m) = {tj ∈ T : m(li) ≥#(li, E(tj)),∀ li ∈L}; luego, ello define una funciónE :Nn → P(T) = 2T,donden=|L|.
Ahora, dadaM = (R, m)una red de Petri marcada, y siendotj ∈ E(m), la marcación m0dada porm0(li) =m(li)−#(li, E(tj)) + #(li, S(tj)), coni= 1, . . . ,|L|, es llamada marcación alcanzabledesdempor el disparo detj.
Para ilustrar los conceptos arriba expuestos, consideremos la siguiente red de Petri marcadaM = (R, m)con marcación inicialm= (2,0,0); aquí,E(m) ={t1}, tal como se muestra en la figura 1.
l1 t1
l2
l3
t2
Figura 1.Una RP marcada, conm= (2,0,0)yE(m) ={t1}.
Al disparart1 se tienem0 = (1,1,1), como podemos visualizar en la figura 2. De donde,E(m0) ={t1, t2}.
l1 t1
l2
l3
t2
Figura 2.La marcación resultante del disparo det1en la figura 1.
Ahora disparamost2a partir dem0, para obtenerm00= (1,0,1); tal como se muestra en la figura 3, con lo cualE(m00) ={t1}.
l1 t1
l2
l3
t2
Figura 3.La marcación resultante del disparo det2en la figura 2.
En fin, dadaR = (L, T, E, S)una red de Petri, la función parcial de cambio de marcacionesδ : Nn×T → Nn, conn = |L|, es definida porδ(m, tj) = m0, donde m0(li) =m(li)−#(li, E(tj)) + #(li, S(tj)), parai= 1, . . . , n.
Dicha función está definida en(m, tj)∈Nn×T si, y solo si,tj es permitida en la marcaciónm, es decir,tj ∈ E(m).
La función parcial de cambio de marcación puede ser generalizada mediante δb : Nn×T∗ → Nn, definida comobδ(m, θ) = m ybδ(m, σt) = δ(bδ(m, σ), t), con m∈Nn,t∈T, dondeσ∈T∗, yT∗denota el monoide con unidadθ[5]. Comoδbes una extensión deδ, no haremos distinción entre ambas.
La alcanzabilidad es la principal propiedad dinámica en las redes de Petri y puede ser establecida como sigue: dada una red de Petri marcadaM = (R, m0)y una marcación m∈Nn;n=|L|, ¿es alcanzablemdesdem0? Formalmente, dadaM = (R, m0)una red de Petri marcada, una marcaciónm∈Nnes llamadaalcanzabledesdem0si existe una sucesión de disparos de transicionesσ=tj1tj2. . . tjk∈T∗tal queδ(m0, σ) =m.
El conjunto de alcanzabilidad de la red de Petri desde la marcaciónm0es dado por A(R, m0) ={m∈Nn:∃σ∈T∗, δ(m0, σ) =m}.
Por otro lado, una red de Petri marcadaM = (R, m0)es llamadareiniciablesi para toda marcaciónm∈A(R, m0)se tiene quem0∈A(R, m).
Finalmente, referimos al lector a [8] para la consideración de las técnicas de análisis en RP: árbol de alcanzabilidad y ecuaciones matriciales.
3. Bases de Gröbner
Las bases de Gröbner fueron propuestas en 1965 por BRUNOBUCHBERGER, quien en 1965 planteó un algoritmo para su cálculo. La teoría de bases de Gröbner es una herramienta fundamental en el álgebra computacional. En esta sección daremos una definición formal de estas, y las herramientas necesarias para su cálculo.
SeaA={x1, . . . , xn}un conjunto de indeterminadas. Unmonomioes un elemento de la formap=xi11·xi22· · ·xinn, conijenteros no negativos; denotaremos porMal conjunto de todos los monomios enA.
Elgrado monomialdepes la suma de sus exponentes y lo denotaremos porgr(p), esto es,gr(p) =i1+i2+· · ·+in.
Si≺es una relación deordenenM, diremos que≺es una relación deorden admisible sobreMsi es compatible con la multiplicación de monomios, esto es, si param, n, p∈M:
se tiene quem≺nón≺móm=n(tricotomía);
sim≺nyn≺p, entoncesm≺p(transitividad);
1≺mpara todo monomiom6= 1(elemento mínimo);
sim ≺n, entoncespm≺ pnpara cualquier monomiop(compatibilidad con el producto).
Dadosm =xα11· · ·xαnn yn =xβ11· · ·xβnn, daremos algunos ejemplos de órdenes admisibles:
1. Orden lexicográfico.Definimos el orden lexicográfico enMcomo m=xα11· · ·xαnn≺xβ11· · ·xβnn=n,
para(α1, . . . , αn),(β1, . . . , βn)∈Nn, siαi< βipara algúni; es decir, se tiene que m≺nsi para cada indeterminada con exponente diferente enmyn, el exponente menor se encuentra enm. En el caso de dos o más indeterminadas es importante especificar el orden entre las indeterminadas. Por ejemplo, six≺y, entonces
1≺x≺x2≺x3≺ · · · ≺y≺xy≺x2y≺ · · · ≺y2≺ · · ·
Este orden es denotado comolex. Note que para este orden,xµes siempre más grande queyβ, para todoµ, β∈N.
2. Orden lexicográfico en grados.Definimos el orden lexicográfico en grados enM como
m=xα11· · ·xαnn≺xβ11· · ·xβnn=n, donde(α1, . . . , αn),(β1, . . . , βn)∈Nn, si
gr(m) =α1+α2+· · ·+αn< β1+β2+· · ·+βn=gr(n).
Cuandogr(m) =gr(n), entoncesm≺lexn. Para el caso del anillo de polinomios K[x, y]conx≺y, tenemos
1≺x≺y≺x2≺xy≺y2≺x3≺x2y≺xy2≺y3≺ · · · Denotaremos este orden comogrlex.
3. Orden lexicográfico reverso en grados.Definimos el orden lexicográfico reverso en grados enMcomo
m=xα11· · ·xαnn≺xβ11· · ·xβnn=n, para(α1, . . . , αn),(β1, . . . , βn)∈Nn.
Sigr(m)< gr(n), ó sigr(m) =gr(n)yαi> βipara algúni; es decir,m≺nsi gr(m)< gr(n)ó sigr(m) =gr(n)y en la última indeterminada con exponente diferente enmyn, el exponente mayor está enm. Por ejemplo, para el caso de tres indeterminadas se tienex1x32≺x21x2x3, conx1≺x2≺x3. Denotaremos este orden comogrlexrev.
Por ejemplo, sea{x, y, z}un conjunto de indeterminadas. Fijemos el siguiente orden entre las indeterminadas:x≺y ≺z. Consideremos los siguientes monomios en{x, y, z}:
p=x3yz3,q=x2y3z2,r=x2y2zyt=x3z2; si el orden eslex, entoncesr≺lexqyt≺lexp;
si el orden esgrlex, entoncest≺grlexqyr≺grlex p;
si el orden esgrlexrev, entoncest≺grlexrevryp≺grlexrevq.
Un subconjunto no vacíoade un anilloRes llamado unidealsi paraa, a0∈aentoncesa+a0∈a;
paraa∈a, r∈Rentoncesa·r∈a.
Además, un ideal es cerrado en lo que respecta a tomar inverso aditivo, pues sia ∈a, entonces−a∈a, ya que−a=a·(−1). También contiene elemento neutro para la adición o elemento0, pues0 =a·0.
Unideal monomiales un ideal generado por un conjunto de monomios, es decir, los elementos del anillo de polinomiosK[x1, . . . , xn]que son de la formaxe11· · ·xenn.
SeaRun anillo arbitrario yrun elemento cualquiera enR. El ideal generado por{r}, denotado comohri(el cual está constituido por todos los múltiplos der), es dado por hri={r·r0:r0 ∈R}, y será llamadoideal principal; es decir, el ideal generado por un solo elemento.
Seaf ∈A=K[x1, . . . , xn]conf 6= 0y supongamos que≺es un orden admisible en los monomios deA. Entonces,f lo podemos escribir de forma unívoca de la forma f =c1m1+· · ·+cnmn, con los monomiosm1 ≺ · · · ≺mnyci 6= 0,i = 1, . . . , n.
Definimos ahora:
El soportedefcomo,sop(f) ={mi|i= 1, . . . , n}.
El monomio líderdefcomolm(f) =mn. El término líderdefcomolt(f) =cnmn. El coeficiente líderdef como,lc(f) =cn.
Siaes un ideal no nulo enA,el ideal de los monomios líderesdeaestá dado por l(a) =hlm(f) :f ∈ai.
Sia = hf1, . . . , fri, entonces lm(fi) ∈ l(a)parai = 1, . . . , r. Además, como lm(pf) = plm(f), para algún monomio p y algún polinomio f tenemos que hlm(f1), . . . , lm(fr)i=l(a).
Ahora, seaP un subconjunto de polinomios enK[x1, . . . , xn]. Diremos que dos polinomiosf ygdeK[x1, . . . , xn]sonequivalentes móduloP, si su diferencia puede ser expresada en términos deP, es decir,
f−g=u1p1+· · ·+unpn,
para algunos p1, . . . ,∈ P yu1, . . . , un ∈ K[x1, . . . , xn]. Esto lo denotaremos como f ≡P g.
Queremos generalizar el algoritmo de la división de polinomios en una indeterminada a polinomios en varias indeterminadas, también llamadoproceso de reducción. La principal
diferencia es que utilizamos un algoritmo que divide un polinomio por un conjunto de polinomios; este proceso es de gran importancia para las bases de Gröbner.
En el caso de una indeterminada, el algoritmo de la división en una indeterminada asegura que sif, g ∈ K[x]son polinomios conf 6= 0, al dividirgentref obtenemos q, r∈K[x], tales queg=qf+rdonder= 0ógr(r)< gr(f). Esto significa que se puede representar cada polinomiog∈K[x]por un polinomiorcongr(r)< gr(f)ó por 0módulo el ideal. Ya queg−r=qf∈ hfi, diremos quegyrestán relacionados módulo hfi. Esta representación es única, ya que sig=q1f+r1=q2f+r2, entoncesr1−r2
es un múltiplo def, y esto solo es posible sir1−r2= 0. Por consiguiente, tenemos una única representación de polinomios módulohfi.
Es la unicidad de representación de polinomios la que nos permite realizar cálculos módulohfi, es decir, en el anillo cocienteK[x]hfi.
Para visualizar de una manera más sencilla el algoritmo de división, consideremos el siguiente ejemplo:
Seang, f ∈ Q[x]dados porg =x3−2x2+ 2x+ 8yf = 2x2+ 3x+ 1. Por el algoritmo de la división, al dividirgentref
x3 −2x2 +2x +8 2x2+ 3x+ 1
−x3 −32x2 −12x 12x−74
−72x2 +32x +8
7
2x2 +214x +74
27
4x +394
obtenemosq, r ∈ Q[x], donde q = 12x−74 yr = 274x+ 394. Sustituyendo se tiene g= (12x−74)f+ (274x+394).
Pero si hacemos un análisis paso a paso de la división anterior, tenemos que primero se calculó 12x
fya que este resultado se lo restamos ag(esto se hace para disminuir el grado deg).
Además, podemos notar que 12x
f = x3+ 32x2+12x, cuyo término líder esx3, el cual coincide conlt(g). En otras palabras, lo que hacemos es buscar un término que al multiplicarlo por el polinomio f y al sumarle el polinomio g permita eliminar el término líder de g. Al eliminar el término líder de g se genera un nuevo polinomio p=g−f 12x
=72x2+32x+ 8.
Repetimos el procedimiento anterior, pues queremos eliminar el término líder deppor medio def. Este procedimiento se repite de manera sucesiva hasta quegr(p)< gr(f)ó p= 0. Cuando finaliza el proceso,pes el resto de la división degentref; la suma de los términos que usamos para la reducción en cada paso es el polinomio cociente.
Para generalizar el proceso anterior consideremosg, f ∈K[x]dados porg =a0+ a1x+· · ·+anxn, yf =b0+b1x+· · ·+bmxmcongr(g) =n,gr(f) =myf 6= 0.
Entoncesh=g−lt(g)lt(f)f.
Llamaremos ahla reducción degporfy lo denotaremos comog−→f h. Cuando el proceso se realiza de forma sucesiva lo denotaremos porg−→f +h.
Este proceso es finito, puesK[x]es un anillo euclídeo con la función tamaño definida como el grado del polinomio, el cual define el único orden admisible posible.
Para extender el proceso al caso den indeterminadas debemos considerar que en K[x1, . . . , xn]no todos los ideales son principales, a diferencia deK[x], donde todos sus ideales son principales; para ello, en el anillo de polinomios hay que establecer un orden entre las indeterminadas, y por ende, entre los monomios, para así poder hacer una buena elección del conjunto de generadores de un ideal, que es de mucha importancia para definir las bases de Gröbner.
Ahora, para el caso denindeterminadas, seaKun cuerpo cualquiera de característica cero (no existen ∈ Ntal quen·1 = 0, connel menor entero positivo enK). Con- sideremosK[x1, . . . , xn], el anillo de polinomios en las indeterminadasx1, . . . , xncon coeficientes enNy≺un orden admisible sobreM, el conjunto de todos los monomios en K[x1, . . . , xn].
Paraf, g∈K[x1, . . . , xn]cong 6= 0, diremos quef se reduce ahmódulogen un pasosi y solo silm(g)divide alm(f)yhse obtiene mediante la siguiente ecuación:
h=f−lt(f)lt(g)g. Sif se reduce ahmódulogen un paso, esto lo denotaremos comof −→g h.
Por ejemplo, consideremos el orden lexicográfico≺lexconx≺y enQ[x, y]. Sean f, g∈Q[x, y]dados por
f = 6x3y+ 4x2y+ 4y3, g= 2xy+y3.
Comolm(f)divide alm(g), sustituyendo porf ygse obtiene queh=−3x2y3+ 4x2y+ 4y3, entoncesf −→g h.
La definición anterior puede ser extendida para reducir un polinomiof módulo un conjunto no vacío de polinomios como sigue.
Dadosf, r, f1, . . . , ft ∈ K[x1, . . . , xn]polinomios confi 6= 0y el conjunto F = {f1, . . . , ft}, diremos que f se reduce armóduloF si y solo si existe una sucesión de índices {i1, . . . , is} ⊂ {1, . . . , t} y una sucesión de polinomios h1, . . . , hs−1 en K[x1, . . . , xn]tales que
f −−→fi1 h1 fi
−−→2 h2 fi
−−→3 h3· · ·
fi
−−−−s−1→hs−1
fis
−−→r.
Sif se reduce armódulo, al conjuntoFlo denotaremos comof −F→+ r. El polinomio rse denominareducción o resto del polinomiofmódulo el conjuntoF.
Notemos que sires la reducción de f módulo el conjuntoF, entonceslm(r)no puede ser dividido por ningúnlm(fi)parai = 1, . . . , t; es decir, si para algún índice
s ∈ {1, . . . , t},lm(fs)divide alm(r), entoncesrse puede reducir móduloF, lo cual sería una contradicción, ya queres la reducción def móduloF.
Finalmente, presentaremos la definición de las bases de Gröbner y las herramientas para su cálculo, además del algoritmo propuesto porBruno Buchberger. Para ello, dadoa deK[x1, . . . , xn], unabase de Gröbnerpara el idealaes un conjuntoG={g1, . . . , gs} de elementos deatal que
hlm(g1), . . . , lm(gs)i=l(a).
Esta definición de base de Gröbner resuelve el problema de pertenencia a un ideal en polinomios denindeterminadas. Sin embargo, no nos dice cómo construir la base de Gröbner para un idealade una baseG. La idea del algoritmo de Buchberger es completar la baseGañadiendo un número finito de polinomios.
Introducimos la siguiente definición como una herramienta para la construcción del algoritmo de Buchberger:
Dado≺un orden admisible enM, seanf1, f2un par de elementos mónicos fijos en K[x1, . . . , xn].El S-polinomiodef1, f2con respecto a≺, denotado porS(f1, f2), es el polinomio dado por
S(f1, f2) =lcm(lm(f1), lm(f2))
lm(f2) f1−lcm(lm(f1), lm(f2)) lm(f2) f2.
Teorema 1(Teorema de Buchberger). SeaG={g1, . . . , gs}un conjunto no vacío de polinomios enK[x1, . . . , xn]. EntoncesGes un base de Gröbner para el idealI=hGisi y solo siS(gi, gj)−G→+0, para todoi6=j.
La demostración del teorema anterior puede ser encontrada en [4].
A continuación presentaremos el algoritmo de Buchberger, que es un método de gran importancia para determinar las bases de Gröbner.
Algoritmo de Buchberger
Comenzamos con un conjunto no vacío de polinomiosF ={f1, . . . , fn}y un ideal a=hf1, . . . , fkidados.
Calculamos todos los S-polinomios y los reducimos móduloF.
S(fi, fj)−F→+hyh6= 0extendemosF =F∪ {h}.
Calculamos todos los S-polinomios que aún no han sido calculados y los reducimos móduloF. Continuamos hasta que no se obtengan nuevos polinomios no nulos.
Notemos que siS(fi, fj)−F→+ hconh6= 0, entonces lm(h)∈ hlm(f/ 1), . . . , lm(fk)i,
razón por la cual, cada vez que extendemos el conjunto de generadores, también exten- demos el ideal monomial generado por los monomios líderes de los generadores con el
monomio líder deh. La terminación de este proceso es garantizada por ellema de Dickson, que establece que todo ideal monomial enK[x1, . . . , xn]es un anillo de polinomios sobre un cuerpoK, el cual es finitamente generado. La prueba del lema de Dickson puede ser vista en [10].
Resumiendo, la existencia de las bases de Gröbner para un ideal está dada por el teorema de Buchberger y el lema de Dickson. Para calcularlas es necesario establecer un orden sobre el conjunto de monomios del anillo de polinomios. Por tales razones nos referimos a la base de Gröbner de un ideal módulo un conjunto de polinomios respecto a un orden previamente fijado, donde debemos considerar lo siguiente:
Kes un cuerpo de característica cero.
{x1, . . . , xn}es un conjunto de indeterminadas sobreK.
K[x1, . . . , xn]es el anillo de polinomios en las indeterminadas{x1, . . . , xn}con coeficientes enK.
Mes el conjunto de los monomios del anillo de polinomios.
≺es un orden admisible sobreM.
El ideal deadeK[x1, . . . , xn].
El conjuntoG={g1, . . . , gt}de polinomios no nulos de elementos dea.
Ahora,Ges la base de Gröbner paraarespecto a≺si y solo si ocurre al menos una de las siguientes condiciones:
hlm(g1), . . . , lm(gs)i=l(a)ó S(gi, gj)−G→+0para todoi6=j.
Por ejemplo, consideremos el orden lexicográfico≺lexconx≺yenR[x, y]. Sean f1, f2, f3∈Q[x, y]dados porf1=y2+yx+x2,f2=y+x,f3=y
Comenzamos con el conjuntoF :={f1, f2, f3}
S(f1, f2) =x2,S(f1, f2)−F→x26= 0, obtenemosf4 =x2. Extendemos el conjuntoF =FS
{f4}={f1, f2, f3, f4} S(f1, f3) =yx+x2,S(f1, f3)−→f3 x2−→f4 0.
S(f2, f3) =x,S(f2, f3)−F→+x6= 0, obtenemosf5 =x.
Extendemos el conjuntoF =FS
{f5}={f1, f2, f3, f4, f5}.
S(f1, f4) =x3y+x4,S(f1, f4)−→f3 x4−→f4 0.
S(f2, f4) =x3,S(f2, f4)−→f4 0.
S(f3, f4) = 0 S(f4, f5) = 0
Como todos los S-polinomios se reducen a cero móduloF, tenemos que la base de Gröbner para el idealacon respecto al orden≺lexesG={f1, f2, f3, f4, f5}.
4. El problema de la alcanzabilidad
En esta sección daremos una forma alternativa para resolver el problema de alcanza- bilidad de estados en SED. Para ello será utilizado el contenido básico necesario de las redes de Petri y las bases de Gröbner dado en las secciones 2 y 3, junto con una forma polinomial para representar las marcaciones y transiciones.
4.1. Definiciones básicas
Definición 1. DadaM = (R, m0)una red de Petri marcada con marcación inicialm0, para cada marcaciónn∈Nnconn=|L|, el polinomio formal
P ol(m) := Y
li∈L
lm(li i), con i= 1,· · ·,|L|
será llamado elpolinomio asociado a la marcaciónm.
Los elementos referidos en la definición anterior están en el conjunto de monomios Mcon indeterminadasl1, . . . , ln∈L, y las potenciasm(li)corresponden al número de fichas en el lugarliconi= 1, . . . ,|L|.
Definición 2. DadaM = (R, m0)una red de Petri marcada con marcación inicialm0, para cada transicióntj, el polinomio formal
P ol(tj) := Y
li∈L
l#(li i,E(tj))− Y
li∈L
l#(li i,S(tj)), con i= 1, . . . ,|L|,
será llamadoel polinomio asociado atj. 4.2. Estructura dinámica
Para representar la estructura dinámica debemos considerar la relación entre los polino- mios de transición y los polinomios de marcación, y la manera como dicha relación afecta los disparos de las transiciones en los polinomios de marcación. Para ello consideremos lo siguiente:
Seam∈Nny seat∈ E(m); por definición, tenemos que el polinomio asociado am es dado porP ol(m) :=Y
l∈L
lm(l), y el polinomio asociado ates dado por
P ol(t) := Y
li∈L
l#(l,E(t))−Y
l∈L
l#(l,S(t)); llamemos
ϕ=Y
l∈L
l#(l,E(t)) y ξ=Y
l∈L
l#(l,S(t)), entoncesP ol(t) =ϕ−ξ.
Ahora, comot∈ E(m), entoncesm(l)≥#(l, E(t)),para todol∈L.
Para cadal∈L, seaKl∈Ntal quem(l) = #(l, E(t)) +Kl; entonces, P ol(m) =Y
l∈L
lm(l)=Y
l∈L
l#(l,E(t))+Kl
=Y
l∈L
lKlY
l∈L
l#(l,E(t)).
Sea
u=Y
l∈L
lKl ∈M, entonces
P ol(m) =uY
l∈L
l#(l,E(t)); es decir,P ol(m) =uϕ.
Seam0la marcación resultante del disparo det∈ E(m), entonces P ol(m0) =Y
l∈L
lm0(l);
perom0(l) =m(l)−#(l, E(t)) + #(l, S(t)); así, P ol(m0) =Y
l∈L
lm(l)−#(l,E(t))+#(l,S(t))=Y
l∈L
lm(l)−#(l,E(t))Y
l∈L
l#(l,S(t))
=Y
l∈L
lKlY
l∈L
l#(l,S(t)) =uξ.
Por lo tanto,P ol(m0) =uξ. Esto es,P ol(m0) =P ol(m)−uP ol(t) =uξ.
Ejemplo 1. Consideremos la siguiente red de Petri marcadaM = (R, m0), como se muestra en la figura 4.
l1 l2
l3
t1
Figura 4.RP marcada
El polinomio asociado a la marcaciónmes
P ol(m) = (l2)2
y el polinomio asociado a la transiciónt1esP ol(t1) =l1l2−l3. En este caso tenemos quetno es habilitada enm. De hecho,Kl =−1.
Ejemplo 2. Consideremos la red de Petri marcadaM = (R, m0), dada gráficamente en la figura 5, cuyo polinomio de marcación paramesP ol(m) = (l1)(l2)2y el polinomio
l1 l2
l3
t1
Figura 5.RP marcada conm= (1,2,0).
asociado at1esP ol(t1) =l1l2−l3;t1es habilitada enm. La marcación resultante del disparo det1esm0. En términos de polinomios, esto es
P ol(m0) =P ol(m)−uP ol(t1) =l1(l2)2−l2(l1l2−l3)
=l1(l2)2−l1(l2)2+l2l3=l2l3. (1) Gráficamente el disparo es representado por la red de la figura 6.
l1 l2
l3
t1
Figura 6.RP marcada para representar el disparo det1.
Observación 1. Seamnuna marcación alcanzable desdem0port1· · ·tn, y seamjcon j= 1, . . . , n, las marcaciones sucesivas para las cualesmj=δ(mj−1, tj),j= 1, . . . , n;
es decir,
m0 t1
−→m1 t2
−→m2· · ·−→tn mn.
En términos polinomiales, la secuencia de disparos de transiciones es escrita como P ol(m0)−→t1 P ol(m1)−→t2 P ol(m2)· · ·−→tn P ol(mn),
dondeP ol(mn) =unξn; es decir,P ol(mn) =P ol(mn−1)−unP ol(tn), pero la marca- ciónmn−1es alcanzable desde la marcaciónmn−2, esto es,
P ol(mn−1) =P ol(mn−2)−un−1P ol(tn−1).
Sustituyendo, tenemos que
P ol(mn) =P ol(mn−2)−un−1P ol(tn−1)−unP ol(tn).
Procediendo recursivamente hasta llegar a la marcación inicialm0, obtenemos P ol(mn) =P ol(m0)−u1P ol(t1)− · · · −unP ol(tn).
Teorema 2(Alcanzabilidad y equivalencia de polinomios). DadosM = (R, m0)una red de Petri marcada reiniciable con marcación inicialm0, yP :={P ol(t) :t ∈ T}
el cual es no vacío, entonces una marcación m es alcanzable desdem0 si y solo si P ol(m0) =P P ol(m).
Demostración. Supongamos quemes alcanzable desde la marcación inicialm0. Entonces, existe una sucesión de disparos de transicionest1· · ·tntal que
m0 t1
−→m1· · ·−−−→tn−1 mn−1
tn
−→m, (2)
equivalentementeP ol(m) =P ol(m0)−u1P ol(t1)− · · · −unP ol(tn), para algunos u1, . . . , unenK[l1, . . . , ln].
Luego,P ol(m0)−P ol(m) =u1P ol(t1)+· · ·+unP ol(tn), y por lo tantoP ol(m0) =P P ol(m).
Recíprocamente, supongamos queP ol(m0) =P P ol(m). Entonces P ol(m0) =P ol(m)±u1P ol(t1)± · · · ±unP ol(tn). Procedemos a realizar la prueba por inducción sobren.
Supongamosn= 0, entoncesP ol(m0) =P ol(m). Por definición, Y
l∈L
lm0(l)=Y
l∈L
lm(l).
Como el conjunto de lugares es fijo en ambas representaciones, las marcaciones son iguales, es decir,m0=m. Por lo tanto,mes alcanzable desdem0(basta tomarθcomo la sucesión de disparos).
Para el paso inductivo asumimos que la marcaciónm0es alcanzable desdem0si P ol(m0) =P ol(m0)±u1P ol(t1)± · · · ±un−1P ol(tn−1),
para unnfijo. Ahora, supongamos quemes una marcación enM = (R, m0)tal que P ol(m0) =P ol(m)±u1P ol(t1)± · · · ±unP ol(tn).
Entonces, para algúni∈ {1, . . . , n}se tiene queP ol(m0) =uiϕi, o bienP ol(m0) = uiξi, dondeP ol(ti) =ϕi−ξi.
Caso 1:P ol(m0) =uiϕi.
Por la dinámica que sigue una red de Petri,m0habilita alguna transicióntiy esto da paso a la ocurrencia de una nueva marcaciónm0:m0
ti
−→m0; entonces P ol(m0) =P ol(m)±u1P ol(t1)± · · · ±ui−1P ol(ti−1)
±ui+1P ol(ti+1)· · · ±unP ol(tn).
Así, la marcaciónmes alcanzable desde la marcaciónm0, pero por hipótesis inductivam0 es alcanzable desdem0. Por lo tanto,mes alcanzable desdem0.
Caso 2:P ol(m0) =uiξi.
Por la dinámica establecida y la reiniciabilidad, hay una marcaciónm0tal que P ol(m0) =P ol(m)±u1P ol(t1)± · · · ±ui−1P ol(ti−1)
±ui+1P ol(ti+1)· · · ±unP ol(tn);
de esto tenemos que la marcaciónmes alcanzable desdem0por el disparo de la transición ti. ComoM(R, m0)es reiniciable, se tiene también quem0es alcanzable desdem. Por lo tanto,mes alcanzable desdem0.
El siguiente resultado es consecuencia inmediata del teorema anterior:
Corolario 1(Determinación de la alcanzabilidad por bases de Gröbner). La alcanza- bilidad en una red de Petri reiniciable puede ser determinada usando bases de Gröbner.
Demostración. SeaKun cuerpo de característica cero, yP ⊆K[l1, . . . , ln]con indeter- minadasli∈L, dondeP :={P ol(t) :t∈T}.
SeaGuna base de Gröbner paraP. Entonces,P ol(m0) =P P ol(m)sí y solo si existe p∈K[l1, . . . , ln]tal queP ol(m)−G→pyP ol(m0)−Q→p. Así, debido al teorema anterior, la marcaciónmes alcanzable desdem0.
Observación: Conviene hacer notar que hasta el momento hemos hecho referencia al ideal generado por monomiales porque ellos representan de manera apropiada la estructura de las RP; sin embargo, notemos que la dinámica representada por los polinomios de
transición es generada por un ideal binomial. Esta estructura es compatible para el análisis de problemas relacionados con el bloqueo, la vivencia, el acotamiento, etc, en las RP.
Nosotros referimos al lector a [9]. Aquí se tratan aplicaciones en programación entera (problemas de transporte, entre otros) cuyos argumentos teóricos son expresados mediante algoritmos que podrían ser útiles para dar solución a los problemas mencionados con anterioridad.
A continuación presentaremos un ejemplo para ilustrar la importancia y aplicación del corolario anterior.
Ejemplo 3. Consideremos la siguiente red de Petri reiniciable marcadaM = (R, m0), con marcación inicialm0, tal como se muestra en la figura 7.
l1 t1 l3
l2
t2
l7 t5 l6
t3
l4
t4
l5
t6
l8
t7
t8
Figura 7.RP marcada reiniciable.
Aquí,L={l1, . . . , l8}yT ={t1, . . . , t8}, y los polinomios asociados a cada una de las transiciones son:
P ol(t1) =l1−l2l3
P ol(t3) =l3l6−l4
P ol(t5) =l7−l6
P ol(t7) =l3l8−l1
P ol(t2) =l2−l7
P ol(t4) =l4−l5 P ol(t6) =l5−l3l8
P ol(t8) =l8−l7
Luego,P ={P ol(t1), . . . , P ol(t8))}.
Usando MAPLE calculamos la base de GröbnerGcon respecto al orden≺grlexpara P, lo cual da como resultadoG={l7−l8, l6−l8, l4−l5, l3l8−l5, l2−l8, l1−l5}. El polinomio asociado am0esP ol(m0) =l1.
¿Será la marcaciónmcuyo polinomio asociado esP ol(m) =l3l6 alcanzable desde m0?
Usando MAPLE con respecto al orden≺grlexnotamos que P ol(m0)−G→l5, y P ol(m)−G→l5.
Luego, por el corolario anterior se tiene que la marcaciónmcuyo polinomio asociado es P ol(m) =l3l6es alcanzable. Ahora veamos si la marcaciónm1con polinomio asociado P ol(m1) = l1(l5)2(l8)2 es alcanzable desde la marcación inicial, cuyo polinomio es P ol(m0) =l1. Nuevamente usando MAPLE y considerando el orden≺grlex, se verifica queP ol(m0)−G→l5yP ol(m1)−G→(l5)3(l8)2. Luego, por el corolario, la marcaciónm1
cuyo polinomio asociado esP ol(m1)no es alcanzable desde la marcación inicial.
5. Conclusiones
La solución del problema de alcanzabilidad de estados, tal como es expuesto en la sección 4, expresa un algoritmo que es un simplificador canónico que motiva el estudio de algunas otras propiedades de los SED. Justamente, uno de los principales objetivos de la teoría de SED es desarrollar métodos formales que permitan tratar estos sistemas para su modelación, análisis y control. En este sentido, la teoría de bases de Gröbner es muy útil y permite el manejo de sistemas complejos.
Referencias
[1] W. W. Adams and P. Loustaunau,An Introduction to Gröbner Bases, Graduate studies in mathematics, American Mathematical Society, 1994.
[2] R. Al-Jaar and A. Deroscher,Petri nets in automation and manufacturing, Advances in Automation and Robotics,2(1990), 153-225.
[3] B. Buchberger, Ein algorithmus zum auffinden der basiselemente des restklas- senringes nach einem nulldimensionalen polynomideal, Ph.D. thesis, University of Innsbruck, German, 1965.
[4] B. Buchberger and F. Winkler,Gröbner bases and applications, Lecture note series, Cambridge University Press, 1998.
[5] S. Eilenberg,Automata, Languages, and Machines, Pure and Applied Mathematics, Elsevier Science, 1974.
[6] G. Mata, A. Méndez, J. Cardillo y E. Chacón,Modelación de exclusión mutual de sistemas de eventos discretos con redes de Petri, Revista de Ciencias e Ingeniería36 (2015).
[7] T. Murata,Petri nets: properties, analysis and applications, Proceedings of the IEEE, 77(1989), 541-580.
[8] J. L. Peterson,Petri net theory and the modeling of systems, Prentice Hall PTR, 1981.
[9] B. Sturmfels,Gröbner bases and convex polytopes, University Lecture Series Vol. 8, American Mathematical Society, Providence, Rhode Island, 1962.
[10] R. D. Torrealba F.,Representación matricial de polinomios y una aplicación para calcular bases de Gröbner, tesis de licenciatura, Universidad de los Andes, Departa- mento de Matemáticas, 2013.
Recibido en noviembre de 2015. Aceptado para publicación en abril de 2016.
GUELVISMATA DEPARTAMENTO DEMATEMÁTICAS, FACULTAD DECIENCIAS UNIVERSIDAD DE LOSANDES MÉRIDA, VENEZUELA e-mail:[email protected] ABDULLUGO COORDINACIÓN DEPROCESOSQUÍMICOS UNIVERSIDADPOLITÉCNICATERRITORIAL DELOESTE DESUCRE“CLODOSBALDORUSSIÁN” CUMANÁ, VENEZUELA e-mail:[email protected] GERMALISROJAS DEPARTAMENTO DEMATEMÁTICAS, FACULTAD DECIENCIAS UNIVERSIDAD DE LOSANDES MÉRIDA, VENEZUELA e-mail:[email protected]