3.6 Algoritmos de filtrado
3.6.2 Reducción de duplicados de la dirección MAC
Tal y como se ha mencionado en apartados anteriores, los sensores BT realizan la detección de la dirección MAC de los dispositivos BT que entran en el alcance del sensor, pudiendo producirse varías detecciones de la misma MAC en el intervalo de tiempo que el dispositivo permanece en esa área. Pero también se pueden detectar repeticiones de la misma MAC debidas a un paso periódico del dispositivo, por ser un itinerario habitual del usuario. Además, se realizan detecciones de direcciones MAC asociadas a dispositivos que no están embarcados en vehículos, pero que se encuentran en la zona de detección del sensor.
En la Imagen 15, se ilustra como la dirección MAC de un dispositivo BT puede ser detectada repetidas veces mientras el vehículo que lo transporta se encuentra en el
Estado de la Técnica 55
alcance del sensor, marcado por la zona en rojo (ejemplo antena polarización horizontal).
Imagen 15: Detecciones repetidas de una dirección MAC en un sensor
Existen varias tendencias en este tipo de proceso de reducción de datos. Hay que tener en cuenta que la mayoría de los estudios se han realizado para el cálculo del tiempo de viaje, y por lo tanto es muy importante reducir el error espacial en la detección. La solución ideal sería poder quedarse con una única MAC por dispositivo y que ésta correspondiese con la posición del sensor, así la diferencia entre los tiempos de detección registrados en cada sensor permitiría obtener el tiempo de viaje.
Los estudios realizados han evaluado como afecta al cálculo del tiempo de viaje las diferentes opciones existentes en lo relativo a la reducción de las detecciones de la MAC en el sensor, seleccionando como el timestamp de la detección una de las siguientes opciones de entre todos los registros de la misma MAC, ver Imagen 16:
• Primera aparición en cada sensor. • Última aparición en cada sensor. • Valor medio de las dos primeras.
• Combinaciones de las dos primeras (primero-último, último-primero). • Utilizando el valor máximo del RSSI.
56 Estado de la Técnica
Imagen 16: Opciones de emparejamiento de direcciones MAC
En el estudio planteado por Porter et al., 2011 se realizó una comparativa para diferentes tipos de antenas, aplicando los siguientes tipos de algoritmos de emparejamiento, siendo SBT1 el primer sensor y SBT2 el segundo:
• Valor medio del timestamp de todas las detecciones en el SBT1 y en el SBT2.
• Timestamp de la primera detección en SBT1 con timestamp de la primera detección en SBT2.
• Timestamp de la primera detección en SBT1 con timestamp de la última detección en SBT2.
• Timestamp de la última detección en SBT1 con timestamp de la primera detección en SBT2.
• Timestamp de la última detección en SBT1 con timestamp de la última detección en SBT2.
En la Tabla 3 solo se muestran los mejores resultados que se obtuvieron, aplicando estos 5 algoritmos de reducción de direcciones MAC, para cada tipo de antena. Los valores que se tomaron como referencia fueron los que se obtuvieron con un conjunto de vehículos de prueba en los que se registraba el tiempo de viaje. Tal y
Estado de la Técnica 57
como se puede observar en la Tabla 3, los mejores resultado se obtienen cuando se selecciona como timestamp de la detección de la MAC el valor medio del timestamp de la primera y última detección.
180 Degree Omni Dual Circular Yagi
8/17 - 7/27 - 7/30 - 8/27 - 8/8 - 8/20 - 8/31 - 9/7 - 8/24 - 9/10 -
Calculation
Method Avg-Avg Avg-Avg Avg-Avg Avg-Avg First-First Avg-Avg Avg-Avg Last-Last Avg-Avg Avg-Avg
Absolute Average Error 6,38% 6,06% 3,26% 6,61% 4,02% 4,08% 4,38% 5,88% 8,05% 7,82% Maximum 15,7 16,4 8,16 13,2 11,3 7,94 9,84 15,2 21,0 16,4 Minimum 0,00 0,00 0,00 1,85 0,00 0,00 0,00 0,00 1,27 0,94 Standard Deviation 5,25% 5,55% 2,51% 3,69% 3,25% 2,96% 3,53% 5,15% 6,74% 5,24% Combined Absolute Avg Error 6,22% 4,91% 4,06% 5,02% 7,91% Relative Average Error 0,08% -3,63% -1,21% -7,08% 0,17% -2,86% -3,22% -6,02% -1,10% -7,68% Standard Deviation 8,20% 8,03% 4,13% 3,83% 5,38% 4,27% 4,95% 4,51% 11,67% 6,64%
Tabla 3: Precisión cálculo tiempo de viaje en función antena y algoritmo de reducción datos MAC (Porter et al., 2011)
Otro método que se ha utilizado en la bibliografía, para la reducción de datos del sensor BT, es el uso del valor del RSSI.
El RSSI se define como:
RSSI = 10 log (P/Pref) ( 2 ) Dónde:
• P es la potencia en el punto de recepción de la señal. • 𝑃𝑃𝑟𝑟𝑟𝑟𝑟𝑟 es la potencia de referencia.
Teniendo en cuenta que la P es inversamente proporcional al cuadrado de la distancia, el valor de RSSI teóricamente podría ser utilizado como una forma de mediar la distancia del dispositivo BT a la antena.
58 Estado de la Técnica
Los estudios realizados por Parameswaran et al., 2009, para demostrar si el valor del RSSI se podría usar para medir la distancia entre motas con comunicaciones Zigbee, concluyeron que no puede ser usado para calcular la distancia métrica entre el sensor y el dispositivo, ver Imagen 17.
Imagen 17: Valores RSSI en función de la distancia (Parameswaran et al., 2009)
El estudio realizado por Awad et al., 2007, demostró que el valor del RSSI estaba influenciado por varios factores:
• La potencia de transmisión. • La frecuencia de radio.
• Las características de la antena.
• La calidad de las medidas de referencia. • Los algoritmos de localización.
• La presencia de obstáculos en la zona de detección.
En las pruebas de laboratorio se obtuvieron errores medios de localización de 0,5 m sobre un área de estudio de 3,5 x 4,5m.
En la aplicación de la tecnología BT a la sensorización del tráfico hay algunos factores que son controlables, pero otros que tienen difícil control como son la
Estado de la Técnica 59
obtención de medidas de referencia de calidad, los obstáculos, las condiciones ambientales, etc.
En el estudio realizado por Araghi et al., 2012, se analizan tres tipos de filtrado, primero-primero, último-último y el mayor-mayor, referido este último al timestamp asociado al valor de mayor señal RSSI de todas las detecciones de una MAC en el sensor.
El experimento se realiza en un tramo muy corto de tan solo 550m, con una zona de cobertura del sensor que variaba entre los 75 y 200m a ambos lados del sensor. En sus conclusiones plantearon que el filtrado, teniendo en cuenta el RSSI proporcionaba mejores resultados estadísticos. Sin embargo, los datos presentados generan algunas dudas sobre la validez de los resultados, ya que se perdían casi la mitad de las muestras respecto al filtrado de la primera aparición o la última y no se da ninguna explicación a este hecho. El aplicar un método de filtrado u otro no debería producir la pérdida de tránsitos de forma tan significativa, solo debería influir en la precisión de la medida del tiempo de viaje. Además hay que tener en cuenta que en el estudio realizado por Malinovskiy et al., 2010, aconsejaban separaciones superiores a los 1,6 Km entre sensores para reducir errores en los resultados.
Otra aspecto que se ha estudiado es el lugar donde realizar la eliminación de las repeticiones, así cuando este proceso se realiza en el sensor BT, el envío de información se reduce significativamente, tal y como demuestran en su estudio Puckett & Vickich, 2010, donde obtuvieron una reducción media del 90%.
Cuando se afirma que una dirección MAC puede ser registrada repetidas veces por un mismo sensor, normalmente se refiere a un número reducido de detecciones que se producen en unos pocos segundos, los que el vehículo tarda en atravesar la zona de detección del sensor. Sin embargo, en caso de congestión o de que un vehículo se detenga en la zona de detección el número de repeticiones puede ser mucho mayor.
También se pueden tener detecciones de una misma MAC que aparezca en intervalos distintos. Por ejemplo, un vehículo que sigue el mismo trayecto para ir al
60 Estado de la Técnica
trabajo puede generar repeticiones de la MAC en cuatro o más intervalos distintos. En estos casos solo debería existir un registro de la MAC, por cada intervalo de detección.
Para solucionar este problema, Wasson & Bullock, 2012, aplican un algoritmo de reducción de datos que se basa en establecer ventanas fijas de tiempo. De tal forma que solo se quedan con la primera aparición de una dirección MAC en la ventana de tiempo fijada. Respecto a la elección del tamaño de la ventana, proponen que se debe fijar analizando el tipo de problema a estudiar, teniendo en cuenta que no se filtren direcciones que podrían ser válidas por trayectos periódicos. En el estudio publicado la ventana se fijó en 3.600 s. Al aplicar esta ventana de tiempo reducen la muestra de datos de los sensores BT en un 86%. Este algoritmo realiza un segundo refinamiento que consiste en analizar las zonas cercanas a los límites de la ventana para eliminar direcciones repetidas que se hayan tomado en ambas zonas. Para ello fijan un desplazamiento a ambos lados de la frontera analizando que no hayan MAC repetidas, en el caso de encontrar una repetición se quedan con la primera aparición. En este refinamiento se realiza la eliminación del 0,012% de las muestras obtenidas.