Capítulo 6. Resultados y discusión
6.3 Algoritmo C5.0
6.3.2 Algoritmo C5.0 árbol de decisión basado en reglas
74 En el gráfico 8, se observa que las características con área de influencia de 100 y 200 metros de accidentes con y sin lesión, son las más importantes, seguidas de intersecciones, semáforos, cruces peligrosos y paradas de RTP y trolebús son las principales, además de bancos, hoteles y centros nocturnos.
75
Cuadro 22. Iteraciones boosting del modelo C5.0 ejecutado en R.
Fuente: Elaboración propia con información de los resultados del modelo generado.
Como se observa en el cuadro 22, la iteración con el menor error es la iteración 0, con un error del 16.6%, el número de reglas generadas para esta iteración es de 20; este árbol tiene un tamaño de 60 y en 15,648 muestras la clasificación fue incorrecta, por lo que se eligió ese conjunto de reglas para mostrar los patrones encontrados:
76
Cuadro 23. Reglas de clasificación del modelo C5.0 ejecutado en R.
Fuente: Elaboración propia con información de los resultados del modelo generado.
--- Trial 0: --- Rules:
Rule 0/1: (47448/5459, lift 1.4) Rule 0/2: (46858/15639, lift 1.7) cruce_peligroso <= 0 interseccion > 0 interseccion <= 0 -> class SI [0.666]
metro <= 0 metrobus <= 0 traffic_signals <= 0 -> class NO [0.885]
Rule 0/3: (28706/1052, lift 1.6) Rule 0/4: (32956/2444, lift 1.5)
rtp <= 0 hospital_300 <= 0
ACC_C_LESION_100 <= 1 interseccion <= 2 ACC_S_LESION_100 <= 1 restaurant <= 0
-> class NO [0.963] rtp <= 0
traffic_signals <= 0 ACC_C_LESION_100 <= 4 ACC_S_LESION_100 <= 7 ATROPELLADO_FATAL_200 <= 1 OTROS_200 <= 1
PER_ATRAPADO_DESBARRANCADO_200 <= 0 VEH_ATRAPADO_100 <= 0
-> class NO [0.926]
Rule 0/5: (29717/1478, lift 1.6) Rule 0/6: (2260/220, lift 2.3)
rtp <= 0 rtp > 0
ACC_C_LESION_100 <= 0 ACC_S_LESION_100 > 30
ACC_S_LESION_100 <= 4 -> class SI [0.902]
ATROPELLADO_100 <= 2 -> class NO [0.950]
Rule 0/7: (226/20, lift 2.3) Rule 0/8: (682/17, lift 2.5)
metrobus > 0 traffic_signals > 0
-> class SI [0.908] -> class SI [0.974]
Rule 0/9: (174/23, lift 2.2) Rule 0/10: (5134/711, lift 2.2)
metro > 0 interseccion > 2
-> class SI [0.864] ACC_S_LESION_100 > 1
PER_ATRAPADO_DESBARRANCADO_200 > 0 -> class SI [0.861]
Rule 0/11: (25225/490, lift 1.6) Rule 0/12: (367/30, lift 2.4)
ACC_S_LESION_100 <= 0 rtp_300 > 0
-> class NO [0.981] trolebus > 0
ATROPELLADO_200 > 13 -> class SI [0.916]
Rule 0/13: (27262/807, lift 1.6) Rule 0/14: (98/18, lift 1.3)
rtp <= 0 hospital_300 <= 0
ACC_S_LESION_100 <= 1 interseccion <= 2
ATROPELLADO_100 <= 0 ACC_C_LESION_100 <= 4
-> class NO [0.970] ACC_S_LESION_100 > 4
ACC_S_LESION_100 <= 8 ATROPELLADO_FATAL_200 > 1 OTROS_200 <= 1
-> class NO [0.810]
Rule 0/15: (31140/1623, lift 1.6) Rule 0/16: (424/12, lift 2.5)
interseccion <= 2 cruce_peligroso > 0
rtp <= 0 -> class SI [0.969]
ACC_C_LESION_100 <= 1 ACC_S_LESION_100 <= 4 -> class NO [0.948]
Rule 0/17: (94/16, lift 1.3) Rule 0/18: (44/2, lift 2.4)
interseccion <= 2 bar > 0
rtp <= 0 nightclub_300 > 0
ACC_C_LESION_100 > 4 -> class SI [0.935]
ACC_S_LESION_100 > 4 ACC_S_LESION_100 <= 8 ATROPELLADO_100 <= 21 MOTOCICLISTA_100 > 2 VEH_ATRAPADO_100 <= 0 -> class NO [0.823]
Rule 0/19: (5784/740, lift 2.2) Rule 0/20: (352/29, lift 2.3)
interseccion > 2 rtp > 0
ACC_S_LESION_100 > 1 PER_ATRAPADO_DESBARRANCADO_100 > 1
VOLCADURA_200 > 2 -> class SI [0.915]
-> class SI [0.872]
77 Cada regla consiste en lo siguiente:
Número, es el número de la regla que es únicamente para identificarla.
Tiene estadística (𝑛, 𝑙𝑖𝑓𝑡 𝑥) o (𝑛/𝑚, 𝑙𝑖𝑓𝑡 𝑥) resume el desempeño de la regla. Parecido a una hoja, 𝑛 es el número de casos cubiertos por la regla y 𝑚, si aparece, nos muestra cuántos de ellos no pertenecen a la clase predicha por la regla. La precisión de la regla es estimada por la tasa de laplace (𝑛 − 𝑚 + 1) / (𝑛 + 2). EL valor lift es el resultado de dividir la precisión estimada de la regla entre la frecuencia relativa de la clase predicha del conjunto de entrenamiento.
Una o más condiciones que deben de cumplirse si la regla es aplicable.
Clase predicha por la regla.
El valor entre cero y uno indica la confianza con que la clasificación fue hecha.
Por ejemplo, la regla uno:
(47448/5459, 𝑙𝑖𝑓𝑡 1.4) De las muestras 47,448 que aplican a esta regla 5,459 no estuvo correctamente clasificada.
Las condiciones son:
Si cruce peligroso es menor o igual a 0 y:
Si intersección es menor o igual a 0 y:
Si metro es menor o igual a 0 y:
Si metrobus es menor o igual a 0 y:
Si semáforo es menor o igual a 0 entonces:
La clase predicha por la regla es “NO”
El valor entre cero y uno es 0.885.
De las reglas anteriores se pueden distinguir los siguientes patrones para la ocurrencia de los accidentes de tránsito, en orden de importancia:
Regla 8. Cuando hay al menos un semáforo en el hexágono, lo cual indica que las intersecciones son donde mayormente ocurren los accidentes.
Regla 16. Cuando hay al menos un cruce peligroso en el hexágono, aquí interviene el hecho de que es una intersección y la mala calidad de infraestructura urbana en el cruce.
78
Regla 18. Cuando hay al menos un bar o al menos un hexágono es alcanzado por el área de influencia de los clubes nocturnos en un radio de 300 metros.
Regla 12. Cuando en el hexágono al menos hay una estación de trolebús, al menos un hexágono es alcanzado por el área de influencia de las estaciones de RTP en un radio de 300 metros y hay más de 13 accidentes dentro del área de influencia de los accidentes donde hay atropellados en un radio de 200 metros.
Regla 20. Cuando hay al menos una estación de RTP y hay más de 1 accidente dentro del área de influencia de los accidentes donde hubo atrapados o desbarrancados en un radio de 100 metros.
Regla 7. Cuando hay al menos una estación de Metrobus.
Regla 6. Cuando hay al menos una estación de RTP y hay más de 30 accidentes dentro del área de influencia de los accidentes donde no hay lesionados en un radio de 100 metros.
Regla 19. Cuando hay más de dos intersecciones, más de 1 accidente dentro del área de influencia de los accidentes donde no hay lesionados en un radio de 100 metros y donde hay más de 2 accidentes dentro del área de influencia de los accidentes donde hay volcaduras en un radio de 200 metros.
Regla 9. Donde hay al menos una estación del metro.
Regla 10. Donde hay más de 2 intersecciones, más de 1 accidente dentro del área de influencia de los accidentes donde no hay lesionados en un radio de 100 metros y donde al menos hay un accidente dentro del área de influencia de los accidentes donde hay desbarrancado o atrapado en un radio de 200 metros.
Regla 2. Donde hay al menos una intersección.
De los patrones de la NO ocurrencia de los accidentes son los siguientes en orden de importancia:
Regla 11. Donde no hay un accidente sin lesionados.
79
Regla 13. Donde no hay parada RTP, uno o menos accidentes dentro del área de influencia de los accidentes donde no hay lesionados en un radio de 100 metros y donde no hay accidentes dentro del área de influencia de los accidentes donde hay un atropellado en un radio de 100 metros.
Regla 3. Donde no hay parada de RTP, uno o menos accidentes dentro del área de influencia de los accidentes con y sin lesionados en un radio de 100 metros.
Regla 5. Donde no hay parada de RTP, no hay accidentes dentro del área de influencia de los accidentes con lesionados en un radio de 100 metros, donde hay 4 ó menos accidentes dentro del área de influencia de los accidentes sin lesionados en un radio de 100 metros y donde hay 2 o menos accidentes dentro del área de influencia de os accidentes donde hay atropellados en un radio de 100 metros.
Regla 15. Donde hay 2 ó menos intersecciones, no hay paradas de RTP, hay 1 o menos accidentes dentro del área de influencia de los accidentes con lesionados en un radio de 100 metros, hay 4 ó menos accidentes dentro del área de influencia de los accidentes sin lesionados en un radio de 100 metros.
Regla 1. Donde no hay cruce peligroso, ni intersección, ni estación de metro, metrobus y donde no hay semáforos.
Regla 17. Donde hay 2 ó menos intersecciones, no hay parada de RTP, donde hay más de 4 accidentes dentro del área de influencia de los accidentes con y sin lesionados en un radio de 100 metros, donde hay 21 o menos accidentes dentro del área de influencia de los accidentes con atropellados en un radio de 100 metros, donde hay más de 2 accidentes dentro del área de influencia de los accidentes con motociclista y donde no hay accidentes dentro del área de influencia de los accidentes con vehículos atrapados.
Regla 14. Donde hay 2 ó menos intersecciones, no hay hospitales dentro del área de influencia de hospitales con radio de 300 metros, donde hay 4 ó menos accidentes dentro del área de influencia de los accidentes con
80 lesiones en un radio de 100 metros, donde hay entre 5 y 8 accidentes dentro del área de influencia de los accidentes sin lesionados, donde hay más de un accidentes dentro del área de influencia de accidentes con atropellados fatales y donde hay uno o menos accidentes dentro del área de influencia de otro tipo de accidentes.
Tomando en cuenta los resultados de nuestros experimentos, se resume que, de las características, las áreas de influencia alrededor de los accidentes con lesionados o sin lesionados tienen importancia, así como las intersecciones, estaciones de metrobus, cruces peligrosos, paradas de RTP, bares y clubes nocturnos.