Minería de datos para identificar todas las causas de un accidente de tráfico y su gravedad
Investigadores de la Universidad de Granada han desarrollado una nueva técnica estadística que permite analizar de forma exhaustiva todas las causas posibles que influyen en la severidad de un accidente de tráfico. Su trabajo, basado en dos técnicas de minería de datos (Análisis de Clases Latentes y Redes Bayesianas), permite realizar un análisis de los accidentes de tráfico de un modo mucho más preciso y, además, mostrar determinadas relaciones entre las variables que no podrían ser identificadas con los métodos tradicionales.
El autor principal de este trabajo, publicado en el último número de la revista Accident Analysis & Prevention, es el profesor Juan de Oña López, responsable del grupo de investigación Transporte y Seguridad (TRYSE) del departamento de Ingeniería Civil de la Universidad de Granada. Destaca que “los accidentes de tráfico son sucesos eventuales, y su análisis requiere el conocimiento de las particularidades que los definen. Uno de los principales problemas con los que se encuentran los investigadores cuando se analizan los datos de accidentes de tráfico es su heterogeneidad, de modo que, si durante el análisis no se tienen en cuenta ciertas relaciones existentes entre las variables, éstas pueden quedar ocultas”.
Análisis de 3.229 accidentes
Para realizar esta investigación, se analizaron 3.229 accidentes ocurridos en las carreteras de dos carriles (uno por sentido) de la provincia de Granada entre los años 2004 y 2008, con hasta tres vehículos involucrados en el accidente. Para describir cada accidente, los investigadores utilizaron un total de 18 variables relacionadas con las características de la carretera, el accidente, el entorno y el propio conductor.
Los resultados muestran que el Análisis de Clases Latentes permite segmentar los accidentes en cuatro ‘cluster’ o grupos distintos, definidos en relación con la tipología del accidente, el número de vehículos involucrados, los ocupantes del vehículo, el tamaño del arcén y existencia de pavimentación en el mismo. La principal diferencia en la identificación de los ‘cluster’ es la tipología del accidente: dos cluster hacen referencia a colisiones, mientras que otros dos hacen referencia a salidas de vía, y la presencia de arcén pavimentado.
Sobre la base de datos original (BDO), así como sobre cada uno de los ‘cluster’ definidos, los investigadores de la UGR identificaron las variables que afectan a la severidad del accidente. Los resultados muestran que en todos los casos (BDO y 4 cluster) existe una relación directa entre la severidad del accidente y las siguientes variables: mes, hora, número de heridos, tipo de accidente, causa, edad, sexo, ancho de calzada, tipo de arcén, marcas viales y visibilidad. Pero además, se muestran relaciones específicas en los ‘cluster’ que no aparecen cuando se analiza únicamente la base de datos original, tales como la relación directa entre la severidad y las condiciones atmosféricas, la presencia del arcén pavimentado y el número de vehículos involucrados en el accidente.