FOTOSBLOG(70)[1]

PREVIO

Por Marco Robbles
COMPARTE:

Modelo de alertas para la predicción de la violencia en Guatemala

Desde el año 2020, el equipo del Observatorio de la Violencia de Diálogos ha venido construyendo un Modelo de Alertas para medir el pulso de los homicidios en Guatemala y determinar, sobre la base de algún criterio técnico prospectivo y no solo retrospectivo, si las variaciones en las cifras representan un incremento o decremento significativo. Dado que contamos con datos estadísticos desagregados por año, mes y municipio desde el 2001 a la fecha, es posible pensar en construir un sistema de esta naturaleza.

Las pláticas, que comenzaron con un simple modelo en Excel discutido en uno de nuestros Laboratorios de innovación al final de 2020, se materializaron en enero de 2022 en un blog post en el que aplicamos un método derivado del primero para predecir la tasa anual de homicidios de 2021 y compararla con la tasa registrada por la policía al final de ese año. El objetivo era evaluar un comunicado oficial del gobierno de Guatemala, en el que indicó que la violencia homicida en 2021 había bajado respecto a 2019, y que la violencia registrada era un simple “rebote” post pandémico. En efecto, nuestro análisis corroboró menores cifras en 2021 respecto al 2019, pero a la vez mostró que no bajaron tanto como lo esperábamos, según las proyecciones que hicimos con los datos históricos que tenemos desde 2001. De acuerdo con nuestro modelo, la cantidad proyectada rondaba los 1,895 homicidios, pero la cifra oficial en ese entonces era de 2,843,[1] por lo que hubo un 50% más de violencia homicida que la predicha. Este incremento no puede explicarse por un simple “rebote” de la violencia después del confinamiento por la crisis del COVID-19; probablemente hay factores sociales e institucionales involucrados, que a la fecha no han sido explicados por las autoridades correspondientes. El hecho de que dos países vecinos no han experimentado un “rebote” en sus niveles de violencia homicida respecto a 2020 apoya nuestras observaciones.[2]

En junio de 2022, finalmente construimos el primer prototipo de PREVIO  (nuestro Modelo de Alertas) utilizando Prophet,[3] una herramienta desarrollada por Facebook que sirve para pronosticar series de tiempo. Antes de decantarnos por Prophet, pusimos sobre las mesa otros modelos creados desde diversas disciplinas: estadísticos, regresiones y machine learning. El proceso de desarrollo no fue sencillo, ya que muchos de los modelos tienen una curva de aprendizaje prolongada y requieren de un conocimiento profundo sobre metodologías específicas de pronóstico. Por ejemplo, probamos dos basados en machine learning: XGBoost y Redes Neuronales no Recurrentes (RNN, como se le conoce en inglés). Ambos mostraron resultados completamente alejados de la realidad, ya que, de acuerdo a las métricas utilizadas, distaban excesivamente de los datos oficiales históricos registrados por la Policía. Por lo tanto, antes de indagar más sobre otras herramientas y enfoques más avanzados, decidimos usar Prophet como un paso intermedio hacia nuestro Modelo, ya que es intuitivo y permite semi-automatizar pronósticos basados en parámetros específicos, como el intervalo de confianza (un rango de valores dentro de los cuales esperamos encontrar la cifra oficial con un nivel de probabilidad predeterminado), el período de predicción (semanas, días, meses, años) o las festividades respectivas de Guatemala (cuando aumentan los factores de riesgo asociados con la violencia). El modelo, además, cuenta con la garantía de que es utilizado internamente por Facebook para generar pronósticos.

Investigadores de otros países ya han utilizado Prophet para pronosticar el crimen, por ejemplo, en la ciudad de Chicago.[4] A diferencia del modelo usado para el blog post mencionado unos párrafos arriba (método multiplicativo desestacionalizado), Prophet toma en cuenta la tendencia y la estacionalidad de los datos, y permite incluir las festividades que los afectan para generar predicciones mucho más precisas que las de otros enfoques clásicos. Al final, el modelo permite pronosticar el comportamiento futuro de una serie de datos basándose en cómo esos mismos datos se han comportado en el pasado, considerando los factores mencionados antes.

Tomando como referencia  los  datos de 259 meses a nivel nacional, desde enero 2001 hasta julio 2022, nuestro modelo predice las cantidades mensuales de homicidios entre agosto y diciembre de 2022 que aparecen en la Tabla 1, con sus respectivos límites inferiores y superiores. Diálogos emitirá una  “alerta” si la cifra oficial de homicidios reportada por la Policía Nacional Civil trasciende el límite superior o inferior proyectado con 70% de confianza, y dicha alerta indicará que “algo” importante está ocurriendo para que la violencia haya subido o bajado más de lo esperado. Las alertas serán “rojas” cuando la cifra oficial sobrepase el límite superior con 70 % de confianza, y  “verdes” cuando la cifra oficial sobrepase el límite inferior con 70 % de confianza. Una cifra oficial que se encuentre entre el rango calculado por Prophet indicará que los niveles de violencia son los esperados, de acuerdo con los factores que mencionamos antes.

Por ejemplo, en el mes de agosto, la Policía registró un total de 254 homicidios. Con esta cifra, y usando el pronóstico que aparece en la Tabla 1, nos correspondería emitir una alerta ROJA, pues el límite superior con 70% de confianza definido por nuestro modelo era de 245.

Tabla 1. Cantidad de homicidios pronosticados por el algoritmo Prophet, agosto a diciembre 2022.

Gráficamente, las cifras proyectadas y los límites superiores e inferiores se ven así:

 Figura 1. Cifras de homicidios proyectadas por el algoritmo Prophet, agosto a diciembre de 2022, con sus respectivos límites inferiores y superiores.
Fuente: elaboración propia con datos mensuales de la Policía Nacional Civil.

Con este pronóstico podemos afirmar, con cuatro meses de anticipación, que el 2022 probablemente terminará con aproximadamente 2,903 homicidios, lo cual equivale a 73 homicidios más que en 2021 (3 % más). No obstante, el pronóstico también define un límite superior con 70 % de confianza de 3,045 homicidios al cierre del año, lo cual equivale a 215 homicidios más que en 2021 (8 % más). En cualquier caso, la tasa anual terminaría ubicándose entre 16.6 y 17.4 homicidios por cada 100 mil habitantes, mientras que la de 2021 fue de 16.5. La tendencia de corto plazo determinará si nos ubicamos más allá del límite superior o dentro del rango esperado.[5] Actualizaremos el pronóstico conforme vayan pasando los meses y tengamos acceso a nuevos datos. También correremos el modelo de nuevo, pero con datos diarios del INACIF para evaluar si la conclusión cambia.

Finalmente, queremos recalcar que este es un modelo experimental y que nuestro enfoque está abierto a las críticas. Nuestro objetivo en el mediano plazo es implementar algoritmos híbridos que logren concatenar todos los puntos a favor de los distintos modelos de pronósticos que se han desarrollado en la literatura. El siguiente paso será crear modelos desagregados por departamento y por sexo de las víctimas, los cuales actualizaremos todos los meses.

Ya que nuestro modelo está en una fase piloto, todas las ideas nos pueden ayudar a mejorarlo. Te invitamos a participar en este formulario de retroalimentación: https://forms.gle/D8w7jUx7b3i6CUmR7

 

[1] Generalmente suelen haber diferencias entre los homicidios reportados mensualmente y la cifra oficial consolidada al final del año. La cifra reportada actualmente por el INE para 2021 es de 2,029 homicidios; en Diálogos la cifra que calculamos es de 2,030. Para ser consistentes con nuestros informes, en el análisis para este blog post utilizamos esa última cifra.
[2] Por ejemplo, en El Salvador, la violencia homicida bajó 13 %, según datos oficiales de la  Dirección de Información y Análisis del Ministerio de Justicia y Seguridad Pública, y en México disminuyó casi 4 %, según datos de la Secretaría de Seguridad Pública. En el caso de Honduras sí hubo un aumento, pero del 8 % (datos preliminares de la Policía Nacional), en contraste con el aumento en Guatemala del 11 %, según la Policía Nacional Civil.
[3] Sean J. Taylor & Benjamin Letham (2018). “Forecasting at Scale”. The American Statistician, Vol. 72, No. 1, 37–45, disponible en: http://lethalletham.com/ForecastingAtScale.pdf
[4] Luke Sun (2020). “Crime Rate Prediction using Facebook Prophet. A Guideline to Make the Best Use of FB Prophet for Time Series Forecasting.” Towards Data Science, disponible en: crime-rate-prediction-using-facebook-prophet-5348e21273d
[5] Si consideramos los límites inferiores con 50 % y 70 % de confianza, la tasa proyectada a final de año se ubicaría entre 15.8 y 16.1 por cada 100 mil habitantes. Este escenario es poco probable que ocurra, dada la tendencia que vemos en el corto plazo en los datos diarios sobre necropsias del INACIF.
depositphotos_134255710-stock-illustration-avatar-vector-male-profile-gray
Carlos Mendoza

Contenidos Relacionados