UN ENFOQUE BASADO EN DATOS PARA PREDECIR EVENTOS DELICTIVOS EN CIUDADES INTELIGENTES (A DATA-DRIVEN APPROACH FOR PREDICTING CRIMINAL EVENTS IN SMART CITIES)
ResumenActualmente, uno los retos de las instituciones gubernamentales es garantizar la seguridad de los habitantes. Este desafío también se presenta en el contexto de ciudades inteligentes, pero con la ventaja de tener sistemas de información de seguridad pública que colectan datos de los eventos delictivos en tiempo real. Por lo cual, se pueden diseñar enfoques basados en técnicas de minería de datos y aprendizaje automático que permitan predecir eventos delictivos basados en datos históricos y en el comportamiento identificados por zonas de una ciudad y en sus habitantes. En este trabajo se presenta un análisis predictivo de eventos criminales utilizando un conjunto de datos que almacena 6.4 millones de registros, colectados por un sistema de información implementado en una ciudad inteligente. El enfoque propuesto permite determinar la etiqueta de una clase de tipo binaria, la cual representa la probabilidad que un individuo sea arrestado al cometer un delito. Además, se realiza una comparación entre dos algoritmos de clasificación de datos: algoritmo de árbol de decisión CART y algoritmo de ensamble AdaBoost, con el fin de determinar qué algoritmo obtiene un mejor rendimiento mediante la métrica de precisión y una validación cruzada. Previamente, en el conjunto de datos se aplica un método de selección de características para disminuir la dimensionalidad de los datos y el costo computacional en la ejecución de los algoritmos de clasificación.Palabras Claves: Clasificación, Selección de atributos, Ciudades inteligentes, Predicción, Árbol de decisión. AbstractNowadays, one of the challenges of government institutions is to guarantee the safety of the inhabitants. This challenge is also presented in the context of smart cities, but with the advantage of having public security information systems that collect data of criminal events in real time. Therefore, approaches based on data mining techniques and automatic learning can be designed to predict criminal events based on historical data and behavior identified by areas of a city and its inhabitants. This paper presents a predictive analysis of criminal events using a set of data that stores 6.4 million records, collected by an information system implemented in an intelligent city. The proposed approach allows determining the label of a class of binary type, which represents the probability that an individual is arrested when committing a crime. In addition, a comparison is made between two data classification algorithms: CART decision tree algorithm and AdaBoost ensemble algorithm, in order to determine which algorithm obtains better performance through precision metrics and cross-validation. Previously, a feature selection method is applied in the data set to reduce the dimensionality of the data and the computational cost in the execution of the classification algorithms.Keywords: Classification, Feature selection, Smart cities, Prediction, Decision tree.