Accuracy of the malaria epidemiological surveillance system data in the state of Amazonas ; Exatidão dos dados do sistema de vigilância epidemiológica da malária no estado do Amazonas
The Epidemiological Surveillance System for Malaria (SIVEP-Malaria) is the Brazilian governmental program that registers all information about compulsory reporting of detected cases of malaria by all medical units and medical practitioners. The objective of this study is to point out the main sources of errors in the SIVEP-Malaria database by applying a data cleaning method to assist researchers about the best way to use it and to report the problems to authorities. The aim of this study was to assess the quality of the data collected by the surveillance system and its accuracy. The SIVEP-Malaria data base used was for the state of Amazonas, Brazil, with data collected from 2003 to 2014. A data cleaning method was applied to the database to detect and remove erroneous records. It was observed that the collecting procedure of the database is not homogeneous among the municipalities and over the years. Some of the variables had different data collection periods, missing data, outliers and inconsistencies. Variables depending on the health agents showed a good quality but those that rely on patients were often inaccurate. We showed that a punctilious preprocessing is needed to produce statistically correct data from the SIVEP-Malaria data base. Fine spatial scale and multi-temporal analysis are of particular concern due to the local concentration of uncertainties and the data collecting seasonality observed. This assessment should help to enhance the quality of studies and the monitoring of the use of the SIVEP database. ; O Sistema de Vigilância Epidemiológica de Malária (SIVEP-Malária) é um programa governamental brasileiro que arquiva automaticamente todas as informações sobre casos de malária registrados em todas as unidades de saúde e consultórios medicos. O objetivo deste estudo foi avaliar a qualidade dos dados coletados pelo sistema de vigilância e sua precisão. Foram utilizados os dados do SIVEP-Malária para o estado do Amazonas, Brasil, de 2003 a 2014. Um método de limpeza de dados foi aplicado para detectar e remover registros errôneos. Observamos que a coleta de dados não é homogênea entre os municipios e ao longo dos anos. Algumas variaveis tinham diferentes padrões de coleta, falta de dados, dados discrepantes e inconsistências. Dados que dependem do agente de saúde possuem boa qualidade mas aqueles que dependem dos pacientes são frequentemente imprecisos. Mostramos que um pre-processamento meticuloso é necessário para produzir dados estatisticamente corretos a partir do SIVEP-Malária. Analises em escala espacial detalhada ou multi-temporais são particularmente afetadas devido à concentração local de incertezas e a sazonalidade observada na coleta de dados. Esta avaliação deve auxiliar a melhorar os estudos e monitoramentos que fazem uso dos dados do SIVEP.