Aprender a analizar datos abiertos

Si necesitas información estadística que sustente tu idea de negocio, tesis, reportaje periodístico u otro proyecto de distinta naturaleza, puedes analizar los datasets del Portal Nacional de Datos Abiertos.

Es importante que entrenes tu capacidad de leer, trabajar, analizar y discutir con datos, así, podrás tomar mejores decisiones y generar conocimientos. A esto se le llama “Data Literacy” o alfabetización de datos.

Antes de iniciar, debes saber:

Al ingresar a la Plataforma Nacional de Datos Abiertos, selecciona la temática y conjunto de datos de tu interés.

Primero lee el “Contexto de metadatos” para que entiendas la información que vas a analizar y después, el “Diccionario de datos” donde encontrarás el significado de cada variable, entre otros detalles, como el tipo de datos que representa cada una (útil para configurar algunos softwares).

Cuando abras el dataset en el programa de lectura de datos de tu preferencia, podrás generar los gráficos o visualizaciones que favorezcan a tu comprensión y análisis de los datos. Por ejemplo: Si quieres comparar cantidades, opta por un gráfico de barras; si quieres medir las tendencias a través del tiempo, gráficos de líneas; gráficos circulares si quieres medir los componentes de un total (gráfico de árbol si hay muchos componentes); mapas si estudias tendencias por zonas geográficas; entre otros.

Programas para leer datos abiertos:

  • Power BI (tiene versión gratuita y de pago)
  • Orange Data Mining (gratuito)
  • Python (gratuito)
  • R - Commander (gratuito)
  • SQL (de pago)
  • SPSS Statistics (de pago)
  • Stata (de pago)
  • Excel (de pago)
  • Tableau (de pago)

Algunos de estos programas cuentan con tutoriales para su uso. Sus funcionalidades permiten desde visualizar los datos en gráficos hasta realizar predicciones mediante regresión logística o métodos de inteligencia artificial.

Los softwares analizan la información de forma encolumnada, donde la primera fila es el encabezado que contiene las variables o campos. A partir de la segunda fila, se contiene a cada registro.

¡Recuerda! Lo importante de tu trabajo será encontrar hallazgos en las estadísticas que te lleven a realizar preguntas de negocios o acciones. Por ejemplo: no basta hallar el número de accidentes de ciclistas por año, también hallar las calles donde hay más incidentes y determinar medidas preventivas.