El objetivo de este manual es proveer la base necesaria para analizar y visualizar datos de Open Contracting usando el lenguaje de programación R a las personas interesadas en esta interesante y desafiante tarea. Un conocimiento básico de programación de computadoras será útil al leer este documento; sin embargo, se proveerá una guÃa suficiente para que lectores menos técnicos puedan también seguir el manual.
Como parte de esta guÃa, se obtendrán, limpiarán, analizarán y graficarán datos de Open Contracting de 4 paÃses miembros de la Open Contracting Partnership: Paraguay, México, Uruguay y Colombia. Este documento fue escrito utilizando R Notebooks, una herramienta que permite integrar Markdown y código R de manera conveniente, pudiendo exportarse el resultado en formato HTML y PDF. El código fuente de este proyecto está disponible aquÃ.
El resto de este documento está organizado de la siguiente manera:
El resto de esta sección introduce el estándar de datos Open Contracting, describiendo brevemente sus principales elementos, y el lenguaje de programación R, cubriendo sus funcionalidades más importantes y como instalarlo.
La sección 2 trata de la adquisición y limpieza de datos, haciendo énfasis en la lectura y procesamiento de archivos en formato JSON con R.
La sección 3 presenta el Tidyverse, una colección de paquetes de R diseñados para realizar tareas de ciencia de datos.
Finalmente, la sección 4 introduce ggplot2 y la gramática de gráficos en la cual está basado, para luego dibujar varias visualizaciones que describen los datasets adquiridos.
Al requerir que los datos se compartan de forma estructurada, reusable y legible por las máquinas, los datos abiertos abren nuevas oportunidades para la participación y el empoderamiento ciudadanos. El estándar de datos Open Contracting fue creado para aplicar estos principios al ciclo de vida de contrataciones públicas incluyendo la planificación, licitación, adjudicación, contratación y ejecución.
Este estándar de datos, diseñado y desarrollado a través de un proceso abierto, permite a los gobiernos alrededor del mundo compartir sus datos de contrataciones, mejorando asà los niveles de transparencia en las compras públicas, y haciendo posible el análisis de los sistemas de contrataciones públicas en términos de eficiencia, efectividad, justicia e integridad. Además, el equipo de help desk está disponible para asistir a potenciales usuarios en el proceso de adopción del estándar.
La intención de esta sección es introducir el estándar al lector, los casos de uso para los cuales fue diseñado y los conceptos básicos necesarios para su aplicación. La mayorÃa del contenido fue obtenido de la documentación oficial del estándar; para una introducción más detallada del estándar, favor referirse a la guÃa para empezar.
El estándar fue diseñado con cuatro grupos de necesidades de usuario en mente:
Para saber quien está usando datos publicados de acuerdo al estándar y de que manera lo están haciendo, dirigirse al sitio web de la Open Contracting Partnership. Cuatro casos de uso potenciales de datos abiertos de contrataciones son:
El estándar define el proceso de contratación como:
Toda la información relativa a la planeación, la licitación, las adjudicaciones, los contratos y la ejecución de contratos relacionados con un solo proceso de iniciación.
El estándar cubre todas las etapas del proceso de contratación, aunque algunos procesos pueden no incluir todos los pasos posibles. Las etapas del proceso de contratación, con ejemplos de atributos que pueden estar asociados a cada una, se presentan en la figura 1.