Propiedad y administración de datos: el desafío del futuro
Por Marco Lavagna *
La digitalización de nuestra vida es un hecho y una tendencia que solo se intensificará. Hoy nos llevaría 181 millones de años descargar la información disponible en internet y, para cuando concluya este año, se estima que cada persona creará alrededor de 1,7 MB de información por segundo.
La buena noticia de esta creciente digitalización es que, tarde o temprano, se constituirá en la principal fuente de generación de datos para uso estadístico, lo cual permitirá ampliar las dimensiones del mapa actual y su consecuente disminución de costos.
Un primer desafío, en especial para el Estado, es ordenar la compilación de datos aún dispersa y compartimentada: como los registros se crean desde distintas "ventanillas" y con fines diversos, su estandarización para la explotación estadística es muy compleja. Además, como muchas veces la información no se comparte, quienes recolectan y responden duplican esfuerzos constantemente.
Pensemos en el caso de una empresa que informa su planta de personal al Ministerio de Trabajo para la Encuesta de Indicadores Laborales, a la Administración Federal de Ingresos Públicos (AFIP) para las cargas sociales, y al Instituto Nacional de Estadística y Censos (INDEC) para la Encuesta de Grandes Empresas; en cambio, con un clasificador armonizado solo respondería una vez para nutrir en simultáneo a tres productos estadísticos.
Otra dificultad a sortear es que, así como la información compartimentada dificulta la producción estadística, el extremo de compartir libremente bases de datos y registros sin un marco normativo claro tampoco es una solución posible, ya que se corre el riesgo de violar la confidencialidad y los secretos preexistentes (fiscal, comercial, de las personas, entre otros) y podría causar resistencia de los informantes a brindar información veraz.
Para atender estos desafíos, en el mundo se siguen con atención los conceptos de propiedad de los datos (data ownership) y administración de datos (data stewardship), que emergen con gran fuerza y claridad como un camino posible. El INDEC forma parte del High-level Group for Partnership, Coordination and Capacity-Building for the 2030 Agenda de las Naciones Unidas y participa del subgrupo de Data Stewardship, donde se aborda específicamente este tema.
En esencia, se trata de establecer reglas de gobernanza que distingan quién es el "dueño" de la información y de qué forma debe compartirla.
Para ello, es necesario definir principios, estándares y controles para que las distintas ventanillas estatales compartan información minimizando esfuerzos de recolección (tanto para el Estado como para los informantes) y establecer consistencias para potenciar la producción estadística, resguardando la confidencialidad de las personas y las empresas como lo establecen las normas vigentes.
Esto implica que los entes rectores de los distintos tipos de información (sea tributaria, social o financiera) acuerden cómo compilar y compartir los datos que generan, de manera que puedan ser utilizables para la producción estadística.
Esto no implica abandonar las formas tradicionales de recolección de datos. De hecho, se necesitará hacer encuestas más específicas y exhaustivas para indagar acerca de ciertos fenómenos que no pueden ser obtenidos por registros digitales, dada la velocidad de transformación de las sociedades.
El ahorro presupuestario que se lograría al aunar esfuerzos permitiría incluso ampliar el número de encuestas especiales. Este es un desafío para el INDEC, que invita a transitar este camino sin temores. Como señalé al principio, la creciente digitalización nos abre las puertas para un nuevo salto de calidad en el servicio estadístico: más y mejor información permite que los argentinos tomemos más y mejores decisiones.
* Director del INDEC
@MarcoLavagna