Antes de publicar datos de investigación se han de tener en cuenta una serie de aspectos clave, como el nombrado y tipo de ficheros, la organización de éstos, la depuración y la anonimización y seudonimización.
Para entender y usar mejor los datos de investigación en el futuro, es importante nombrar y organizar los archivos que los guardan de manera adecuada, por esto se recomienda:
Existen herramientas que facitan la tarea de renombrar múltiples ficheros:
La elección del formato y el software para generar y digitalizar los datos de investigación a menudo varía según el tipo de análisis que el investigador necesite realizar, el equipo que use, la disponibilidad de diferentes programas informáticos, o incluso las prácticas habituales en un campo de estudio concreto.
Aunque los investigadores seleccionen el formato de datos y el software que mejor se adapte a sus necesidades analíticas, una vez completado el análisis, deberían convertirse en formatos más universales y perdurables para su almacenamiento.
Para asegurar el acceso y conservación a largo plazo de los datos se recomienda el uso de formatos abiertos y no restringidos en la medida de lo posible. El formato seleccionado debe facilitar la indexación de los contenidos para su futura recuperación. Utilizar un formato de compresión de datos ahorra espacio de almacenamiento. El formato elegido debe ser un estándar (tipos MIME IANA) o un estándar de facto reconocido por la comunidad investigadora.
A continuación, se presentan una serie de formatos de archivo recomendados según el tipo de datos que contienen:
Información adicional: Guía práctica para la publicación de datos tabulares en archivos csv.
Herramienta para refinado y conversión de datos datos: OpenRefine
Los datos publicados no deben contener información mediante la cual puedan obtenerse detalles confidenciales. Prestar especial cuidado a los datos personales, no tomarlos si no son estrictamente necesarios para la investigación y en su caso pedir consentimiento informado e inequívoco.
Algunas de las estrategias empleadas para modificar datos para mantener la confidencialidad y compartirlos son:
La Agencia de Protección de datos dispone una guía básica de anonimización y la nota técnica sobre la k-anonimidad.
Por su parte, OpenAire facilia la herramienta Amnesia para la anonimización de datos.
© UNIVERSIDAD POLITÉCNICA DE CARTAGENA - Pza. del Cronista Isidoro Valverde, Edif. La Milagrosa, CP. 30202 Cartagena. Tlf: 968 32 54 00.