Jueves 08 de noviembre del 2018

Datos abiertos ganan terreno en producción científica

Investigadores producen cada vez más con datos que dejan disponibles para el uso de cualquier otro académico o persona interesada.

Es una incoherencia pensar un mundo con tecnología que globaliza y acerca la información de manera vertiginosa, y tener duras restricciones en la difusión de estudios, datos y descubrimientos científicos. Lustros atrás el potencial de la gestión del conocimiento científico no parecía estar a la par con la revolución que traía la Internet y su capacidad de difusión.

Afortunadamente, ahora hay tendencias que han alentado expectativas. En ediciones anteriores, nos hemos referido a Open Access, con respecto a la producción científica, apoyando la idea de reducir las barreras para acceder a las publicaciones. En ese ámbito, hemos recogido los avances que se han conseguido en algunos países al liberar investigaciones que se hacen con fondos públicos; sin embargo, los avances van despacio y el debate sobre el control de calidad es permanente.

Otro vértice en el cuadro de la apertura de la ciencia es Open Data (datos abiertos), que se refiere a los datos que pueden ser utilizados, reutilizados y redistribuidos libremente por cualquier persona, y que se encuentran sujetos, cuando más, al requerimiento de atribución y de compartirse de la misma manera en que aparecen. De acuerdo con Open Knowledge International, esas características ofrecen la capacidad de integrar diferentes conjuntos de datos, que deviene en la optimización de resultados de nuevas investigaciones. Además, poder contrastar, validar y verificar la información que sostienen estos trabajos es un acelerador de la producción científica.

Y, ¿cómo evaluar el avance del Open Data? Figshare, iniciativa plasmada en un repositorio en línea de acceso abierto para publicaciones científicas, ha presentado por tercer año consecutivo el reporte “The State of Open Data 2018” que consiste en una encuesta a los investigadores que utilizan la misma Figshare y también Springer Nature -que publica la revista Nature-, organización que además respalda el sondeo. El estudio busca captar actitudes y experiencias en el trabajo con Open Data y que, en el panorama general, muestra que está cada vez más integrada en la comunidad científica. Cuatro ensayos acompañan las cifras, que explican el estado actual, problemáticas y un caso de estudio.

Entre los hallazgos principales encontramos lo siguiente: i) un 64% de los encuestados publicó sus datos abiertos en este 2018, un incremento del 7% comparado con el 2016; ii) en lo que se refiere a los beneficios, las motivaciones principales son para el 22% es el mayor impacto y visibilidad de las investigaciones – la segunda es el beneficio público con 20%; iii) casi un 60% considera que no reciben suficiente reconocimiento por compartir datos, y solo el 9% cree que sí; iv) la mayor preocupación al compartir datos es que pueda ser mal utilizado con un 11%, y le sigue con apenas décimas menos el no estar seguros cómo funciona el copyright; v) un 63% respaldaría mandatos nacionales para la práctica de Open Data, comparado con un 55% del 2017.

El año pasado, Elsevier presentó un estudio similar, resultado de una encuesta a más de mil investigadores y varias entrevistas, con la finalidad de explorar su trabajo cotidiano vinculado al Open Data. El estudio concluye que se requiere más esfuerzo por alinear el potencial de las políticas, que se vienen debatiendo con respecto al Open Data a niveles nacionales e internacionales (sobre todo en Europa), con las limitaciones y parámetros del trabajo de investigación de los académicos.

Entre las cifras más importantes en el estudio de Elsevier, encontramos que un 73% de los encuestados afirmó que tener acceso a los datos de investigaciones publicadas beneficiaría su trabajo, un 64% está dispuesto a que otros accedan a sus datos y un 69% aseguró que la posibilidad de compartir datos es un factor importante en su campo de estudio. El análisis percibe que los investigadores son quienes se identifican como el núcleo de la práctica de compartir y reutilizar datos, por lo que se sugiere no descuidar en el debate y desarrollo de políticas una perspectiva de abajo hacia arriba (bottom-up). La cantidad de entrevistas permite que el documento considere, además, un perfil con detalles de cómo perciben los investigadores la reusabilidad de datos, sus resistencias y tres casos de estudio en diferentes campos de investigación.

Un sondeo más de Springer Nature se centra en los desafíos prácticos que encaran los científicos y la alternativa de la información compartida. Según los más de 7700 encuestados, son tres las dificultades más importantes cuando se plantean compartir los datos: la organización en la presentación, de modo que sea útil (46%), confusión con respecto al copyright (37%) y desconocer dónde se comparte la información (33%). La falta de tiempo (26%) y los costos que demanda compartir los datos (19%) también son preocupaciones latentes para los investigadores. Por otro lado, un 76% subrayó la prioridad de que su información pueda ser encontrada y un 63% afirmó que ya comparten sus datos, sea como información complementaria o a utilizando un repositorio de archivos.

En el análisis y conclusiones propuestas por los tres estudios anteriores, se enfatiza en la necesidad de considerar algunos factores para impulsar una cultura de Open Data. Lo más apremiante es la necesidad de educar y ofrecer soporte a los investigadores en la gestión óptima de los datos y que sea temprano en su carrera de investigación. Esto incluye buenas prácticas en el manejo de información, el acceso a diversos repositorios y dominio en el uso de copyright. De hecho, en el estudio de Figshare, solo un 15% de los investigadores afirmó estar familiarizado con los principios FAIR (datos “hallables, accesibles, interoperables y reutilizables” por sus siglas en inglés), estándar internacional para la administración de datos científicos. La mejora de infraestructura y servicios para organizar y presentar los datos es una segunda problemática que se debe priorizar.

Por último, las conversaciones éticas sobre los límites o preocupaciones por el mismo hecho de compartir el trabajo de cada investigador son también un tema a no perder de vista, considerando por ejemplo debates sobre la pertenencia intelectual o el origen del financiamiento.

Entonces, una exploración general de la presencia de Open Data entre los investigadores denota un conocimiento por parte de la comunidad científica de su beneficio a nivel académico y social; sin embargo, todavía queda mucho por avanzar en procesos e infraestructura que permita sacar el máximo provecho posible y, sobre todo, reconocer la necesidad de un dominio del tema “Open Data”, de quienes ya se reconocen como protagonistas: los investigadores.

 

Documentos:

 

Enlaces:

 


Aviso: Los contenidos de este boletín sintetizan la información y los debates tomados de los medios de comunicación y las investigaciones que se citan al pie. Su contenido no refleja necesariamente la opinión del Vicerrectorado Académico de la PUCP.


 

Deja un comentario