Principios para citar datos científicos

26 01 2015

En: http://blog.scielo.org/es/2015/01/15/principios-para-citar-datos-cientificos/#.VMYEcSxNgTs

Data Citation Principles

Las referencias bibliográficas a trabajos publicados son una práctica común y obligada en la literatura científica desde tiempos inmemoriales. Cada disciplina tiene definida sus normas de registro, y existen decenas de estilos editoriales de presentación tales como Vancouver, ISO 690, APA, Turabian, MLA, etc.

Pero, en los últimos años, gracias a la globalización de la publicación de revistas científicas electrónicas, y las posibilidades de comunicación e intercambio de información que permite Internet, comenzó a discutirse la necesidad e importancia de registrar y citar también las fuentes de datos (datasets) que sustentan los trabajos académicos. Para que la investigación cumpla con una de las premisas fundamentales de una ciencia sana y robusta, es que los resultados de una comunicación científica sean reproducibles, lo que hace necesario y conveniente que los datos de la investigación sean objetos citables y accesibles.

La buena práctica de la ciencia debe asumir que los datos forman parte de un ecosistema y que deben ser accesibles y reutilizables. En otras palabras, los trabajos científicos además de registrar las fuentes bibliográficas, deberían proporcionar también acceso a los datos originales que sustentan la investigación.

Tan temprano como en 2007, Micah Altman y Gary King hicieron una propuesta advirtiendo la necesidad de llegar a ese objetivo en un artículo publicado en D-lib Magazine1, iniciando un proceso que prontamente fue tomado por el International Council for Science: Committee on Data for Science and Technology (CODATA/ICSU), y aprobó esa iniciativa en su 27ª Asamblea General en Ciudad del Cabo, Sudáfrica en el año 20102. En la declaración indicaba varios aspectos importantes que reclamaban la atención a la comunidad científica internacional, entre los que destacamos:

  • Sin importar los diferentes formatos en que se registre la actividad científica (bases de datos planas, jerárquicas, relacionales, XML, etc.), se debe garantizar la interoperabilidad y facilitar la reutilización de los datos.
  • La necesidad de lograr estándares en los formatos de citación de los datos fuentes.
  • Crear normas para el registro de los metadatos que describen los conjuntos de datos (datasets).
  • Debido a que los datasets son esencialmente dinámicos (a diferencia de los documentos) es necesario garantizar que la práctica de citación incorpore el versionado de los datos, es decir, poder mantener la historia de cambios y agregados al conjunto de datos original.
  • Las diferentes disciplinas científicas requieren diferente granularidad de los objetos digitales que se registran como datos fuentes.
  • Informar los roles que cumplen las diferentes partes interesadas, es decir, los equipos de investigación, las agencias que financian, las universidades, etc.
  • Para garantizar la utilidad y persistencia a lo largo del tiempo, los costos de acceso y mantenimiento deben ser accesibles a todas las partes.
  • Preservar los mecanismos de protección intelectual, sea bajo Creative Commons así como las leyes tradicionales de copyright.

La declaración oficial del año 2010 fue luego enriquecida en varios trabajos que sirvieron como base para la recientemente aprobada Declaración Conjunta de los Principios de Citación de Datos (DC1)3, por el grupo de trabajo internacional FORCE11, constituido por una comunidad de investigadores, bibliotecarios, archivistas, editores y agencias de financiación de investigación científica, interesados en el futuro de la comunicación científica y la e-academia.

Esta declaración ya fue suscrita por más de 80 de las principales editoriales científicas, universidades e instituciones del mundo, entre las que destacamos Elsevier, PLOS, ORCID, Nature Publishing Group, Association of Research Libraries, BioMed Central, CrossRef, etc.

Los objetivos de la iniciativa es lograr que, una vez que se establezca la cultura de citación de los datos fuentes, comiencen a ser evidentes los beneficios, entre los que anotamos

  • La infraestructura editorial debe asegurar que las referencias electrónicas a los datos se mantengan en el futuro y puedan ser reutilizadas.
  • Los servicios de publicación electrónica deberán construir controles para que disminuya el peligro que investigadores “roben” datos ajenos (plagio de datos).
  • Podrá medirse el impacto tanto de los datasets como el de los creadores de esos datos.
  • Los investigadores podrán obtener reconocimiento profesional de la misma manera que se obtiene por las publicaciones tradicionales.

Mantener los datos en forma citable es una responsabilidad que deberá asumirse o bien por el editor científico, o el distribuidor, o los repositorios institucionales o archivos en donde se produce la investigación. En este contexto, ha de tenerse en cuenta los siguientes factores:

  • Los datasets deberán ser registrados con suficientes metadatos que expliquen el conjunto de datos y deberán también permanecer accesibles.
  • Se recomienda una estrategia de identificador persistente del tipo DOI.

Los ocho principios directores aprobados en la reciente declaración DC1 cubren los propósitos, funciones y atributos de las citaciones, y reconocen la necesidad de crear prácticas que sean comprensibles tanto a los humanos como a las máquinas.

Estos principios son: (1) Importancia; (2) Crédito y atribución; (3) Evidencia; (4) Identificación única; (5) Acceso; (6) Persistencia; (7) Especificidad y Verificabilidad; (8) Interoperabilidad y Flexibilidad.

Puede verlos en detalle en el sitio del FORCE113.

Conclusión

Como ya se dijo más arriba en este post, los beneficios de la citación de datos de investigación a la comunidad científica incluyen:

  • Incorporar al paradigma de la ciencia el concepto de que los datos de investigación son una contribución legítimamente citable.
  • Los resultados podrán ser verificados por terceros, facilitarán la replicación de los experimentos y reutilizarse para estudios futuros.
  • Podrán evaluarse métricas de uso y generar créditos de la misma manera que se hace con las publicaciones convencionales.

Está en los planes de SciELO adoptar los Principios de Citación de Datos en el futuro como parte del proceso de gestión de los resultados de investigación.

Si su institución desea apoyar esta iniciativa, puede registrarse en: http://www.force11.org/datacitation/endorsements

Hay una presentación muy didáctica y completa en Slideshare que recomendamos: Joint Declaration of Data Citation Principles (Overview)4

Anuncios

Acciones

Information

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s




A %d blogueros les gusta esto: