mayo 27, 2017

Preservación y difusión de datos de investigación



Ana María Román Díaz
Biblioteca MV José de la Luz Gómez
Facultad de Medicina Veterinaria y Zootecnia
Universidad Nacional Autónoma de México
México, D. F., C. P. 04510
Email: anacarlo@unam.mx

Las Tecnologías de la Información y la Comunicación (TIC) son todos aquellos recursos, herramientas y programas que se utilizan para procesar, administrar y compartir la información mediante diversos soportes tecnológicos. Actualmente la transmisión de datos de investigación puede verse favorecida por las oportunidades que brindan las TIC como medio de acceso y distribución de objetos digitales.
Los datos ─producto de la investigación y de la publicación de resultados de investigación─ al difundirlos por cualquier medio, son solo datos; frecuentemente se confunden y dicen que lo que se transmite es conocimiento. El adquirir un conocimiento es un trabajo intelectual e individual, cada individuo genera su propio conocimiento al intelectualizar los datos que recibe, aunque estos sean producto de la investigación hiperformal de otros.
El Acceso Abierto (Open Access (OA)) es una forma de compartir información, generalmente resultados de investigación científica, sin ningún costo o restricción para el usuario. Es un movimiento internacional en el cual el autor o titular de los derechos de la obra autoriza el libre acceso para usar, distribuir, copiar y transmitir el trabajo públicamente en cualquier medio digital para cualquier finalidad responsable, sujeto a la debida atribución de autoría, así como el derecho de hacer un pequeño número de copias impresas para su uso personal (Bethesda Statement on Open Access Publishing). Este movimiento sienta sus bases en las Declaraciones de Budapest (2002), Bethesda (2003) y Berlín (2003).
Existen todavía barreras que impiden el acceso y reutilización de los trabajos derivados de la actividad científica y académica, de tipo económicas, de seguridad, de cesión de derechos que impiden compartir un bien común. 
La falta de conocimiento sobre las bondades del acceso abierto hace difícil que los investigadores acepten compartir sus datos de investigación y sus publicaciones en portales de acceso libre y gratuito en línea. Permanece la idea de que el material gratuito no puede ser de calidad sin haber revisado su contenido.
El movimiento por el acceso abierto a la ciencia promueve la eliminación de barreras y promueve una cultura que permita compartir y reutilizar materiales, siempre con el reconocimiento de la autoría y con un uso responsable. El artículo científico ha sido históricamente una forma esencial de la comunicación de la ciencia, en la era digital cobran relevancia sus fundamentos, entre ellos los datos observacionales, descriptivos o experimentales que subyacen al artículo. Los datos pueden reutilizarse, transformarse mediante nuevos métodos o agregarse a otras fuentes. Los datos abiertos evitan la duplicidad de ensayos, Duplicar financiamientos que se podrían canalizar a proyectos prioritarios, dan transparencia a su forma de obtención y permiten su validación.
El acceso abierto significa transparencia, uso democrático, visibilidad y rentabilidad ya que permite un uso eficiente de los recursos, además, el compartir reduce esfuerzos, evita duplicidades, ahorra tiempo e induce a la colaboración; es un nuevo enfoque donde se concibe la generación y transferencia del conocimiento, no solo restringida a los “papers”, también los “datos crudos” importan y adquieren relevancia en el ámbito de la ciencia sirviéndose de las redes.
El acceso abierto a datos de investigación (Open Research Data), podría evitar duplicar esfuerzos en su obtención, además su agregación a otros resultados o la aplicación de nuevos métodos para su transformación pueden generar nuevos datos y favorecer otras interpretaciones y colaboraciones interdisciplinares.
Las instituciones gubernamentales, privadas, de organismos internacionales, están promoviendo e incentivando el uso compartido de los datos de investigación. Han definido políticas para estimular la participación en los repositorios existentes para fomentar una cultura de difusión e intercambio en acceso abierto.
La vieja imagen del científico solitario que pasaba toda su vida en su laboratorio y que aportaba grandes avances ya ha quedado atrás. En la actualidad ya prácticamente nadie trabaja solo, conforme avanza la tecnología de las comunicaciones se han conformado grupos de colaboración entre los investigadores. De manera informal y formal, formaron los “colegios invisibles” llamados así a un grupo de personas que realizan su actividad estableciendo una red de comunicación, permitiendo el intercambio de propuestas, permitiendo una variedad de puntos de vista, argumentos y reducción de errores. Estos colegios podían ser multidisciplinarios, internacionales y podían también obtener financiamientos para abordar proyectos de mayor trascendencia.
Los investigadores cuentan hoy en día, con una gama de posibilidades inimaginable con las versiones electrónicas de repositorios institucionales, gubernamentales y de organismos internacionales, para reunir, clasificar, almacenar y difundir no solo las publicaciones científico-técnicas (bases de datos referenciales y de texto completo, e-journals, e-books, e-disertations, e-conferences) sino también los datos de investigación (Openscience, Imarine, Dataverse, Figshare, Data citation index).
Se busca la mayor visibilidad e impacto de sus publicaciones y se ha hecho de las redes sociales de investigación una vía imprescindible para la diseminación de sus investigaciones. La ciencia abierta se vuelve un elemento más complejo de ciencia colaborativa, desde el cual se comparte la investigación y los resultados de la misma 
La forma de tratar los datos de investigación puede ser muy diverso, por lo que requiere de una variedad de soluciones para su tratamiento, gestión y acceso, de tal manera que permitan su validación y reutilización. Esto conlleva diferentes políticas y estrategias para la integración de la gestión de los datos de investigación en los complejos flujos de trabajo de los investigadores.
La difusión de los resultados de la producción científica es la fase final del proceso de la investigación. Se debe estimular la cultura de intercambio de datos entre los investigadores y facilitar la reutilización de la información y la ciencia basada en datos de investigación.
Los investigadores están conscientes del valor de los datos y de su potencial para el reconocimiento de su trabajo, tanto en sus círculos profesionales, como por el aumento en las citas que puede generar su consulta y reutilización. Al depositar los datos crudos de la investigación en un repositorio digital se vuelven accesibles y reutilizables por otros investigadores. Este depósito se puede realizar en repositorios institucionales de datos, en los servicios de datos proporcionados por las entidades financiadoras de la investigación y, en un modelo que se ha vuelto mayoritario, en repositorios de datos temáticos.
Los datos de investigación se clasifican según su obtención o la metodología aplicada
Datos observacionales: registros históricos, se pueden obtener únicamente en un lugar y en un momento en el tiempo (son irrepetibles).
Datos experimentales: datos que acompañan a los experimentos desde su planificación y preparación hasta la obtención de resultados. Con frecuencia reproducibles pero con un alto coste.
Datos computacionales, compilados y derivados: datos que suelen incluir datos de entrada, ciertos programas y resultados. Reproducibles con soporte tecnológico.
Datos de simulación: datos generados a partir de modelos de prueba donde con frecuencia el modelo de entrada es más representativo que la propia salida de datos.
Es preferible realizar una adecuada gestión entre los investigadores, las autoridades y el gestor de información/bibliotecario para elegir adecuadamente las políticas de inclusión y colaboración de los datos de investigación, decidir si es necesario crear un repositorio o utilizar los ya existentes; así como asegurar la protección de los datos y los investigadores y de la forma de citar la utilización de los datos de los cuales aún no hay un consenso de cómo citarlos.
El Digital Object Identifier (DOI) también se utiliza como identificador para los ficheros de datos. Otro proyecto todavía en desarrollo, ODIN, tiene por objetivo vincular los datasets a los que ya se les ha asignado un DOI con los autores que los han obtenido a través del identificador ORCID.
Facilitar los datos también puede conducir a la detección de errores no necesariamente intencionados, sin embargo existe cierta reticencia por parte de los autores a compartir los datos. Por ejemplo, en el análisis de la detección de errores estadísticos de trabajos publicados en unas revistas de psicología se observó que los casos con mayor número de errores fueros aquellos en que los autores no quisieron facilitar los datos de los ensayos.
Compartir los datos de investigación ayuda a la  preservación, de la sostenibilidad y de las infraestructuras necesarias para la gestión y mantenimiento de los datos de la investigación. Otro factor importante en la creación de una cultura de compartir datos son los roles que juegan todas las partes implicadas en la generación, difusión y promoción de los datos en acceso abierto. Puede evitar la duplicación de esfuerzos, sin comprometer la confidencialidad o seguridad, favorece el reconocimiento y la citación de datos, las agencias financiadoras pueden apoyar proyectos más ambiciosos.
Las Agencias que financian la investigación, Instituciones de Investigación Científicos, Bibliotecas, Los centros de datos y los Editores tendrán que trabajar en conjunto para definir las políticas adecuadas, las métricas para los datos a evaluar, promover el acceso libre e incentivarlo, estandarizar las actividades de recolección e intercambio de datos, formación a los profesores e investigadores para la publicación y citación de datos
En lo que respecta a las políticas, cabe destacar la directiva de los presidentes Obama de los Estados Unidos por la que se requiere establecer un plan para que las publicaciones y los datos generados de la investigación financiada con fondos públicos estén públicamente disponibles, con un embargo máximo de 12 meses. Cada vez son más las instituciones financiadoras de proyectos, centro de investigación y universidades que incluyen políticas de acceso abierto para publicaciones y datos de investigación.
Esta ya no tan nueva “cultura del acceso abierto” implica cambios en las sociedades científicas, cambios de paradigmas, eliminar miedos a compartir más allá de las fronteras. Crea incertidumbre, temor. Por esto esté acceso abierto debe considerar una adecuada y consciente definición de políticas así como la aplicación de instrumentos computacionales, métricos y de protección para que tan revolucionario proceso se lleve a cabo sin que exista ventaja abusivas por parte de grandes potencias científicas.

Referencias
Acuerdo por el que se establecen los Lineamientos Generales para la Política de Acceso Abierto de la Universidad Nacional Autónoma de México (publicado en Gaceta UNAM, 10 de septiembre de 2015). [Consultado 9/05/2017].
Bartling, S.; Friesike, S. (2014). Towards Another Scientific Revolution. En: Bartling, S.; Friesike, S. (eds.), Opening Science. Cham: Springer International Publishing. doi: http://dx.doi.org/10.1007/978-3-319-00026-8 [Consultado 9/05/2017].
Bethesda Statement on Open Access Publishing Released June 20, 2003 http://legacy.earlham.edu/~peters/fos/bethesda.htm [Consultado 9/05/2017].
Borgman, C.L. (2012b). The conundrum of sharing research data. Journal of the American Society for Information Science and Technology, 63 (6), pp. 1059-1078. doi: http://dx.doi.org/10.1002/asi.22634 [Consultado 9/05/2017].
FAO. Introducción a la Gestión de Datos de Investigación. Curso en línea, 2017. http://www.collaborateandlearn.org/login/index.php [Consultado 9/05/2017].
Melero, R. Hernández-San-Miguel, J Acceso abierto a los datos de investigación, una vía hacia la colaboración científica. La colaboración científica / scientific collaboration. Vol 37, No 4 (2014) http://redc.revistas.csic.es/index.php/redc/article/viewArticle/869/1175 [Consultado 9/05/2017].
Monsalve, V. Los colegios invisibles. Rev. Soc. Esp. Dolor 11:333-334, 2004. http://revista.sedolor.es/pdf/2004_06_01.pdf [Consultado 9/05/2017].
http://www.revistas.unam.mx/front/?q=es/acceso_abierto [Consultado 9/05/2017].
Wagner, B. (2010). Open access citation advantage: An annotated bibliography. Issues in Science and Technology Librarianship, 60 (2). doi: http://dx.doi.org/10.5062/F4Q81B0W [Consultado 9/05/2017].
Wellcome Trust (2011). Sharing research data to improve public health: full joint statement by funders of health research. http://www.wellcome.ac.uk/About-us/Policy/Spotlight-issues/Data-sharing/Public-health-and-epidemiology/WTDV030690.htm [Consultado 9/05/2017].

No hay comentarios: