Administração dos dados de pesquisa no CNRS da França

Por Ernesto Spinak

Na era da Ciência Aberta, o gerenciamento de dados de pesquisa (RDM, research data management) é um importante desafio a ser considerado nas políticas nacionais de pesquisa, pois os resultados tendem a ser complexos, dinâmicos e difíceis de descrever, porém é necessário validar os resultados de pesquisa. Estes dados são de tipos variados e complexos pois – para citar alguns – podem ser sequências de genoma, dados socioeconômicos, imagens audiovisuais, bases estatísticas, aplicativos de software, etc. As novas estratégias da comunidade europeia para uma ciência aberta incluem (i) o acesso aberto, (ii) a cooperação na troca de dados e (iii) a gestão de dados sob os princípios da iniciativa FAIR (Findable, Accessible, Interoperable and Reusable): “(…) todos os objetos de pesquisa devem ser encontráveis, acessíveis, interoperáveis e reutilizáveis, tanto para máquinas quanto para pessoas”(1).

A França é um dos principais estados membros da União Europeia que lidera este esforço, publicando dezenas de milhares de artigos científicos todos os anos e dedicando uma porcentagem substancial do Produto Nacional Bruto em pesquisa e inovação. O CNRS (Centre national de la recherche scientifique, Centro nacional de pesquisa científica) é a maior organização pública de pesquisa na Europa que desenvolve pesquisa em todas as áreas do conhecimento por meio de 10 instituições com mais de 32.500 pesquisadores em mais de 1.000 laboratórios. A França promove, juntamente com a Holanda e a Alemanha, a iniciativa FAIR na Europa.

Com a finalidade de medir e avaliar as atitudes e comportamentos da comunidade científica na França sobre o Acesso Aberto e o RDM, foi realizada uma pesquisa entre julho e setembro de 2014 por meio do envio de um questionário com mais de 90 perguntas aos diretores de 1.250 laboratórios do CRNS representando todas as áreas da ciência básica na França. O objetivo era entender melhor os processos de produção, administração e preservação de dados e, em particular, as atitudes de compartilhamento dados com outros cientistas em termos de cultura e princípios FAIR. Os resultados(2) foram publicados recentemente e são o motivo desta nota.

As respostas obtidas dos diretores dos 432 laboratórios que responderam à pesquisa podem ser divididas em três temas principais:

  • O que pensam os cientistas sobre troca de dados e abertura? O que pode ser dito sobre sua cultura de dados abertos?
  • Até que ponto os seus comportamentos e atitudes em relação aos dados apoiam os princípios FAIR de RDM?
  • Quais são as prioridades no que diz respeito ao RDM e que tipo de serviços RDM solicitam os cientistas?

Gestão de dados

61% dos diretores declarou que a produção de dados de seus laboratórios necessita de uma RDM específica, porém somente um terço deles tem algum tipo de ferramenta para monitorar a produção, e menos ainda já estabeleceu um plano de gerenciamento de dados.

Recursos humanos capacitados

Aproximadamente um terço dos laboratórios tem pessoal específico à sua disposição dedicado ao RDM. A maioria deles são funcionários permanentes, mas mais da metade destas unidades também contrata pessoal por períodos limitados para fazer ou ajudar a realizar o trabalho.

Qual trabalho? Processamento de dados e criação de dados secundários, produção de bases de dados; em menor grau, curadoria de dados, incluindo a produção de metadados.

O quão bem você está fazendo o seu trabalho? Em geral, 75% dos gerentes sêniores avaliam as habilidades de RDM da equipe como básicas ou boas, mas apenas 8% como excelentes.

Em quatro domínios do RDM (referência, segurança de dados, ética e direito), o pessoal possui habilidades que são consideradas superiores, comparadas à publicação de dados, onde quase 40% dos diretores consideram que as habilidades do pessoal são insuficientes.

Compartilhar dados

40% dos diretores de laboratório declaram que seus dados de pesquisa são publicados on-line, muitas vezes com restrições de acesso (acesso sob demanda ou limitados a usuários autorizados); apenas 17% relatam que seus dados são divulgados gratuitamente na web, em acesso aberto.

Cinquenta e nove por cento dos entrevistados confirmam que seus laboratórios colaboram com outros cientistas e unidades de pesquisa por meio de ferramentas de dados compartilhados (84%), workshops (47%), diretrizes comuns (44%) e sessões de capacitação (41%).

Disponibilidade

Mais da metade dos diretores de laboratório em ciências da terra e astronomia, informática, ciências sociais, ecologia e física nuclear declaram que seus dados estão disponíveis online. Mas este não é o caso, especialmente em três outras disciplinas: química, física e matemática.

Sobre o intercâmbio de dados e publicações

A pesquisa revelou que a maioria dos entrevistados (50-70%) geralmente apoia o acesso aberto e declara o uso real do repositório nacional francês de HAL (Hyper Articles en Ligne), incluindo o depósito de metadados (registros) e documentos (texto completo), enquanto apenas um pequeno grupo parece não estar interessado na Via Verde ou Via Dourada e é relutante em autoarquivar a publicação em acesso aberto.

Considerando os princípios FAIR (encontráveis, acessíveis, interoperáveis e reutilizáveis), o relatório mencionado menciona que apenas 7% dos diretores de laboratório confirmam que sua prática de gerenciamento de dados atende a estes quatro critérios: eles publicam dados on-line, permitem que pelo menos alguns deles estejam disponíveis gratuitamente, apliquem formatos de dados interoperáveis e utilizam padrões específicos da comunidade. Outros 18% dos diretores responderam afirmativamente a três das quatro perguntas; 42% indicaram que cumprem um ou dois critérios, mas 32% responderam “não” ao preenchimento dessas quatro questões. O “ponto fraco” mais comum parece ser a aplicação de formatos de dados interoperáveis, revelando outros problemas como a falta de infraestrutura para interoperabilidade, capacidades e experiência, incentivos e, acima de tudo, a falta de desenvolvimento de políticas para sua implementação.

Conclusões preliminares

Mudar as culturas dos cientistas é uma questão complexa, como revelado na pesquisa do CNRS, um desafio que tem que enfrentar diferenças de valores e práticas, ferramentas e habilidades de laboratórios e institutos, onde muitas partes interessadas intervêm; por exemplo, os cientistas, os financiadores, os técnicos, os bibliotecários, etc., com interesses diferentes e às vezes opostos.

É importante estabelecer ao nível de cada instituição e, como política geral, guias de boas práticas, como os apresentados na Semana SciELO 20 Anos(3).

Notas
1. Turning FAIR into reality: Final report and action plan from the European Commission expert group on FAIR data [online]. Publications Office of the EU. 2018 [viewed 16 January 2019]. Available from: https://publications.europa.eu/en/publication-detail/-/publication/7769a148-f1f6-11e8-9982-01aa75ed71a1/language-en/format-PDF/source-80611283

2. SCHÖPFEL, J., et al. Research data management in the French National Research Center (CNRS). Data Technologies and Applications [online]. 2018, vol. 52, no. 2, pp. 248-265 [viewed 16 January 2019]. Available from: https://hal.univ-lille3.fr/hal-01728541/

3. Documentos [online]. GT1 – O ontem, hoje e amanhã da Rede SciELO – Reunião da Rede SciELO. 2018 [viewed 16 January 2019]. Available from: https://www.scielo20.org/redescielo/grupos-de-trabalho/gt1/#1529956245657-fadf8a73-3971

Referências
Documentos [online]. GT1 – O ontem, hoje e amanhã da Rede SciELO – Reunião da Rede SciELO. 2018 [viewed 16 January 2019]. Available from: https://www.scielo20.org/redescielo/grupos-de-trabalho/gt1/#1529956245657-fadf8a73-3971

SCHÖPFEL, J., et al. Research data management in the French National Research Center (CNRS). Data Technologies and Applications [online]. 2018, vol. 52, no. 2, pp. 248-265 [viewed 16 January 2019]. Available from: https://hal.univ-lille3.fr/hal-01728541/

Turning FAIR into reality: Final report and action plan from the European Commission expert group on FAIR data [online]. Publications Office of the EU. 2018 [viewed 16 January 2019]. Available from: https://publications.europa.eu/en/publication-detail/-/publication/7769a148-f1f6-11e8-9982-01aa75ed71a1/language-en/format-PDF/source-80611283

*Ernesto Spinak – Colaborador do SciELO, engenheiro de Sistemas e licenciado em Biblioteconomia, com diploma de Estudos Avançados pela Universitat Oberta de Catalunya e Mestre em “Sociedad de la Información” pela Universidad Oberta de Catalunya, Barcelona – Espanha. Atualmente tem uma empresa de consultoria que atende a 14 instituições do governo e universidades do Uruguai com projetos de informação.

Publicado originalmente em SciELO em Perspectiva, disponível em https://blog.scielo.org/blog/2019/01/16/administracao-dos-dados-de-pesquisa-no-cnrs-da-franca/#.XEBvGFVKjIV

Anúncios

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google

Você está comentando utilizando sua conta Google. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s