Responsable de l'équipe d'accueil

BERGER
Pauline
This email address is being protected from spambots. You need JavaScript enabled to view it.
03 88 65 56 25

Personne encadrant le stage

BERGER
Pauline
03 88 65 56 25

Lieu du stage

IGBMC, 1 rue Laurent Fries, 67404 Illkirch

Sujet du stage

Evolution de l’infrastructure informatique de GenIDA, un projet de recherche participative ciblant des maladies rares neurodeveloppementales
GenIDA (https://genida.unistra.fr) est un projet de recherche participative ciblant les formes génétiques de troubles du développement intellectuel (TDI). Cette base de données internationale a pour objectif de démultiplier les connaissances sur ces formes rares de TDI d'origine génétique en i) sollicitant les familles de patients en France et à l’étranger afin qu’elles communiquent leurs observations via un questionnaire structuré disponible en ligne, et ii) mettant les données ainsi collectées à disposition des professionnels afin de générer des connaissances nouvelles médicalement significatives. Afin d’assurer la protection des données personnelles des participants, l’accès aux données sensibles de santé est restreint aux collaborateurs bénévoles (cliniciens, etc.) enregistrés sur GenIDA comme "professionnels de référence". Néanmoins, les données désidentifiées agrégées pour un gène donné sont disponibles en ligne pour les familles concernées.
L’infrastructure informatique de GenIDA, y compris le site internet et la base de données sécurisée, a été développée en 2014. Depuis, l’augmentation de la participation des familles et des professionnels, a mis en évidence des problèmes d'ergonomie, ainsi que des limites en termes d’analyses des données complexes.
En collaborations avec les bioinformaticiens de l’équipe CSTB (Julie Thompson, ICube, Strasbourg), l'objectif du stage est faire évoluer l’infrastructure de GenIDA afin d’améliorer l’accès aux données pour les différents types d’utilisateurs : (i) les personnes atteintes, leurs familles et les associations concernées, (ii) les médecins et autres professionnels, enregistrés comme "professionnels de référence", (iii) les chercheurs.

Cela comprendra trois axes :
(i) Amélioration de l’interface web. Une nouvelle interface sera créée plus intuitive et plus simple d’utilisation pour des personnes ayant peu de pratique des outils informatiques. Il s’agira notamment de simplifier le processus d’inscription : création de comptes Utilisateur famille / clinicien / chercheur > création & activation du profil d’une personne atteinte > accès au questionnaire. Pour ce faire, une gestion efficace du site web en plusieurs langues (anglais, français, turc, arabe, slovène…) sera nécessaire. L’implémentation du contenu textuel du site sous forme ultra-hiérarchisée dans le back office du site permettra la mise en place systématisée de nouvelles traductions.
(ii) Amélioration de la gestion de la base de données. Un certain nombre de taches actuellement réalisées au cas par cas par l’équipe GenIDA, seront automatisées (rattachement de patients aux cohortes correspondantes pour la visualisation des résultats, incrémentation des droits d’accès à ces visualisations selon l’évolution de la taille des cohortes, etc.), ce qui permettra de gérer plus efficacement la croissance de la base de données et son utilisation.
(iii) Amélioration des fonctionnalités d’analyse et de synthèse des données. Les données générées dans GenIDA pour un gène impliqué dans un TDI sont actuellement accessibles de manière agrégée. Il s’agira d’étendre les analyses statistiques et les visualisations pour permettre des requêtes plus complexes, ex. comparer les données pour un gène à celles de l’ensemble des autres gènes, pour repérer des comorbidités spécifiques. Les analyses comprendront les réponses au questionnaire de type QCM, ainsi que les questions en texte libre nécessitant la mise en place d’outils NLP (Natural Language Processing). Enfin, des analyses prenant en compte l'aspect longitudinal de la base de données seront développées.

Le projet GenIDA est mené en accord avec la réglementation française, et respecte le Règlement Général sur la Protection des Données (RGPD). L’étude a fait l’objet d’une déclaration auprès de la Commission Nationale de l’Informatique et des Libertés (CNIL). L’évolution de l’interface web pour le recueil et l’analyse des données permettra d’étendre la portée de GenIDA, et de générer et diffuser des données cliniques significatives et utiles sur un nombre croissant de formes génétiques de TDI.

J-L. Mandel, P. Burger, A. Strehle, F. Colin, T. Mazzucotelli, N. Collot, S. Baer, B. Durand, A. Piton, R. Coutelle, E. Schaefer, P. Parrend, L. Faivre, K. Jobard Garou, D. Geneviève, V. Ruault, D. Martin, R. Caumes, T. Smol, J. Ghoumid, F. Ropert Conquer, J. Kummeling, C. Ockeloen, T. Kleefstra, D. Koolen. GenIDA, une base de données participative internationale permettant de mieux connaître l'histoire naturelle et les comorbidités des formes génétiques de troubles neurodéveloppementaux. Assises de Génétique Humaine et Médicale, Rennes, France, 2022.
Courraud J, Chater-Diehl E, Durand B, Vincent M, Del Mar Muniz Moreno M, Boujelbene I, Drouot N, Genschik L, Schaefer E, Nizon M, Gerard B, Abramowicz M, Cogné B, Bronicki L, Burglen L, Barth M, Charles P, Colin E, Coubes C, David A, Delobel B, Demurger F, Passemard S, Denommé AS, Faivre L, Feger C, Fradin M, Francannet C, Genevieve D, Goldenberg A, Guerrot AM, Isidor B, Johannesen KM, Keren B, Kibæk M, Kuentz P, Mathieu-Dramard M, Demeer B, Metreau J, Steensbjerre Møller R, Moutton S, Pasquier L, Pilekær Sørensen K, Perrin L, Renaud M, Saugier P, Rio M, Svane J, Thevenon J, Tran Mau Them F, Tronhjem CE, Vitobello A, Layet V, Auvin S, Khachnaoui K, Birling MC, Drunat S, Bayat A, Dubourg C, El Chehadeh S, Fagerberg C, Mignot C, Guipponi M, Bienvenu T, Herault Y, Thompson J, Willems M, Mandel JL, Weksberg R, Piton A. Integrative approach to interpret DYRK1A variants, leading to a frequent neurodevelopmental disorder. Genet Med. 2021.
P. Parrend, T. Mazzucotelli, F. Colin, P. Collet, J-L. Mandel. Cerberus, an Access Control Scheme for Enforcing Least Privilege in Patient Cohort Study Platforms, Journal of Medical Systems, Springer Verlag (Germany), 2018.

Qualités – compétences recherchées pour le candidat : Le candidat devrait posséder des connaissances de base en génomique et maladies génétiques rares. Il/elle doit également avoir des connaissances pratiques en base de données, construction de sites web et bio-statistiques. Il/elle devrait être en mesure de travailler au sein d'une équipe interdisciplinaire composée de cliniciens, biologistes, et bio-informaticiens.