Bonjour,

Merci de déposer votre proposition de stage pour le M2S4 BSIB 2020-2021.

Le stage se déroulera de janvier à juin 2021. La soutenance est prévue vers le 15 juin 2021.

Les étudiants M2 BSIB devront effectuer un stage en novembre (M2S3) qui peut-être couplé avec le stage de M2S4.

Responsable de l'équipe d'accueil

Adam-Blondon
Anne-Françoise
This email address is being protected from spambots. You need JavaScript enabled to view it.
01 30 83 37 49

Personne encadrant le stage

Flores
Raphaël
05 61 28 51 92

Lieu du stage

INRAE - CNRGV
24 Chemin de Borde Rouge - Auzeville
CS 52627
31326 Castanet Tolosan Cedex

Sujet du stage

Automatisation et généralisation d‘intégration de données issues de fouille de texte dans un SI
Mots clés résumant les méthodes et techniques à utiliser au cours du stage :
- Fouille de texte, graphe de connaissances, ontologies biologiques et environnementales
- Langages et outil de développement : Neo4j, Python, RDF, Docker/Singularity, GNU/Linux, Shell.

Un des enjeux de la biologie végétale est d’étudier, voire de prédire, le phénotype d’une plante et sa capacité à s’adapter à des stress à partir de données génétiques, génomiques et environnementales. Ce lien entre génotype et phénotype s’effectue via des approches de détection de QTL ou de GWAS, souvent complétées par une approche gène candidat. De nombreuses connaissances existent déjà chez des espèces modèles ainsi que dans la littérature scientifique.

GnpIS (https://urgi.versailles.inrae.fr/gnpis/) est une base de données INRAE qui permet de stocker des jeux de données de génétique, de phénomique et de génomique chez les plantes . En complément, des données de ce type se trouvent de façon non structurée dans la bibliographie.

L’URGI développe un graphe de connaissances permettant d’intégrer des données hétérogènes dans l’optique d’apporter un appui efficace et rapide en terme d’exploration de données à la communauté scientifique, en particulier en lien avec des approches de biologie translationnelle.

Une preuve de concept a été réalisée sur le blé pour développer et automatiser un pipeline de fouille de texte (AlvisNLP développé par l’équipe Bibliome de l’UMR MaIAGE) permettant de collecter ce type d’information dans des articles et de les annoter sémantiquement.

Objectifs :
- Un premier objectif du stage consiste à adapter et utiliser le pipeline de fouille de texte sur un corpus bibliographique étendu en s’appuyant notamment sur des identifiants de gènes d’intérêt, d’ontologies de référence (gene ontology, phenotype, ...) et bases de données de référence (PFAM, UniProt, classification Wicker).
- Un second objectif sera d’intégrer ces données annotées au sein d’un graphe de connaissances (basé sur Neo4J) afin de pouvoir en enrichir les connaissances et permettre de répondre à des questions scientifiques en mettant en œuvre une approche de biologie translationnelle.
- Le dernier objectif consistera à exposer les données intégrées sous la forme d’un graphe en représentation RDF permettant ainsi leur publication sous une forme rendant possible leur réutilisation par la communauté scientifique.

Modalités pour postuler :
Les candidatures (CV + lettre de motivation) doivent être adressées au plus tard jusqu’au 31/10/2021 par courriel à This email address is being protected from spambots. You need JavaScript enabled to view it. avec l’objet suivant : [2022-stage-graph-text-mining].

Détails : https://urgi.versailles.inrae.fr/About-us/News/6-months-M2-internship-position-at-INRAE-Toulouse

Modalités de l’évaluation de l’UE « Stage expérimentale en laboratoire » de la mention de Master Sciences du Vivant

L’UE « stage expérimentale en laboratoire » se compose de 3 blocs pédagogiques de même coefficient : un rapport écrit (coefficient 8), une soutenance orale (coefficient 10) et une épreuve de réponses aux questions (coefficient 12).

Le jury est constitué de 5 membres au moins dont le responsable de la spécialité de Master. Des sous-jurys (par parcours) de 5 membres au moins dont un représentant du responsable de la spécialité de Master peuvent être constitués. Chaque rapport sera examiné par au moins 2 rapporteurs et 3 dans la mesure du possible. Les rapporteurs font partie du jury. Chaque rapporteur évaluera au minimum 3 rapports.

L’avis du maître de stage sera demandé sous forme d’un questionnaire standard et pourra être pris en compte par le président du jury lors de l’établissement de la note finale.
 

Rapport écrit (coefficient 8) 
 

Il a pour but d’évaluer les compétences de l’étudiant à rédiger un rapport scientifique écrit tant sur le fond que sur la forme. Les candidats seront jugés sur la cohérence de la démarche scientifique et sur l’enchaînement logique du travail plus que sur les résultats eux-mêmes. Il est rappelé que l'essentiel du travail exposé dans le mémoire doit représenter le travail effectif qu'a réalisé l'étudiant durant son semestre de stage.

Les candidats remettront 4 exemplaires papier du rapport de stage et une version informatique (format PDF), courrier adressé à Pr. Jean Cavarelli, date limite de réception sera communiqué aux étudiants.

La version PDF devra être déposée sur le site moodle UNISTRA, rubrique stage M2S4 BSIBB, tout au début du mois de juin (la date sera communiquée aux étudiants (début  juin en 2020). Les versions PDF et papier devront être identiques.

  • Toutes les parties du document seront rédigées en interligne de 1,5 en utilisant une police de type Times et des caractères de taille 12.
    Le rapport écrit devra obligatoirement comporter les parties suivantes : introduction, Matériels et Méthodes, Résultats, Discussion / Perspectives et n’excèdera pas 20 pages numérotées. Les pages seront imprimées en recto simple.
  • L’ensemble figures, tableaux, bibliographie ne dépassera pas 10 pages supplémentaires (non paginées). Les figures et leur légende sont présentées en regard du texte (Figures au verso, texte au recto de la page suivante). Les légendes des figures doivent permettre de comprendre les figures sans avoir besoin de consulter le texte, tout en évitant une trop grande redondance avec le texte.
  • Les modalités de présentation de la bibliographie sont celles de la revue CELL (revue généraliste dans laquelle les références sont indiquées dans le texte à l'aide des auteurs et de l'année de publication). Elles peuvent être retrouvées en utilisant un logiciel de type EndNote .
  • Le document sera complété par une page de sommaire et une page d’abréviations en début de rapport.
  • Chaque mémoire doit être accompagné d’un résumé d’une page au maximum (police type Times caractère taille 12, interligne 1,5). Ce résumé doit être suffisamment informatif pour permettre d'orienter le choix des rapporteurs qui examineront le manuscrit. Il devra comporter les informations suivantes :
    Nom et prénom du candidat : Spécialité de Master :
    Laboratoire d'accueil :
    Responsable du stage :
    Titre du rapport
    Mots clés ………………….
    Résumé .............................

 

Présentation orale : durée 12 mn (coefficient 10) 
 

Les soutenances auront lieu mi-juin. La date sera précisé au cours du semestre. Elle a pour but d’évaluer sur la forme et sur le fond les compétences des étudiants à exposer dans un temps limité un travail expérimental, à le situer dans son contexte et à en discuter la stratégie
expérimentale, les résultats et les perspectives. Le candidat devra déposer déposera une version pdf de son exposé oral sur le site moodle du stage la date sera communiquée aux étudiants (mi-juin en 2020). 


Entretien avec les membres du jury.
Questions : durée 12 mn (coefficient 12) 
 

Les questions visent à évaluer et à préciser les connaissances de l‘étudiant sur le thème abordé, son esprit critique et ses compétences expérimentales. Elles pourront ainsi porter sur les techniques mises en œuvre, leur principe, la culture générale dans le domaine abordé et plus généralement la capacité à analyser les résultats et à en dégager des perspectives.


Les questions pourront s’appuyer sur l’exposé oral et sur le manuscrit. Dans ce dernier cas, elles concerneront le fond et non la forme (orthographe, mise en page , etc …)