Symbiose seminars

  • Efficient index-based filtering for NGS read mapping and suffix/prefix overlap computation

    Gregory Kucherov (CNRS/LIGM Marne-la-Vallée)
    Thursday, January 29, 2015 - 10:30
    Room Minquiers
    Talk abstract: 
    We present two related algorithms for two different problems. The first problem is the classical read mapping problem
    where we assume a constant number of errors is allowed in each read alignment. The second problem is the one of
    efficiently retrieving reads overlapping with a given query sequence. For both problems, we assume that the reads are
    stored in a space-efficient indexing structure such as FM-index, and we propose an efficient search strategy based on 
    partitioning the query read. 
    
    The results are joint with D.Tsur (Ben-Gurion University) and K.Salkhov (LIGM/Moscow State University) and have 
    been presented to CPM'14 and SPIRE'14 conferences. 
  • Interactions plante – communautés microbiennes dans la rhizosphère sous le regard des 'omiques'

    Christophe Mougel (Inra Rennes)
    Thursday, January 22, 2015 - 10:30
    Room Minquiers
    Talk abstract: 

    Les communautés microbiennes associées aux plantes, et plus particulièrement celle de la rhizosphère associée aux racines, contribue fortement à la valeur adaptative des plantes à des stress multiples. Des avancées récentes sur l'écologie des communautés microbiennes dans la rhizosphère sous les effets de la plante hôte été permise grâce aux apports des techniques de séquençage à haut-débit. Cependant ces études ne sont permises que si un dialogue étroit entre biologie et bioinformatique/biostatistique existe afin de développer les méthodes nécessaires pour donner sens aux données biologiques. Au cours de l'exposé sera présenté les méthodes développées pour l'analyse de la diversité des communautés microbiennes mais aussi les questions qui demeurent pour mieux intégrer ces données et aller vers des études plus fonctionnelles.

     

    Christophe Mougel

    INRA, Institut de Génétique, Environnement et Protection des Plantes, UMR1349, Domaine de la Motte, F-35653 Le Rheu, France

    Courriel : christophe.mougel@rennes.inra.fr

  • Tedna: a Transposable Element De Novo Assembler

    Matthias Zytnicki (Inra Toulouse)
    Thursday, January 15, 2015 - 10:30
    Room Minquiers
    Talk abstract: 

    Recent technological advances are allowing many laboratories to sequence their research organisms. Available de novo assemblers leave repetitive portions of the genome poorly assembled. Some genomes contain very high proportions of transposable elements, and transposable elements appear to be a major force behind diversity and adaptation. Few de novo assemblers for transposable elements exist, and most have either been designed for small genomes or 454 reads.

    In this presentation, we present a new transposable element de novo assembler, Tedna, which assembles a set of transposable elements directly from the reads. Tedna uses Illumina paired-end reads, the most widely used sequencing technology for de novo assembly, and forms full length transposable elements.

    Tedna is available from http://urgi.versailles.inra.fr/Tools/Tedna, under the GPLv3 license. Tedna can be used on standard computers with limited RAM resources, although it may also use large memory for better results and parallelization when available.

  • Analyse de la robustesse phénotypique d'une bactérie phytopathogène par intégration du réseau métabolique et du réseau de régulation

    Ludovic Cottret (INRA Toulouse)
    Thursday, January 8, 2015 - 10:30
    Room Minquiers
    Talk abstract: 

    Dans l'analyse du réseau métabolique, la robustesse d'un phénotype est communément définie comme la capacité du métabolisme à maintenir ce phénotype malgré des perturbations génétiques ou environnementales. Plusieurs éléments peuvent être à l'origine de la robustesse phénotypique : la versatilité, i.e. la capacité du système à fonctionner à partir de différents nutriments; la redondance fonctionnelle comprenant la redondance génétique et les voies métaboliques alternatives; et enfin le contrôle du système qui intervient pour capter et compenser efficacement les perturbations.
    Nous nous sommes intéressés à l'analyse de la robustesse phénotypique chez une bactérie phytopathogène, Ralstonia solanacearum. Plus particulièrement, nous avons tenté de prédire l'influence du réseau de régulation de la virulence sur la robustesse phénotypique. Pour cela, nous avons d'abord effectué une reconstruction de haute qualité du réseau métabolique et du réseau de régulation de la virulence grâce à une suite d'outils automatiques et semi automatiques. Ensuite, nous avons développé une librairie Java, appelée FlexFlux, destinée à l'analyse de balance des flux (FBA). L'originalité de FlexFlux est d'intégrer de façon native le réseau de régulation et le réseau de métabolique dans chacune de ces fonctions. Nous verrons enfin comment nous avons utilisé FlexFlux pour mesurer la robustesse de plusieurs phénotypes (liés ou non à la virulence) et l'influence du réseau de régulation de la virulence sur celle-ci.

  • Soutenance de thèse de Gaëlle Garet

    Gaëlle Garet
    Tuesday, December 16, 2014 - 10:00
    Room Markov
    Talk abstract: 

    TBA

  • Soutenance de thèse de Sylvain Prigent

    Sylvain Prigent
    Friday, November 14, 2014 - 14:00
    Room Métivier
    Talk abstract: 

    Complétion combinatoire pour la reconstruction de réseaux métaboliques, et application au modèle des algues brunes Ectocarpus siliculosus.

     

     
    Durant cette thèse nous nous sommes attachés au développement d'une méthode globale de création de réseaux métaboliques chez des espèces biologiques non classiques pour lesquelles nous possédons peu d'informations. Classiquement cette reconstruction s'articule en trois points : la création d'une ébauche métabolique à partir d'un génome, la complétion du réseau et la vérification du résultat obtenu. Nous nous sommes particulièrement intéressé au problème d'optimisation combinatoire difficile que représente l'étape de complétion du réseau, en utilisant un paradigme de programmation par contraintes pour le résoudre : la programmation par ensemble réponse (ou ASP). Les modifications apportées à une méthode préexistante nous ont permis d'améliorer à la fois le temps de calcul pour résoudre ce problème combinatoire et la qualité de la modélisation.
    L'ensemble de ce processus de reconstruction de réseau métabolique a été appliqué au modèle des algues brunes, Ectocarpus siliculosus, nous permettant ainsi de reconstruire le premier réseau métabolique chez une macro-algue brune. La reconstruction de ce réseau nous a permis d'améliorer notre compréhension du métabolisme de cette espèce et d'améliorer l'annotation de son génome.
     
     
    Rapporteurs : 
    - Marie Beurton-Aimar, Maître de conférences, université de Bordeaux 2
    - Hubert Charles, Professeur, INSA Lyon
    - Claudine Médigue, Directrice de recherche CNRS, CEA-Génoscope
     
    Jury :
    - Alexander Bockmayr, Professeur, Freie Universität, Berlin
    - Arnaud Martin, Professeur, université de Rennes 1
    - Anne Siegel, Directrice de recherches CNRS (directrice de thèse)
    - Thierry Tonon, Maître de conférences, UMPC (co-directeur de thèse)
  • Soutenance de thèse de Valentin Wucher

    Valentin Wucher (INRA/Irisa)
    Monday, November 3, 2014 - 14:00
    Room Métivier
    Talk abstract: 

    Modélisation dun réseau de régulation dARN pour prédire des fonctions de gènes impliqués dans le mode de reproduction du puceron du pois
    Résumé
    Cette thèse cherche à discriminer au niveau génomique entre le développement d'embryons vers un mode de reproduction sexué et le développement vers un mode asexué chez le puceron du pois, Acyrthosiphon pisum. Cette discrimination passe par la création du réseau de régulation post-transcriptionnelle des microARN et des ARNm qui possèdent des cinétiques d'expression différentes entre ces deux embryogenèses ainsi que par l'analyse des modules d'interactions de ce réseau par l'utilisation de l'analyse de concepts formels. Pour ce faire, une stratégie en plusieurs étapes a été mise en place : la création d'un réseau d'interactions entre les microARN et les ARNm du puceron du pois ; l'extraction et la réduction du réseau aux microARN et ARNm qui possèdent des cinétiques différentes entre les deux embryogenèses à partir des données d'expression tirées du séquençage haut-débit ; l'analyse du réseau d'interactions réduit aux éléments d’intérêt par l'analyse de concepts formels. L'analyse du réseau a permis l'identification de différentes fonctions potentiellement importantes comme l'ovogenèse, la régulation transcriptionnelle ou encore le système neuroendocrinien. En plus de l'analyse du réseau, l'analyse de concepts formels a été utilisée pour définir une méthode de réparation de graphe biparti basée sur une topologie en concepts ainsi qu'une méthode de visualisation de graphes bipartis par ses concepts.

    Modeling of a gene network between mRNAs and miRNAs to predict gene functions involved in phenotypic plasticity in the pea aphid
    Abstract
    This thesis aims to discriminate between embryos development towards either sexual or asexual reproduction types in pea aphids, Acyrthosiphon pisum, at the genomic level. This discrimination involves the creation of a post-transcriptional regulation network between microRNAs and mRNAs whose kinetic expressions change depending on the embryogenesis. It also involves a study of this network's interaction modules using formal concept analysis. To do so, a three-step strategy was set up. First the creation of an interaction network between the pea aphid's microRNAs and mRNAs. The network is then reduced by keeping only microRNAs and mRNAs which possess differential kinetics between the two embryogeneses, these are obtained using high-throughput sequencing data. Finally the remaining network is analysed using formal concept analysis. Analysing the network allowed for the identification of several functions of potential interest such as oogenesis, transcriptional regulation or even neuroendocrine system. In addition to network analysis, formal concept analysis was used to create a new method to repair a bipartite graph based on its topology and a method to visualise a bipartite graph using its formal concepts.
     

  • Modélisation de la dynamique des réseaux de signalisation SBGN-AF à l'aide de programmes logiques normaux.

    Adrien Rougny (LRI)
    Thursday, October 16, 2014 - 10:30
    Room Minquiers
    Talk abstract: 

    Un grand nombre de réseaux de signalisation sont disponibles dans la littérature ou dans des bases de données sous forme de graphes d'intéractions. Afin de comprendre les systèmes sous-jacents à ces réseaux et de pouvoir les modifier dans un but principalement médical, il est nécessaire de comprendre leur comportement dynamique. C'est pourquoi un grand nombre de techniques de modélisation de la dynamique de ces réseaux moléculaires ont été développées. Il est notamment possible de modéliser la dynamique de ces systèmes par des réseaux booléens. La construction de ces réseaux booléens à partir de graphes d'intéractions nécessite une paramétrisation des fonctions booléennes, le plus souvent réalisée à partir de l'interprétation de résultats expérimentaux. Nous exposerons dans cette présentation une méthode de paramétrisation réalisée sans données expérimentales mais à partir de principes biologiques généraux régissant la dynamique des réseaux de signalisation. Dans notre méthode, les réseaux booléens sont exprimés sous forme de programmes logiques normaux, à partir desquels leurs états stationnaires et trajectoires sont calculés.

  • Modeling dynamics of cell-to-cell variability in TRAIL-induced apoptosis explains fractional killing and predicts reversible resistance

    Gregory Batt (INRIA, Rocquencourt)
    Thursday, October 9, 2014 - 10:30
    Room Minquiers
    Talk abstract: 

    TRAIL induces apoptosis selectively in cancer cells and is currently tested in clinics. Having a mechanistic understanding of TRAIL resistance could help to limit its apparition. Several observations suggested that protein level fluctuations play an important role in TRAIL resistance and its acquisition. However, quantitative, systems-level approaches to investigate their role in cellular decision-making processes are lacking. We propose a generic and principled approach to extend signal transduction models with protein fluctuation models for all proteins in the pathway. The key aspect is to use standard protein fluctuation models for long-lived proteins. We show that its application to TRAIL-induced apoptosis provide a quantitative, mechanistic explanation to previously published but yet unexplained critical observations.

  • Annoyances in metagenomic data analysis and interpretation

    Thomas Bruls (Genoscope)
    Thursday, September 25, 2014 - 10:30
    Room Minquiers
    Talk abstract: 
    Sustained developments in sequencing technology have fueled a range of
    new applications in various fields of life sciences, among which
    metagenomics (aka community genomics or environmental genomics), whose
    promise is to deliver deeper insights into the so-called "unseen majority".
    
    Beyond issues common to other data intensive applications, metagenomics 
    faces difficulties arising from the "in situ" structure of microbial 
    communities, which hinder the possibility of generating accurate 
    assemblies from even moderately complex metagenomes.
    
    These limitations have prompted or renewed interest in assembly-free
    methods for sequence analysis, which are nowadays intensively studied
    from both statistical and algorithmic point of views.
    
    In this talk, we will discuss and illustrate through various real
    world examples (and some less real ones) how such methods, including
    so-called "binning" methods, can help to increase biological
    interpretability of metagenome datasets.
    
    We will also sketch the layout of a software development project that
    aims at scalable variable selection for biomarker discovery from large
    and complex metagenomic datasets. It involves a nested clustering
    procedure combining two types of features extracted from the
    sequences: a coverage related signal (captured using long k-mers), and
    a composition related one (captured using shorter k-mers).
    
    If we have time left, we will evoke an intriguing spectral algorithm
    that has roots in the pre-genomic era, e.g. was succesfully applied in
    the context of physical mapping efforts, and that could be amenable to
    solve some sequence assembly problems.

Pages