Symbiose seminars

  • Reconstructing the history of speciation from NGS data, accounting for genome-wide heterogeneity in introgression rates

    Nicolas Bierne (CNRS Montpellier)
    Thursday, March 5, 2015 - 10:30
    Room Minquiers
    Talk abstract: 

    Methods to reconstruct the history of divergence and gene flow between populations of closely related taxa with molecular data do not cease improving. It has recently become possible to account for genome-wide heterogeneity (GWH) in introgression rates. Not only this has proven to have profound impacts on the biological conclusions drawn from the inference, but when applied to large NGS datasets can also provide an estimate of the proportion of the genome impeded by the barrier to gene flow. We have evaluated the relative performance of two highly flexible methods on NGS data: (i) a composite maximum likelihood (CML) method that uses diffusion approximation of the joint site frequency spectrum (JSFS) and (ii) an Approximate Bayesian Computation (ABC) method. The CML method makes a number of assumptions that are likely to be violated and also miss some important information of RNA-seq data to account for GWH. The ABC method is much computationally intensive but allows to relax some assumptions and to better extract the between-contig variation that can be important to correctly infer GWH. Methods are applied to RNA-seq datasets of 70 pairs of taxa of animals that were not initially chosen to champion one or another model of speciation (e.g. sympatry vs. allopatry). We show that GWH is widespread, that divergence times are underestimated when GWH is not accounted for, and initiate a description of the relationship between divergence and genome porosity from this kind of analysis.


  • Graines approchees pour la recherche de courts motifs, application aux microARN

    Hélène Touzet (Inria Lille)
    Thursday, February 26, 2015 - 10:30
    Room Minquiers
    Talk abstract: 

    Les méthodes de comparaison de séquence les plus populaires utilisent
    une approche par filtrage, en deux temps: recherche de petits motifs
    communs, appelés graines, puis combinaison de ces motifs pour former
    un alignement. Ce paradigme se décline de manière variable en fonction
    du modèle combinatoire utilisé pour la graine: graine contigue, graine
    espacée, graine avec erreurs, etc.  Ce choix conditionne la
    sensibilité, la spécificité et l'efficacité de la recherche.

    Dans cet exposé, nous présenterons un nouveau type de graines,
    appelées graines 01*0, qui autorisent des erreurs de type insertion,
    délétion et substitution. Ces graines sont particulièrement bien
    adaptées à la recherche de courts motifs bruités. Nous montrerons deux
    exemples d'application issus du monde des microARN: la recherche de
    cibles de microARN, et la recherche de microARN homologues.

  • Knowledge-based generalization for metabolic models

    Anna Zhukova (IBGC Bordeaux)
    Thursday, February 12, 2015 - 10:30
    Room Minquiers
    Talk abstract: 

    Genome-scale metabolic models describe the relationships between thousands of reactions and biochemical molecules, and are used to improve our understanding of organism’s metabolism. They found applications in pharmaceutical, chemical and bioremediation industries.

    The complexity of metabolic models hampers many tasks that are important during the process of model inference, such as model comparison, analysis, curation and refinement by human experts. The abundance of details in large-scale networks can mask errors and important organism-specific adaptations. It is therefore important to find the right levels of abstraction that are comfortable for human experts. These abstract levels should highlight the essential model structure and the divergences from it, such as alternative paths or missing reactions, while hiding inessential details.

    To address this issue, we defined a knowledge-based generalization that allows for production of higher-level abstract views of metabolic network models. We developed a theoretical method that groups similar metabolites and reactions based on the network structure and the knowledge extracted from metabolite ontologies, and then compresses the network based on this grouping. We implemented our method as a python
    library, that is available for download from

    To validate our method we applied it to 1 286 metabolic models from the Path2Model project, and showed that it helps to detect organism-, and domain-specific adaptations, as well as to compare models.

    Based on discussions with users about their ways of navigation in metabolic networks, we defined a 3-level representation of metabolic networks: the full-model level, the generalized level, the compartment level. We combined our model generalization method with the zooming user interface (ZUI) paradigm and developed Mimoza, a user-centric tool for zoomable navigation and knowledge-based exploration of metabolic networks that produces this 3-level representation. Mimoza is available both as an on-line tool and for download at

  • Internal coarse-graining of molecular systems

    Jérôme Feret (ENS Ulm)
    Monday, February 9, 2015 - 10:30
    Room Minquiers
    Talk abstract: 
    Modelers of molecular signaling networks must cope with the
    combinatorial explosion of protein states generated by
    post-translational modifications and complex formation. Rule-based
    models provide a powerful alternative to approaches that require an
    explicit enumeration of all possible molecular species of a system. Such
    models consist of formal rules stipulating the (partial) contexts for
    specific protein-protein interactions to occur. These contexts specify
    molecular patterns that are usually less detailed than molecular
    species. Yet, the execution of rule-based dynamics requires stochastic
    simulation, which can be very costly. It thus appears desirable to
    convert a rule-based model into a reduced system of differential
    equations by exploiting the lower resolution at which rules specify
    interactions. We present a formal (and automated) abstract
    interpretation-based method for constructing a coarse-grained and
    self-consistent dynamical system aimed at molecular patterns that are
    distinguishable by the dynamics of the original system as posited by the
    rules. The method is formally sound and never requires the execution of
    the rule-based model. The coarse-grained variables do not depend on the
    values of the rate constants appearing in the rules, and typically form
    a system of greatly reduced dimension that can be amenable to numerical
    integration and further model reduction techniques.
  • Efficient index-based filtering for NGS read mapping and suffix/prefix overlap computation

    Gregory Kucherov (CNRS/LIGM Marne-la-Vallée)
    Thursday, January 29, 2015 - 10:30
    Room Minquiers
    Talk abstract: 
    We present two related algorithms for two different problems. The first problem is the classical read mapping problem
    where we assume a constant number of errors is allowed in each read alignment. The second problem is the one of
    efficiently retrieving reads overlapping with a given query sequence. For both problems, we assume that the reads are
    stored in a space-efficient indexing structure such as FM-index, and we propose an efficient search strategy based on 
    partitioning the query read. 
    The results are joint with D.Tsur (Ben-Gurion University) and K.Salkhov (LIGM/Moscow State University) and have 
    been presented to CPM'14 and SPIRE'14 conferences. 
  • Interactions plante – communautés microbiennes dans la rhizosphère sous le regard des 'omiques'

    Christophe Mougel (Inra Rennes)
    Thursday, January 22, 2015 - 10:30
    Room Minquiers
    Talk abstract: 

    Les communautés microbiennes associées aux plantes, et plus particulièrement celle de la rhizosphère associée aux racines, contribue fortement à la valeur adaptative des plantes à des stress multiples. Des avancées récentes sur l'écologie des communautés microbiennes dans la rhizosphère sous les effets de la plante hôte été permise grâce aux apports des techniques de séquençage à haut-débit. Cependant ces études ne sont permises que si un dialogue étroit entre biologie et bioinformatique/biostatistique existe afin de développer les méthodes nécessaires pour donner sens aux données biologiques. Au cours de l'exposé sera présenté les méthodes développées pour l'analyse de la diversité des communautés microbiennes mais aussi les questions qui demeurent pour mieux intégrer ces données et aller vers des études plus fonctionnelles.


    Christophe Mougel

    INRA, Institut de Génétique, Environnement et Protection des Plantes, UMR1349, Domaine de la Motte, F-35653 Le Rheu, France

    Courriel :

  • Tedna: a Transposable Element De Novo Assembler

    Matthias Zytnicki (Inra Toulouse)
    Thursday, January 15, 2015 - 10:30
    Room Minquiers
    Talk abstract: 

    Recent technological advances are allowing many laboratories to sequence their research organisms. Available de novo assemblers leave repetitive portions of the genome poorly assembled. Some genomes contain very high proportions of transposable elements, and transposable elements appear to be a major force behind diversity and adaptation. Few de novo assemblers for transposable elements exist, and most have either been designed for small genomes or 454 reads.

    In this presentation, we present a new transposable element de novo assembler, Tedna, which assembles a set of transposable elements directly from the reads. Tedna uses Illumina paired-end reads, the most widely used sequencing technology for de novo assembly, and forms full length transposable elements.

    Tedna is available from, under the GPLv3 license. Tedna can be used on standard computers with limited RAM resources, although it may also use large memory for better results and parallelization when available.

  • Analyse de la robustesse phénotypique d'une bactérie phytopathogène par intégration du réseau métabolique et du réseau de régulation

    Ludovic Cottret (INRA Toulouse)
    Thursday, January 8, 2015 - 10:30
    Room Minquiers
    Talk abstract: 

    Dans l'analyse du réseau métabolique, la robustesse d'un phénotype est communément définie comme la capacité du métabolisme à maintenir ce phénotype malgré des perturbations génétiques ou environnementales. Plusieurs éléments peuvent être à l'origine de la robustesse phénotypique : la versatilité, i.e. la capacité du système à fonctionner à partir de différents nutriments; la redondance fonctionnelle comprenant la redondance génétique et les voies métaboliques alternatives; et enfin le contrôle du système qui intervient pour capter et compenser efficacement les perturbations.
    Nous nous sommes intéressés à l'analyse de la robustesse phénotypique chez une bactérie phytopathogène, Ralstonia solanacearum. Plus particulièrement, nous avons tenté de prédire l'influence du réseau de régulation de la virulence sur la robustesse phénotypique. Pour cela, nous avons d'abord effectué une reconstruction de haute qualité du réseau métabolique et du réseau de régulation de la virulence grâce à une suite d'outils automatiques et semi automatiques. Ensuite, nous avons développé une librairie Java, appelée FlexFlux, destinée à l'analyse de balance des flux (FBA). L'originalité de FlexFlux est d'intégrer de façon native le réseau de régulation et le réseau de métabolique dans chacune de ces fonctions. Nous verrons enfin comment nous avons utilisé FlexFlux pour mesurer la robustesse de plusieurs phénotypes (liés ou non à la virulence) et l'influence du réseau de régulation de la virulence sur celle-ci.

  • Soutenance de thèse de Gaëlle Garet

    Gaëlle Garet
    Tuesday, December 16, 2014 - 10:00
    Room Markov
    Talk abstract: 


  • Soutenance de thèse de Sylvain Prigent

    Sylvain Prigent
    Friday, November 14, 2014 - 14:00
    Room Métivier
    Talk abstract: 

    Complétion combinatoire pour la reconstruction de réseaux métaboliques, et application au modèle des algues brunes Ectocarpus siliculosus.


    Durant cette thèse nous nous sommes attachés au développement d'une méthode globale de création de réseaux métaboliques chez des espèces biologiques non classiques pour lesquelles nous possédons peu d'informations. Classiquement cette reconstruction s'articule en trois points : la création d'une ébauche métabolique à partir d'un génome, la complétion du réseau et la vérification du résultat obtenu. Nous nous sommes particulièrement intéressé au problème d'optimisation combinatoire difficile que représente l'étape de complétion du réseau, en utilisant un paradigme de programmation par contraintes pour le résoudre : la programmation par ensemble réponse (ou ASP). Les modifications apportées à une méthode préexistante nous ont permis d'améliorer à la fois le temps de calcul pour résoudre ce problème combinatoire et la qualité de la modélisation.
    L'ensemble de ce processus de reconstruction de réseau métabolique a été appliqué au modèle des algues brunes, Ectocarpus siliculosus, nous permettant ainsi de reconstruire le premier réseau métabolique chez une macro-algue brune. La reconstruction de ce réseau nous a permis d'améliorer notre compréhension du métabolisme de cette espèce et d'améliorer l'annotation de son génome.
    Rapporteurs : 
    - Marie Beurton-Aimar, Maître de conférences, université de Bordeaux 2
    - Hubert Charles, Professeur, INSA Lyon
    - Claudine Médigue, Directrice de recherche CNRS, CEA-Génoscope
    Jury :
    - Alexander Bockmayr, Professeur, Freie Universität, Berlin
    - Arnaud Martin, Professeur, université de Rennes 1
    - Anne Siegel, Directrice de recherches CNRS (directrice de thèse)
    - Thierry Tonon, Maître de conférences, UMPC (co-directeur de thèse)