Symbiose seminars

  • Theory Solving made easy with Clingo 5

    Torsten Schaub (Uni. Potsdam)
    Thursday, March 24, 2016 - 10:30
    Room Aurigny
    Talk abstract: 

    We present the fifth generation of the ASP systems gringo\ and clingo,
    while focusing on their major feature, namely, the easy addition of theory reasoning.
    From the grounder's perspective, this involves a generic way of specifying theory-specific language
    extensions and the design of an intermediate format accommodating ground theory expressions.
    From the solving view, this is accompanied by a high-level interface for integrating theory propagators
    interpreting these theory expressions.

    (This will be rather a demo than a talk! )

  • Oxford Nanopore Technology : Données et applications.

    Jean Marc Aury (Genoscope)
    Thursday, March 10, 2016 - 10:30
    Room Aurigny
    Talk abstract: 

    La société Oxford Nanopore Technology - ONT (https://www.nanoporetech.com/) propose depuis peu un séquenceur 3ème génération, permettant de lire de très grands fragments d'ADN, jusqu'à 100Kb. La technique de séquençage par Nanopore est très différentes des technologies existantes et elle présente de nombreux avantages. L'exposé présentera le fonctionnement du séquenceur MkI de ONT, ainsi que différents jeux de données obtenus sur des bactéries et des eucaryotes. Par le biais de séquençage d'ADN génomique, nous illustrerons l'intérêt du séquenceur MkI pour l'assemblage de novo de génomes et notamment la résolution des régions répétées.
     

  • Applications of the Theory of Formal Languages for the Design of Fast Hardware Implementations of Parallel Multiset Rewriting

    Serghei Verlan (LACL Université Paris Est Créteil Val de Marne )
    Thursday, March 3, 2016 - 10:30
    Room Aurigny
    Talk abstract: 

    In this talk we present the design of a fast hardware simulator forparallel multiset rewriting using the field-programmable gate array(FPGA) technology. The simulator is non-deterministic and it uses aconstant time procedure to choose one of the computational paths. Theobtained strategy is equitable and it is based on a pre-computation ofall possible rule applications. This pre-computation is obtained byusing the representation of all possible multisets of rules'applications as context-free languages. Then using the Schutzenbergertechnique for the computation of the generating series for context-freelanguages it is possible to construct the structure representing allpossible rule applications for any configuration.We give a hardware design implementing some concrete examples andpresent the obtained experimental results which feature an importantspeed-up. 

  • Identification et « quantification » des attracteurs dans des dynamiques discrètes asynchrones. Application sur un modèle de cancer de vessie.

    Elisabeth Remy (université d'Aix-Marseille)
    Thursday, January 28, 2016 - 10:30
    Room Aurigny
    Talk abstract: 
     
    Le cadre de cet exposé est la modélisation discrète des réseaux de régulation biologique. 
    La formalisme logique permet de faire une analyse qualitative de la dynamique des processus étudiés, et de proposer une explication « mécanistique » des phénomènes observés.
    Après une description de ce formalisme et des principaux outils qui permettent d’analyser les propriétés du système, nous étudierons une application de cette modélisation dans le cadre de la tumorigénèse du cancer de vessie. Plus précisément, nous portons notre attention sur les co-occurences ou exclusions mutuelles d’altérations génétiques qui apparaissent de façon significative. 
    Pour expliquer ces pattern d’altérations, une exploration plus quantitative de la dynamique s’avère nécessaire. Ainsi, nous  proposons une méthode pour quantifier l’atteignabilité des attracteurs dans des (très) grands graphes.
     
  • Approximating the dynamics of the Hybrid Stochastic-Deterministic Apoptosis pathway

    Sucheendra Palaniappan (Inria Rennes)
    Thursday, January 21, 2016 - 10:30
    Room Aurigny
    Talk abstract: 

    Modeling and analysis of the dynamics of biological systems while accounting for single cell fluctuations is important. In particular, there has been recent work on a hybrid stochastic-deterministic (HSD) model of TRAIL induced apoptosis that combines a deterministic signal transduction model and a stochastic model for protein turnover that can explain fractional killing and predict the time dependent evolution of cell resistance to TRAIL. While this model is extremely useful for analyzing TRAIL induced apoptosis by drawing simulations in a single cell setting, it can be limiting in cases when we want to analyse the system in a multi-scale setting (say modeling a spheroid of millions of cells at larger time horizon for clinical trials).In such cases, simulating the original model for repeated analysis tasks can become extremely time consuming due to the scale of the resultant system. Instead, one could directly approximate the dynamics of the underlying system as an intermediate level behavioral model and use this approximation instead. In this talk, we will present results describing a minimalist discrete appromixation (Dynamic Bayesian Networks (DBNs) ) of the dynamics of the HSD model. We will describe how analysis tasks on the original HSD model translates to probabilistic inference tasks on the DBN. 

  • L'hétérozygotie, problème technique ou objet d'étude ?

    Jean-François Flot (Evolutionary Biology & Ecology - Université Libre de Bruxelles)
    Thursday, January 14, 2016 - 10:30
    Room Aurigny
    Talk abstract: 

    Dans les études de phylogénie et de génomique il est courant de considérer l'hétérozygotie des organismes diploïdes comme un problème nuisible dont on cherche à se débarrasser afin d'obtenir des données exploitables. Si les séquences obtenues à partir d'individus hétérozygotes sont certes complexes, elles renferment néanmoins des trésors d'informations hélas trop peu souvent exploitées. A partir d'exemples divers (notamment coraux, amphipodes et rotifères), j'illustrerai certaines approches bioinformatiques permettant de tirer partie de l'hétérozygotie des organismes pour jeter un regard nouveau sur l'évolution et sur la dynamique de leur génome. 

  • L'assemblage de grands génomes à base des séquence PacBio vu des données

    Christophe Klopp
    Thursday, January 7, 2016 - 10:30
    Room Aurigny
    Talk abstract: 

    L'assemblage de génomes de grande taille est, depuis les débuts de la génomique, un sujet de grand intérêt pour les biologistes et de recherche pour les informaticiens. Une première génération d'assembleurs de type OLC (overlap layout consensus) a été développée pour le traitement des séquences de première génération appelées aussi séquences Sanger. La stratégie était alors le plus souvent de découper le génomes en morceaux (fosmides, BAC) et d'assembler les lectures provenant de ces morceaux avant de joindre ces premiers assemblages pour produire des morceaux de chromosomes. La diminution du coût de séquençages due à l'apparition des machines de seconde génération a poussé au développement de nouveaux algorithmes, souvent basés sur des graphes de de Bruinj, capables de traiter ces grandes masses de données. La troisième génération de séquenceurs est maintenant entrée dans une phase de maturité avec la capacité de produire d'assez grandes quantités de séquences très longues. Ceci remet en selle la première stratégie d'assemblage et certaines suites logicielles anciennes ayant été adaptées à ces nouvelles données. Les séquences étant de très faible qualité, il a toutefois été nécessaire d'ajouter une étape de correction en amont de l'assemblage. L'exposé présente l'évolution des stratégies d'assemblage en faisant un focus sur celles utilisant les séquences de troisième génération. l'évolution de la qualité des séquences aux différentes étapes de l'assemblage permettra de montrer impact de la correction mais aussi ses limites actuelles. L'exposé comprend des exemples issus d'assemblages de données publiques ou privées afin d'analyser à chaque étape la qualité des données en entrée et en sortie de manière à aussi trouver de possibles améliorations du processus.

  • Orthology-based genome annotation and interpretation

    Robert Waterhouse
    Thursday, December 3, 2015 - 10:30
    Room Métivier
    Talk abstract: 

    The OrthoDB catalogue of orthologues at www.orthodb.org [Kriventseva, et al. 2015], represents a comprehensive resource of comparative genomics data to help researchers make the most of their newly-sequenced genomes. OrthoDB’s sets of Benchmarking Universal Single-Copy Orthologues, BUSCO [Simão, et al. 2015], provide a rich source of data to assess the quality and completeness of these genome assemblies and their gene annotations. These resources and tools enable improved and extended orthology-based genome annotation and interpretation in a comparative genomics framework that incorporates the rapidly growing numbers of newly-sequenced genomes. Such comparative approaches are well-established as immensely valuable for gene discovery and characterization, helping to build resources to support biological research. Orthology delineation is a cornerstone of comparative genomics, offering evolutionarily-qualified hypotheses on gene function by identifying “equivalent” genes in different species, as well as highlighting shared and unique genes that offer clues to understanding species diversity and provide the means to begin to investigate key biological traits – for both large-scale evolutionary biology research and targeted gene and gene family studies. The success of such interpretative analyses relies on the comprehensiveness and accuracy of the input data, making BUSCO quality assessment an important part of the process of genome sequencing, assembly, and annotation. Orthology-based approaches therefore offer not only a vital means by which to begin to interpret the increasing quantities of genomic data, but also to help prioritize improvements, and to ensure that initial “draft” genomes develop into high-quality resources that benefit the entire research community.

     

     

    Affiliations & contacts;

    University of Geneva Medical School & Swiss Institute of Bioinformatics, Geneva, Switzerland.

    Massachusetts Institute of Technology & Broad Institute of MIT and Harvard, Cambridge, USA.

    Robert.Waterhouse@unige.ch

    www.rmwaterhouse.org

     

  • Whole genome assembly of the parasitoid wasp Lysiphlebus fabarum

    Alice Dennis
    Thursday, November 19, 2015 - 10:30
    Room Turing Petri
    Talk abstract: 

    Lysiphlebus fabarum is one of the most abundant parasitoid wasps in Europe, primarily targeting aphids in the genus Aphis. To facilitate work that will include studies of adaptive gene expression and the basis of contagious parthenogenesis, we are assembling a draft whole-genome sequence of L. fabarum. Initial assemblies conducted using Illumina data, followed by scaffolding using PacBio sequences produced an alignment with a high N50, and good return of both CEGMA and BUSCO genes. Interesting features of this L. fabarum genome thus far include a very low GC content and evidence of historical integrations of viral sequences. However, initial evaluation of this assembly suggests that it contains a number of errors, and this has hindered our construction of linkage groups. I will present a summary of our work to date in evaluating this genome assembly, and in comparing it to several new assemblies using both Illumina and PacBio focused alignment methods.

     

    Authors:

    Alice Dennis, Jens Bast, Zoé Dumas, Giancarlo Russo, Tanja Schwander, Christoph Vorburger

  • Le séquençage et l'assemblage de génomes de référence à partir de données PacBio

    Jerome Gouzy (Laboratoire des Interactions Plantes Micro-organismes (LIPM) - INRA/CNRS)
    Thursday, November 5, 2015 - 10:30
    Room Métivier
    Talk abstract: 



    Depuis bientôt deux ans, les dernières avancées de la technologie de séquençage PacBio ont bouleversé les projets de séquençages génomiques. Non seulement les chromosomes bactériens mais également les chromosomes de nombreux génomes eucaryotes peuvent s’assembler en une seule séquence ou dans le pire des cas en bras chromosomiques. La qualité des assemblages atteint si ce n’est dépasse les assemblages de références Sanger des années 2000, les centromères et télomères alors souvent non résolus sont désormais analysables.  Les résultats sur plusieurs espèces de bactéries, champignons et plantes seront présentés afin d’illustrer les réussites de cette rupture technologique mais aussi les cas qui restent encore non parfaitement résolus.

Pages