Symbiose seminars

  • Annotating long non-coding RNAs in model and non-model organisms using a Random Forest strategy

    Valentin Wucher (IGDR)
    Thursday, March 16, 2017 - 10:30
    Room Aurigny
    Talk abstract: 

    Le séquençage du transcriptome (RNA-seq) est devenu un standard pour identifier et caractériser les différentes populations d'ARN. Néanmoins, l'une des principales difficultés consiste à pouvoir classer les nouveaux transcrits et notamment différencier les ARN qui seront traduits en protéines (ARNm/mRNA) des ARN longs non-codants (ARNlnc/lncRNA). Dans ce but, nous avons développé FEELnc (FlExible Extraction of LncRNAs), un programme ne nécessitant pas d'alignements de séquences (alignment-free) et qui permet d'annoter les ARNlnc via une stratégie Random Forest basée/entraînée sur les fréquences de multiples k-mer et une définition d'ORF relâchée. Comparées avec 5 autres méthodes, les performances de FEELnc montrent des résultats similaires ou meilleurs sur des jeux de données connus de lncRNA/mRNAs issus de l'annotation de référence GENCODE (homme et souris) et NONCODE (base de données d'ARNlnc chez des espèces non-modèles). FEELnc automatise aussi l'annotation des ARNlnc en sous-classes distinctes (génique et intergéniques) et permet d'identifier des ARNlnc même sans séquences d'ARN longs non-codants en apprentissage, ce qui permet son utilisation pour des espèces non-modèles. FEELnc a été utilisé chez 3 espèces non-modèles : le chien, le poulet et l'algue (Ectocarpus), permettant l'identification de plusieurs ARNlnc.

  • Using EDAM and bio.tools for the integration of bioinformatics resources

    Hervé Menager (Institut Pasteur)
    Thursday, March 9, 2017 - 10:30
    Room Aurigny
    Talk abstract: 

    The ELIXIR infrastructure is currently building bio.tools, a registry of bioinformatics tools and data services. The aim of this registry is to provide the scientific community with a portal to enable the discovery and the use of the resources needed to conduct bioinformatics analyses. This registry includes detailed description of the tools and services, which relies, among other things, on the use of the EDAM ontology, a community-led vocabulary that has been developed to describe in a consistent manner bioinformatics data and methods. I will here present this effort, and detail the perspectives of collaboration of bio.tools with other initiatives to improve the discovery, deployment, integration and reproducibility of bioinformatics resources. 

     

  • CANCELED

    Céline Rouveirol (LIPN)
    Thursday, March 2, 2017 - 10:30
    Room Aurigny
    Talk abstract: 

    CANCELED 

  • MatrixDB : de la curation aux réseaux d’interactions

    Sylvie RICARD-BLUM (Université Lyon 1 - ICBMS)
    Thursday, February 9, 2017 - 10:30
    Room Aurigny
    Talk abstract: 

    La matrice extracellulaire humaine est constitué de 274 protéines (collagènes, fibronectine, laminines) et protéoglycanes et de 747 protéines associées (enzymes, facteurs de croissance) (Naba et al., 2012 Matrix Biol 31: 371-2). Elle contient également des polysaccharides complexes, les glycosaminoglycanes. Elle constitue un réseau tridimensionnel d’interactions qui assure l’architecture, la cohésion et les propriétés mécaniques des tissus et les interactions avec les cellules. Les interactions biomoléculaires s’influencent mutuellement in vivo et sont conditionnées par le contexte moléculaire et biologique. Les perturbations de ce réseau par la modification de la concentration des constituants (fibrose), de leur repliement (maladies neurodégénératives) et par des mutations sont associées à des processus pathologiques. Nous avons construit une base de données d’interactions spécifiques de la matrice extracellulaire, MatrixDB (http://matrixdb.univ-lyon1.fr/, Chautard et al. Nucleic Acids Res 2011 39: D235-40, Launay et al. Nucleic Acids Res 2015 43: D321-7) qui appartient au consortium IMEx (International Molecular exchange consortium, Orchard et al. Nat Methods 2012 9: 345-50, http://www.imexconsortium.org/ ) dont elle suit les règles de curation. MatrixDB contient des données sur des interactions protéine-protéine et protéine-glycosaminoglycane dont au moins un des partenaires est extracellulaire et permet de construire des réseaux d’interactions extracellulaires dynamiques intégrant la cinétique et l’affinité  des interactions (Peysselon et Ricard-Blum Matrix Biol 2014 35: 73-81), des réseaux d’interactions spécifiques d’un tissu en intégrant des données transcriptomiques, d’une  molécule (Gubbiotti et al. Matrix Biol. 2016 55: 7-21) ou d’un processus pathologique (Salza et al. J Alzheimers Dis 2017 Jan 18. doi: 10.3233/JAD-160751. [Epub ahead of print]). Nous travaillons actuellement à l’intégration de données protéomiques obtenues à partir de tissus sains et tumoraux et à la standardisation des séquences et des caractéristiques des glycosaminoglycanes qui sont impliquées dans leurs interactions avec des protéines de façon à rendre MatrixDB interopérable avec les bases de données de glycobiologie. 

  • Some Elements about Exploratory Knowledge Discovery with Formal Concept Analysis

    Amedeo Napoli (Loria)
    Thursday, February 2, 2017 - 10:30
    Room Aurigny
    Talk abstract: 

    In this presentation, we discuss the process of Exploratory Knowledge Discovery using Formal Concept Analysis (FCA), a formalism for data and knowledge processing. FCA starts with a binary context and outputs a concept lattice, which can be visualized, navigated and interpreted by human agents, and which is processable by software agents. FCA can be extended with pattern structures for dealing with complex data such as Linked Data. Indeed, the growth of Linked Data has led to challenging aspects regarding quality assessment and data exploration of RDF triple collections. In this way, we discuss the completeness of Linked Data w.r.t. the existence of potential concept definitions in terms of necessary and sufficient conditions.More practically, we present a technique based on FCA and pattern structures which organizes RDF data into a concept lattice. This allows data exploration as well as the discovery of implications, which are used to automatically detect missing information and to complete RDF data.Experiments on the DBpedia knowledge base show that the approach is well founded and effective. Moreover, this provides means for bridging the data and knowledge dimensions of knowledge discovery in the Linked Data cloud.

  • Spéciation chez un groupe diversifié de papillons Amazoniens

    Marianne Elias (Museum National d'Histoire Naturelle)
    Thursday, January 26, 2017 - 10:30
    Room Aurigny
    Talk abstract: 

    Les papillons néotropicaux Ithomiini sont remarquables à de nombreux égards : ils contiennent des défenses chimiques et portent des colorations avertissant les prédateurs de leur toxicité ; ils ont pour la plupart des ailes partiellement transparentes ; ils sont très abondants et diversifiés, puisque le groupe compte 390 espèces, pour un âge de 32 millions d’années. Quel sont les raisons du succès écologique et évolutif des Ithomiini ? Nous mettons en œuvre des approches phylogénétiques, expérimentales et génomique pour tester différentes hypothèses de diversification, comme le rôle de l’histoire géologique des neotropiques et celui d’adaptations écologiques (plante-hôte, colorations des ailes, habitat). Dans cet exposé, je présenterai nos principaux résultats sur la diversification du groupe à l’échelle macroévolutive (patterns phylogénetiques de spéciation) et macroécologique (écologie des communautés), qui suggèrent un rôle prépondérant de l’orogenèse Andine, couplé à des adaptations générant de l’isolement reproductif. Je présenterai aussi nos travaux en cours à l’échelle microévolutive (expériences et génomique des populations), qui visent à examiner dans le détail le processus de spéciation.

  • in silico at Sanofi: illustrations at the research level

    Anne Olivier-Bandini - Charles Bettembourg (Sanofi)
    Thursday, January 19, 2017 - 10:30
    Room Aurigny
    Talk abstract: 

    Sanofi est un acteur majeur de l'industrie pharmaceutique, impliqué dans la recherche et le développement de médicaments pour des aires thérapeutiques majeures en santé humaine. L'utilisation, en autres, d'approches in silico a permis ces dernières années de diminuer le taux d'attrition de projets en phase clinique en lien avec un problème pharmacocinétique (absorption, distribution, métabolisme et excrétion du médicament). Un défi aujourd'hui est de mieux s'assurer de l'efficacité des produits développés sur leurs cibles thérapeutiques. En effet, une part importante des échecs en recherche clinique, notamment en phase 2, sont liés à un manque d'efficacité des produits, que l'on souhaiterait mettre en évidence de façon plus précoce en recherche pré-clinique. C'est l'objectif de la recherche translationnelle, qui s'appuie sur les connaissances obtenues au plus près du patient. En intégrant les données des différents domaines omiques obtenues dans ce cadre translationnel in vivo et in vitro, il est possible de définir, de valider et d'invalider des hypothèses concernant des mécanismes d'action et d'identifier des biomarqueurs relatifs à une cible thérapeutique et à l’action d’un produit.

    Après une brève présentation générale de Sanofi, nous présenterons l'approche in silico appliquée tout au long de la chaîne de valeur du médicament. Nous illustrerons cette approche par un exemple de collaboration public-privé dans le cadre d'une maladie rare, la maladie de Lesch-Nyhan. Puis nous décrirons l'approche translationnelle en recherche pharmaceutique. Enfin, nous présenterons un exemple d'intégration et d'interrogation de données utilisant AskOmics.

  • Biodiversity of the gut microbiome at a local scale: influence of diet, parasitism, and host genetics

    Laure Ségurel
    Thursday, December 15, 2016 - 10:30
    Room Aurigny
    Talk abstract: 

    Humans live in close proximity with multiple microbial communities living in/on them, of which the gut microbiome. This intimate relationship has been challenged many times during human evolutionary history, for example at the Neolithic revolution during the transition from a hunter-gatherer to a farming mode of subsistence, and more recently with the industrialization of human societies. It has notably been shown that there is a substantial loss of biodiversity and an important shift in gut microbiome composition in urban industrialized populations when compared to rural non-industrialized populations. However, the relative contribution of factors such as climate, diet, medicine, hygiene practices, host genetics, and parasitism to these patterns is still unclear. Here, we focus on fine-scale comparisons of African rural populations in order to (i) contrast the gut microbiomes of populations that inhabit similar environments but have different traditional diets (hunter-gatherers, farmers, fishers); (ii) evaluate the effect of parasitism on microbiome composition and structure; and (iii) identify host genetic variation that is associated with the microbiota in African populations. To this end, we profiled the gut microbiota, intestinal parasites, and host genetic variation in 64 individuals in Southwest Cameroon. We found that the presence of an intestinal protozoa, Entamoeba, is strongly correlated with microbial composition and diversity, such that an individual’s infection status can be predicted with 79% accuracy based on his/her gut microbiome composition. We also found gut communities to vary significantly with subsistence mode, with some taxa previously shown to be enriched in other hunter-gatherers groups (notably Succinivibrio sp. and Ruminobacter sp.). Our study thus highlights the substantial variability in gut microbiome composition among closely related populations and suggests an important role for eukaryotic gut inhabitants, one that has been largely overlooked in studies of the microbiome to date. 

     

  • Symbiose Non-permanent members Seminar

    Tuesday, December 13, 2016 - 09:30
    Room Aurigny
    Talk abstract: 

    Séminaire des CDD Symbiose 

    • 9h30 - Introduction
    • 9h35 - 10h 45 Session I - Séquences nucléiques
      • Antoine Limasset - Introduction à la bioinformatique des séquences, graphes et asssemblage
      • Sébastien François - Optimisation combinatoire en génomique : Cas pratique du scaffolding
      • Sébastien Letort - Assemblage de novo avec trace RDF Prov-O
      • Laurent Bouri - Introduction au séquençage de 3ème génération
      • Camille Marchet - La transcriptomique : le chaînon manquant des -omiques chez GenScale
    • 10h45 - 11h00 Pause café
    • 11h00 - 11h35 Session II-  Ecologie et populations
      • Cervin Guyomar - Introduction à la métagénomique : une histoire de symbiotes (du puceron)
      • Marie Chevallier - Vers l'Écologie des Systèmes
    • 11h35 - 12h00 Session III - Outils pour la BioInformatique
      • Chloé Riou - BioMAJ : moteur de workflow pour la gestion de données biologiques
      • Coline Thomas - Système d'information pour le projet Rapsodyn
      • Matéo Boudet - Introduction au cloud GenOuest
    • 12h00 - 12h15 Table ronde
    • 13h45 - 14h30 Suite Session III
      • Patrick Durand - GATB : tutoriel de nouvelle génération
      • Xavier Garnier - AskOmics, outil d'intégration et d'interrogation de données biologiques
      • Lucas Bourneuf  - Powergraph : graphes orientés visualisation
    • 14h30 - 15h50 Session IV - Réseaux métaboliques
      • Julie Laniau - Introduction aux réseaux métaboliques
      • Clémence Frioux - Allier programmation linéaire et combinatoire pour reconstruire les réseaux métaboliques
      • Meziane Aite - Reconstruction et analyse de réseau métabolique avec le workflow Aureme & padmet-toolbox
      • Victorien Delannée - Prédiction des métabolismes des xénobiotiques
      • Jean Coquet - Analyse des voies de signalisation du TGF-beta
      • Pierre Vignet - Modélisation de voies de signalisation liées au TGF-beta
    • 15h50 - Conclusion
    • 16h - Fin du séminaire et pot de départ de Laurent

     

  • L'utilité des codes Fibonacci

    Tomi Klein (Bar Ilan University)
    Thursday, December 8, 2016 - 10:30
    Room Aurigny
    Talk abstract: 

    The talk reviews several properties and applications of Fibonacci codes. These are fixed codeword sets, using binary representations of integers based on the Fibonacci sequence rather than on powers of 2. Applications range from robust data compression, over faster modular exponentiation to boosting the compression performance of rewriting codes for flash memory. No previous knowledge is assumed. 

Pages