Un programme informatique permet d’affiner l’estimation du nombre de gènes
Des chercheurs en bio-informatique du Cold Spring harbor laboratory à New York, ont mis au point un programme informatique permettant de déceler de manière plus fine les gènes en se basant sur la reconnaissance de deux de leurs éléments caractéristiques, le promoteur et le premier exon. Il semblerait d’après les analyses effectuées que le nombre de gènes chez l’homme a été sous-estimé.
La récente mise à disposition au public de la séquence entière du génome humain a ouvert une nouvelle voie dans ce qu’il est convenu d’appeler la génomique et la post génomique.
Le programme informatique développé par l’équipe de Michael Zhang, appelé FirstEF pour ‘First Exon Finder’, décrit dans la revue Nature Genetics, est le premier, selon leurs auteurs, à pouvoir détecter de manière très sensible, une certaine catégorie de segments de gènes (les premiers exons) car ils sont souvent non codant et difficiles à repérer par les programmes habituels qui se basent sur les régions traduites en protéines du génome.
FirstEF se base en particulier sur la reconnaissance de particularités génétiques comme les îlots CpG (CpG islands), les promoteurs (promoting regions) et les sites donneurs du splicing (splice-donor sites).
Les auteurs ont ainsi pu détecter la localisation de 90% des premiers exons connus des chromosomes 21 et 22 humains. Selon les auteurs, cette sensibilité est deux fois plus grande que les autres programmes.
Les auteurs ont identifié 68000 premiers exons au total sur le génome humain. Ce résultat ne signifie pas qu’il y a 68000 gènes car un premier exon peut appartenir à plusieurs gènes. Les auteurs estiment cependant entre 50000 et 60000 le nombre de gènes chez l’homme, alors qu’il avait été estimé entre 30000 et 40000.
De plus, FirstEF permet également d’identifier les promoteurs des gènes, ce qui permet de faire apparaître ceux qui peuvent être potentiellement exprimés.
Source : Nature Genetics 2001, publication électronique avancée. DOI :10.1038/ng780.
Descripteur MESH : Informatique , Gènes , Éléments , New York , Exons , Génome , Génome humain , Génomique , Programmes , Chromosomes , Électronique , Protéines