Vous allez découvrir le portail Mobyle développé par l'Institut Pasteur de Paris. Il permet de lancer de nombreux programmes de bio-informatique et de mémoriser les résultats obtenus sur leur serveur.
Mobyle peut être utilisé sans s'identifier, mais la création d'un compte offre plusieurs avantages tels que la mémorisation de données et de résultats de programmes. N'importe qui peut créer un compte en fournissant un e-mail et un mot-de-passe.
Créer un compte Mobyle en suivant les instructions données sur le site web. Retenez bien votre mot-de-passe, nous utiliserons Mobyle lors de prochaines séances.
De nombreux programmes peuvent être utilisés via l'interface de Mobyle. Pour trouver un programme, vous pouvez soit faire une recherche par mot-clé, soit explorer les catégories proposées.
Affichez le formulaire d'utilisation du programme
golden qui permet d'interroger les banques de séquences
par numéro d'accession.
A l'aide de ce formulaire, recherchez l'entrée EMBL de la
séquence nucléique portant le numéro d'accession Y10810.
Le schéma suivant décrit les principaux éléments d'une page de résultats. Nous allons les tester pour prendre en main cette interface et pour manipuler différents modes de sauvegarde des données.
Sauvegardez l'entrée dans un fichier à l'aide du lien
"Save". Quel est le nom de ce fichier ?
Recherchez ce
fichier dans les répertoires de l'ordinateur et essayez de
l'ouvrir en cliquant dessus. Que se passe-t'il ?
En fait, les résultats sont sous la forme de texte brut,
mais le nom de fichier par défaut ne possède pas l'extension
".txt". Pour visualiser son contenu, il est possible que vous
ayez besoin d'ouvrir l'éditeur de texte Bloc-notes puis
d'utiliser le menu "Fichier->Ouvrir" de ce logiciel ou de
changer l'extension du fichier.
Malgré tout, il est possible que l'affichage ne passe pas
bien. Ceci est du au fait que les sauts de ligne ne sont pas
identiques d'un système d'exploitation à l'autre. C'est
pourquoi il est préférable d'utiliser le copier-coller.
Vous pouvez accéder aux résultats soit dans la zone
de texte dédiée, soit en les affichant dans une nouvelle
fenêtre (bouton "full screen view") afin de faciliter la
visualisation et les manipulations. En sélectionnant
l'ensemble des résultats, vous pouvez faire un copier-coller
texte dans le logiciel de votre choix.
Lancez les logiciels Bloc-notes (éditeur de textes) et
une éditeur de documents tel que WordPad (éditeur de documents plus simple que Word) ou Word, puis
copiez l'entrée dans Bloc-notes et l'autre logiciel, et enfin
enregistrez l'entrée dans les deux logiciels. Vous avez
créé un fichier texte à l'aide de Bloc-notes et un document
à l'aide du second logiciel.
En consultant le contenu de votre
répertoire, comparez la taille (nombre de Ko) de ces deux
fichiers. Bien qu'ils contiennent le même texte, est-ce que
ces deux fichiers font la même taille ?
Lequel est le plus grand ?
Lorqu'un compte utilisateur est ouvert sur Mobyle, un espace personnel est créé. Il permet de mémoriser, sur le serveur de Mobyle, les résultats que vous souhaitez consulter pendant plusieurs semaines. C'est très pratique si vous travaillez sur différents ordinateurs, par exemple en cours, au labo ou chez vous. Il suffit de vous connecter à Mobyle pour accéder à vos données, quelque soit l'ordinateur que vous utilisez. Cela se fait à l'aide du bouton "bookmark". Il est préférable d'avoir donné un nom explicte aux résultats ("result name") avant de les mémoriser.
Mémorisez l'entrée dans votre espace personnel sous le nom "Y10810". Elle va maintenant apparaitre dans la liste "Data Bookmarks" qui se trouve dans le bandeau de gauche, ainsi que sous l'onglet "Data bookmarks". Cet onglet permet de supprimer des données dont vous n'avez plus besoin. C'est tout pour l'instant, les bookmarks seront manipulés un peu plus tard.
Pour l'instant, nous avons utilisé un formulaire simple
(golden), qui ne demande pas de séquence. Nous allons
maintenant tester les différentes manières de fournir une
séquence ou une entrée de banque à un programme.
Pour faire ce test, nous allons utiliser le programme
"extractfeat" qui est capable de découper une séquence
à partir de critères sur les "features" (annotations de
banques). Le cadre "Sequence option" propose une liste
de modalités pour saisir la séquence, nous allons toutes les
tester.
Recherchez "extractfeat" parmi les programmes afin d'ouvrir son formulaire. Vous êtes alors dans l'onglet "Programs".
En cliquant sur l'onglet "Jobs", vous affichez de nouveau les résultats de "golden" et ainsi vous pouvez copier toute l'entrée Y10801 (obtenue précédemment). Ensuite, si vous cliquez sur l'onglet "Programs", vous accédez de nouveau au formulaire de "extractfeat". Vous pouvez alors coller l'entrée dans la zone de saisie appropriée.
Lancez les calculs avec les paramètres par défaut. Qu'obtenez-vous ? Que pouvez-vous en déduire sur le fonctionnement de "extractfeat" ?
En cliquant sur le bouton "go back to program" qui se trouve vers le haut de la page de résultats, vous retournez au formulaire de saisie, pré-rempli avec les paramètres précédant. Pour les besoins de l'exercice, nous allons saisir de nouveau la séquence, en important un fichier.
Importez le fichier enregistré à l'aide de WordPad.
Est-ce que cela fonctionne ? D'après-vous, pourquoi ?
Importez maintenant le fichier enregistré à l'aide du
Bloc-notes. Est-ce que cela fonctionne ?
Le cadre "Additional section" permet d'extraire des fragments
de la séquence d'après certains critères d'annotation
("features"). Saissez "CDS" (Coding Sequence) dans "Type of
feature to extract". Quelle est la différence avec les
résultats obtenus précdemment ?
En cliquant sur le bouton "go back to program" qui se trouve vers le haut de la page de résultats, vous retournez au formulaire de saisie, pré-rempli avec les paramètres précédant. Pour les besoins de l'exercice, nous allons saisir de nouveau la séquence, via "Result". Lorsque vous choisissez sur ce mode, un nouveau menu déroulant aparaît. Il contient la liste des données que vous avez mémorisées dans les "bookmarks" et qui peuvent être utilisées par le programme ouvert.
Choisissez notre entrée préférée. Nous allons maintenant extraire uniquement la CDS du gène CPRF4b en saisissant "gene" dans "Tag of feature to extract" et "CPRF4b" dans "Value of feature tags to extract". En regardant l'explication donnée via les "?", vous comprendrez le sens de cette requête (il faut aussi connaître le cours sur les banques de données).
Relancez un formulaire vierge pour "extractfeat" et choisissez cette fois-ci "DB". Cela fait aparaître un menu déroulant accompagné d'une zone de saisie. Le menu permet de choisir la banque de données qui va être interrogée et la zone de saisie va recevoir le numéro d'accession de l'entrée à utiliser.
Demandez au programme de rechercher, de nouveau, l'entrée Y10810 dans la banque EMBL. Saisissez "2" dans l'option "Amount of sequence before feature to extract", "-2" dans l'option "Amount of sequence after feature to extract" et "CDS" dans l'option "Type of feature to extract". Qu'obtenez-vous ?
Un des intérêts de Mobyle est de pouvoir utiliser les résultats d'un programme pour lancer directement le programme suivant. Nous allons tester cette possibilité. Pour ce faire, allez dans l'onglet "Jobs" et retrouvez le calcul que vous avez fait en demandant l'extraction des CDS de Y10810. La liste des programmes qui peuvent être lancés sur les séquences se situe juste en-dessous de l'affichage des résultats (voir le schéma).
Choisissez le programme "transeq" qui traduit les séquences nucléiques et validez à l'aide du bouton "further analysis". Puis lancez ce programme avec les paramètres par défaut.