Découverte de Mobyle

Vous allez découvrir le portail Mobyle développé par l'Institut Pasteur de Paris. Il permet de lancer de nombreux programmes de bio-informatique et de mémoriser les résultats obtenus sur leur serveur.

Création d'un compte Mobyle

Mobyle peut être utilisé sans s'identifier, mais la création d'un compte offre plusieurs avantages tels que la mémorisation de données et de résultats de programmes. N'importe qui peut créer un compte en fournissant un e-mail et un mot-de-passe.

Créer un compte Mobyle en suivant les instructions données sur le site web. Retenez bien votre mot-de-passe, nous utiliserons Mobyle lors de prochaines séances.

Accès à un programme

De nombreux programmes peuvent être utilisés via l'interface de Mobyle. Pour trouver un programme, vous pouvez soit faire une recherche par mot-clé, soit explorer les catégories proposées.

Affichez le formulaire d'utilisation du programme golden qui permet d'interroger les banques de séquences par numéro d'accession.
A l'aide de ce formulaire, recherchez l'entrée EMBL de la séquence nucléique portant le numéro d'accession Y10810.

Sauvegarde des résultats

Le schéma suivant décrit les principaux éléments d'une page de résultats. Nous allons les tester pour prendre en main cette interface et pour manipuler différents modes de sauvegarde des données.

Enregistrement dans un fichier ("Save")

Sauvegardez l'entrée dans un fichier à l'aide du lien "Save". Quel est le nom de ce fichier ?
Recherchez ce fichier dans les répertoires de l'ordinateur et essayez de l'ouvrir en cliquant dessus. Que se passe-t'il ?

En fait, les résultats sont sous la forme de texte brut, mais le nom de fichier par défaut ne possède pas l'extension ".txt". Pour visualiser son contenu, il est possible que vous ayez besoin d'ouvrir l'éditeur de texte Bloc-notes puis d'utiliser le menu "Fichier->Ouvrir" de ce logiciel ou de changer l'extension du fichier.
Malgré tout, il est possible que l'affichage ne passe pas bien. Ceci est du au fait que les sauts de ligne ne sont pas identiques d'un système d'exploitation à l'autre. C'est pourquoi il est préférable d'utiliser le copier-coller.

Copier-coller dans un fichier

Vous pouvez accéder aux résultats soit dans la zone de texte dédiée, soit en les affichant dans une nouvelle fenêtre (bouton "full screen view") afin de faciliter la visualisation et les manipulations. En sélectionnant l'ensemble des résultats, vous pouvez faire un copier-coller texte dans le logiciel de votre choix.
Lancez les logiciels Bloc-notes (éditeur de textes) et une éditeur de documents tel que WordPad (éditeur de documents plus simple que Word) ou Word, puis copiez l'entrée dans Bloc-notes et l'autre logiciel, et enfin enregistrez l'entrée dans les deux logiciels. Vous avez créé un fichier texte à l'aide de Bloc-notes et un document à l'aide du second logiciel.

En consultant le contenu de votre répertoire, comparez la taille (nombre de Ko) de ces deux fichiers. Bien qu'ils contiennent le même texte, est-ce que ces deux fichiers font la même taille ?
Lequel est le plus grand ?

Mémorisation dans son espace personnel

Lorqu'un compte utilisateur est ouvert sur Mobyle, un espace personnel est créé. Il permet de mémoriser, sur le serveur de Mobyle, les résultats que vous souhaitez consulter pendant plusieurs semaines. C'est très pratique si vous travaillez sur différents ordinateurs, par exemple en cours, au labo ou chez vous. Il suffit de vous connecter à Mobyle pour accéder à vos données, quelque soit l'ordinateur que vous utilisez. Cela se fait à l'aide du bouton "bookmark". Il est préférable d'avoir donné un nom explicte aux résultats ("result name") avant de les mémoriser.

Mémorisez l'entrée dans votre espace personnel sous le nom "Y10810". Elle va maintenant apparaitre dans la liste "Data Bookmarks" qui se trouve dans le bandeau de gauche, ainsi que sous l'onglet "Data bookmarks". Cet onglet permet de supprimer des données dont vous n'avez plus besoin. C'est tout pour l'instant, les bookmarks seront manipulés un peu plus tard.

Lancement d'un programme

Pour l'instant, nous avons utilisé un formulaire simple (golden), qui ne demande pas de séquence. Nous allons maintenant tester les différentes manières de fournir une séquence ou une entrée de banque à un programme.
Pour faire ce test, nous allons utiliser le programme "extractfeat" qui est capable de découper une séquence à partir de critères sur les "features" (annotations de banques). Le cadre "Sequence option" propose une liste de modalités pour saisir la séquence, nous allons toutes les tester.

Recherchez "extractfeat" parmi les programmes afin d'ouvrir son formulaire. Vous êtes alors dans l'onglet "Programs".

"Paste" : copier-coller

En cliquant sur l'onglet "Jobs", vous affichez de nouveau les résultats de "golden" et ainsi vous pouvez copier toute l'entrée Y10801 (obtenue précédemment). Ensuite, si vous cliquez sur l'onglet "Programs", vous accédez de nouveau au formulaire de "extractfeat". Vous pouvez alors coller l'entrée dans la zone de saisie appropriée.

Lancez les calculs avec les paramètres par défaut. Qu'obtenez-vous ? Que pouvez-vous en déduire sur le fonctionnement de "extractfeat" ?

"File" : importation d'un ficher texte

En cliquant sur le bouton "go back to program" qui se trouve vers le haut de la page de résultats, vous retournez au formulaire de saisie, pré-rempli avec les paramètres précédant. Pour les besoins de l'exercice, nous allons saisir de nouveau la séquence, en important un fichier.

Importez le fichier enregistré à l'aide de WordPad. Est-ce que cela fonctionne ? D'après-vous, pourquoi ?
Importez maintenant le fichier enregistré à l'aide du Bloc-notes. Est-ce que cela fonctionne ?
Le cadre "Additional section" permet d'extraire des fragments de la séquence d'après certains critères d'annotation ("features"). Saissez "CDS" (Coding Sequence) dans "Type of feature to extract". Quelle est la différence avec les résultats obtenus précdemment ?

"Result" : utilisation d'une donnée mémorisée dans l'espace personnel

En cliquant sur le bouton "go back to program" qui se trouve vers le haut de la page de résultats, vous retournez au formulaire de saisie, pré-rempli avec les paramètres précédant. Pour les besoins de l'exercice, nous allons saisir de nouveau la séquence, via "Result". Lorsque vous choisissez sur ce mode, un nouveau menu déroulant aparaît. Il contient la liste des données que vous avez mémorisées dans les "bookmarks" et qui peuvent être utilisées par le programme ouvert.

Choisissez notre entrée préférée. Nous allons maintenant extraire uniquement la CDS du gène CPRF4b en saisissant "gene" dans "Tag of feature to extract" et "CPRF4b" dans "Value of feature tags to extract". En regardant l'explication donnée via les "?", vous comprendrez le sens de cette requête (il faut aussi connaître le cours sur les banques de données).

"DB" : saisie d'un numéro d'accession

Relancez un formulaire vierge pour "extractfeat" et choisissez cette fois-ci "DB". Cela fait aparaître un menu déroulant accompagné d'une zone de saisie. Le menu permet de choisir la banque de données qui va être interrogée et la zone de saisie va recevoir le numéro d'accession de l'entrée à utiliser.

Demandez au programme de rechercher, de nouveau, l'entrée Y10810 dans la banque EMBL. Saisissez "2" dans l'option "Amount of sequence before feature to extract", "-2" dans l'option "Amount of sequence after feature to extract" et "CDS" dans l'option "Type of feature to extract". Qu'obtenez-vous ?

Enchaînement de deux programmes

Un des intérêts de Mobyle est de pouvoir utiliser les résultats d'un programme pour lancer directement le programme suivant. Nous allons tester cette possibilité. Pour ce faire, allez dans l'onglet "Jobs" et retrouvez le calcul que vous avez fait en demandant l'extraction des CDS de Y10810. La liste des programmes qui peuvent être lancés sur les séquences se situe juste en-dessous de l'affichage des résultats (voir le schéma).

Choisissez le programme "transeq" qui traduit les séquences nucléiques et validez à l'aide du bouton "further analysis". Puis lancez ce programme avec les paramètres par défaut.

Page réalisée par Maude Pupin, mise à jour en septembre 2008