Vous êtes ici : FIL > Portail > Master Informatique > M2 MOCAD > TLDE

Technologies et Logiciels pour les Données Emergentes (TLDE)

Responsable

Bilel Derbel

Volume horaire

3 heures par semaine pendant 6 semaines

Crédits

3 ECTS

Objectifs

Au terme de ce module, et dans le cadre des données NoSQL, les étudiants doivent:
  • Acquérir une vue d'ensemble sur ces nouveaux types de données et leurs différentes déclinaisons.
  • Manipuler les fonctionnalités de quelques farmework logiciel courant pour ce type de données, e.g., Hadoop, Cassandra, Neo4J.
  • Acquérir une culture des framework et technologies innovantes développés dans ce cadre.
  • Comprendre, maitriser les fondements et les enjeux des solutions sous-jacent au développement d'outils pour le stockage, la disponibilité, le traitement de ces données.
  • Identifier, exploiter et mettre en oeuvre des solutions logicielles existantes par rapport à un contexte d'application précis.

Contenu

Ce module met l'accent sur les avancées technologiques dans l'univers de l'organisation, du stockage, et de l'analyse des nouveaux types de données. Sur le web 'social' et 'mobile', dans internet, dans les clouds et plus généralement dans les systèmes à très large échelle, des données de nature hétérogène se basant sur d'autres modèles que le "relationnel" et offrant un haut de degré de flexibilité émergent et s'imposent. En particulier, le concept NoSQL est mis sur le devant de la scène ainsi que les frameworks, tel que Hadoop, permettant une montée en charge et une haute disponibilité. Dans ce contexte, le but de ce module est de présenter et de manipuler quelques technologies qui existent aujourd'hui sur le marché des logiciels informatique et d'illustrer leur utilisation à travers des applications abordés de façon transverse. Plus précisément, les points suivants seront présentés et adaptés en fonction de l'évolution des technologies disponibles :
  • Données dans les réseaux sociaux et graphes. Algorithme et framework de manipulation et de stockage. Illustration à travers Neo4j et interface avec les api du web (e.g. twitter).
  • Données et partage d'information. Tables de hachage distribués. Illustration avec Cassandra/Dynamo.
  • Données large échelle et montée en charge. Illustration avec Hadoop et manipulation de quelques composants phare (e.g., HDFS, Mahout, Pig, MapReduce). Application à la classification et à la recommandation.