Laboratoire d'InfoRmatique en Images et Systèmes d'information
UMR 5205 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université Lumière Lyon 2/Ecole Centrale de Lyon
Dans un contexte où la production de données numériques et leur usage est en plein mutation, nous nous retrouvons actuellement une augmentation des volumes de données si massives qu’elle en devient difficilement concevable. En quelques années, une même application peut démultiplier le volume de données qu’elle produit. Les applications scientifiques en sont le premier exemple, comme dans le domaine de l’astronomie (augmentation des capteurs et de leurs capacités - le projet LSST prévoit de produire 14To de données par jour). Dans notre vie courante, les environnements numériques qui nous entourent poursuivent un essor rapide (web, réseaux sociaux, e-commerce, e-administration, open data, services, bâtiments intelligents, villes numériques, internet des objets ...). Les éléments numériques se démocratisent et se généralisent. Les réseaux connectent entre eux les éléments de proximité (capteurs, plug, smart-phones, tablettes, ordinateurs personnels, objets communicants, robots ... ) et les infrastructures, souvent distantes et toujours de plus en plus puissantes (serveurs, clusters, grilles, cloud ... ). Tous ces éléments embarquent, utilisent, produisent et communiquent des données, y compris pour observer et mémoriser les usages et les comportements (traces des utilisateurs sur les services web, mesures dans les automobiles, avions ... ). Les enjeux liés à ces données couvrent tous les niveaux de la société : individuel, socio-économique, stratégique, etc. Pour répondre aux besoins, disposer de données est nécessaire, mais insuffisant. Leur exploitation passe par la possibilité de les intégrer, de les interroger dans des temps raisonnables, de les comparer, de les agréger, de les analyser pour en extraire des informations et de la connaissance, par exemple pour en diagnostiquer la qualité.
Nos objectifs scientifiques portent sur la gestion de grands volumes de données, mais aussi sur les données hétérogènes liées à des éléments non conventionnels (flux, services et actionneurs). Tout en facilitant l’accès, l’interrogation, l’analyse et l’exploration des données, les solutions doivent garantir de bonnes propriétés des points de vue qualité des données et des réponses, sécurité et respect de la vie privée. En effet, s’il est intéressant de disposer de nouveaux services liés à l’exploitation des données, il est indispensable que la centralisation et la monopolisation des données ne constituent pas la seule solution qui s’impose. Au contraire, il est important d’améliorer la maîtrise des données (pour les individus, les entreprises, les administrations, etc.) ainsi que celles de leur accès, de leur diffusion et des usages qui en sont faits.
L’équipe structure ses activités autour des trois thèmes suivants :
A noter que la thématique applicative des bâtiments intelligents a mobilisé de nombreux permanents de l’équipe de façon transversale aux trois thèmes.