Round 1 - 2024

Contexte

Le projet MAIA (Maîtrise des apllications de l'IA) vise à développer des solutions de recherche originales et génériques pour faire avancer l'explicabilité formelle et l'acceptabilité sociétable de l'IA, avec un focus sur trois domaines phares : la santé, la chimie et l'environnement de l'alliance A2U (Université d'Artois, UPJV et ULCO) ainsi que pour la région Hauts de France (HdF) Le finacement d'initiatives de recherche innovantes fera parti des appels récurrents du projet MAIA.

Cadre

Cet appel sera ouvert de façon récurrentes (annuels) aux chercheurs et enseignants-chercheurs de l'alliance A2U travaillant dans l'un des cinq axes du projet MAIA : IA explicable (XAI), IA acceptable (question SHS), application de l'IA en santé, chimie et environnement. Il est résolument ouvert à toute action de recherche et/ou valorisation de courte durée permettant d'initier, développer, soutenir une approche innovante :

Développement, diffusion ou valorisation commerciale d'un prototype/logiciel innovant
Investissement pour mise au point de démonstrateur(s)
Soutien à la production/publication/communication de visibilité internationale exeptionnelle
Accompagnement d'une activité originale de type expérimental ou de collecte de données
Soutien à toute autre action originale valorisant le projet MAIA

Sélection 2024

Soutien à la production des données expérimentales. SyntIA-Exp

Directeur :

Florence Djedaini-Pilard

Laboratoire(s) d'accueil :

LG2A (UPJV)
UCCS (UArtois)
UR 7378 (UPJV)
CRIL (UArtois)

Résumé

Ce projet vient en soutien au projet de thèse SYNTIA pour la production de données expérimentales en chimie au cours des 12 premiers mois du projet . Le LG2A de l'UPJV et l’UCCS de l’UArtois voient dans le développement de l'IA, en collaboration étroite avec le CRIL, une opportunité pour améliorer le criblage des molécules biosourcées d’intérêt, optimiser leur voie de synthèse et prédire leurs propriétés. Cette approche doit permettre de passer d’un criblage purement chimique vers un criblage informatique, basée sur l’analyse d’un maximum de données expérimentales afin d’optimiser le design de nouvelles molécules (les cyclodextrines (CDs) modifiées), les paramètres des procédés de synthèses ou de prévoir la régiosélectivité des synthèses. Il nécessite la création de jeux de données expérimentales en synthèse et en caractérisation pour valider les prédictions. Dans un premier temps, nous caractériserons de manière approfondie les CDs méthylées et hydroxypropylées commerciales dans l’optique de construire une base de données d’apprentissage d’un prédicteur de distribution de probabilité de structures de molécules. Dans un deuxième temps, nous mettrons en œuvre différentes synthèses de CDs méthylées en faisant varier les conditions opératoires (nature et concentration des réactifs, température, agitation, temps de réaction...) afin d’obtenir différents lots avec des DS variés afin de valider le prédicteur et d’alimenter la base de données. Toutes les données de synthèses obtenues seront compilées, traitées et transformées dans un format « computer friendly » afin d’être intégrées dans une database relative à la prédiction de structures de CDs modifiées.

(T)chat - Botté

Directeur :

Yaël Fregier

Laboratoire(s) d'accueil :

LML (UArtois)

Résumé

L’objectif de cette demande de financement est de permettre deux stages de 4 mois pour étudier la possibilité d’utiliser des nouveaux modèles LLVM (Large Language and Vision Models) open source pour contrôler des agents (robots). La motivation est d’accéder à la facilité d’interactions homme/machine qu’offrent les LLM de type ChatGPT ou LLama et de l’utiliser pour communiquer avec des robots. En effet, les progrès récents en traitement du langage naturel ont permis de créer des interfaces avec des agents conversationnels en mesure de passer le test de Turing, i.e. sont indiscernables d’un agent humain. L’intégration de tels models avec des modalités visuelles (description visuelle, génération d’image à partir de texte) a donné naissance aux modèles LLVM. Depuis un an, des grosses équipes de recherche (Google, Meta...) commencent à utiliser ces modèles en robotique. Malheureusement, ces travaux utilisent des modèles privatifs ce qui empêche la reproductibilité des ces expériences et leur application à des problèmes concrets de recherche ou dans l’industrie. Notre objectif est donc de réaliser une version open source.

Expliquer les dépendances entre labels dans la classification multi-label

Directeur :

Saïd Jabbour

Laboratoire(s) d'accueil :

CRIL (UArtois)

Résumé

Ce projet s’inscrit dans ma volonté de s’investir de plus en plus dans la thématique de l’apprentissage et de l’IA explicable. La thèse de David Ing que je co-dirige au sein du CRIL est une première étape dans cette voie, dont une première publication dans la conférence DSAA (rang A), portant sur la classification avec explication pour les réseaux de traite des êtres humains, constitue une première étape. Ma demande de financement me permettra de se concentrer sur cette thématique. Il s’agit d’étudier les corrélations et la dépendance entre labels dans le cadre de l’apprentissage multi-label extrême dans le but d’exploiter et d’expliquer ces dépendances. Les méthodes d'apprentissage traditionnelles se limitent généralement à des contraintes simples telles que must-link et cannot-link. L’objectif de ce travail est d'intégrer des contraintes d'inclusion ou d'exclusion plus génériques, stipulant par exemple qu’une instance ne peut être dans plus que n classes. Ces contraintes, formulées généralement sous la forme de contraintes de cardinalité, visent à guider itérativement la construction d'un espace de représentation des données afin de faciliter leur satisfaction par les algorithmes de classification. L'intégration adéquate de ces nouvelles contraintes dans le processus de classification est cruciale pour améliorer les performances globales. Ainsi, l'objectif final est d'obtenir une qualité prédictive élevée, notamment dans le contexte des problèmes de classification multi-label extrême. L’autre objectif, en l’absence de contraintes spécifiques sur les labels, est de proposer des approches capables de capturer ces corrélations et de les expliquer en fournissant, par exemple, les sous-ensembles d’attributs justifiant ces groupements de labels.

Algorithme bioinformatique pour l'identification de couple ligand : récepteur entre vésicules extracellulaires et cellules cibles à des fins thérapeutiques

Directeur :

Julien Saint-Pol

Laboratoire(s) d'accueil :

Laboratoire de la Barière Hémato-Encéphalique (UArtois)

Résumé

Les questions de thérapies ciblées sont en vogue depuis deux décennies afin d’optimiser les traitements et limiter les effets secondaires sur d’autres tissus non-affectés. Parmi les vecteurs thérapeutiques d’intérêt, les vésicules extracellulaires (VEs) présentent des intérêts non-négligeables, tant par leur nature biologique et leur très faible potentiel immunogène, que par leur côté personnalisable à façon. Ces VEs présentent des protéines à leur surface capables d’interagir spécifiquement avec des protéines exposées par une cellule receveuse et d’y délivrer leur contenu. Toutefois, les moyens d’accéder aux informations en lien avec l’interaction ligand/récepteur d’une VE avec sa cellule cible sont inexistants. Le projet PredInteract a pour objectif de palier à ce manque par l’élaboration d’un algorithme permettant de d’identifier les protéines responsables de l’interaction entre une VE et sa cellule cible par la compilation de données obtenues par spectrométrie de masse et le croisement avec des bases de données existantes pour connaître leur force d’interaction et les régions des protéines impliquées dans ces interactions. Cet algorithme permettra de connaître le/les protéines d’intérêt pour cibler un type de cellules spécifiquement pour optimiser la délivrance et l’action de composés pharmacologiques. Cette approche, novatrice et de valorisation du projet MAIA, est applicable à tous les contextes physiopathologiques et permettra, à terme, d’être un outil d’intérêt pour les approches thérapeutiques ciblées.

Data Challenge

Directeur :

Karim Tabia

Laboratoire(s) d'accueil :

CRIL - MAIA

Résumé

Un Data Challenge est une compétition en science des données visant à résoudre des problématiques spécifiques à partir de jeux de données mis à disposition avec une méthodologie d’évaluation bien définie. Il s’inscrit dans une démarche de science ouverte et participative, favorisant le partage de données et de solutions (généralement sous forme de notebooks). À travers cet événement, nous cherchons principalement à mettre en place une action d’animation et de communication pour le CRIL et le projet MAIA, tout en collectant des jeux de données réels et des solutions à partager publiquement après la fin de la compétition, dans une perspective de science ouverte et participative. L’organisation d’une telle compétition nécessitera : de trouver des fournisseurs de données et des problématiques concrètes liées à ces données, de définir une méthodologie et des outils d’évaluation pour les propositions, et d’ouvrir une plateforme en ligne pour le challenge (pour mettre à disposition les données, recueillir les propositions et maintenir un leaderboard). En ce qui concerne les données et les problématiques, nous envisageons de nous concentrer sur les domaines d’application du projet MAIA, à savoir la santé, la chimie et l’environnement. Les données et les propositions des participants seront partagées publiquement à l’issue de la compétition pour encourager la collaboration et la réutilisation.

Une exploration multifactorielle de l'acceptation de l'IA : combler le fossé culturel et individuel (MEXIQUE)

Directeur :

Srdjan Vesic (CRIL)

Laboratoire(s) d'accueil :

CRIL (UArtois)
CRP-CPO
CDEP

Résumé

L'intelligence artificielle (IA) révolutionne la manière dont nous interagissons avec la technologie et les systèmes au sein de différents secteurs. Comprendre les facteurs d'acceptation de l'IA par les êtres humains semble indispensable à une intégration et une adoption réussies de l’IA. Bien que de nombreuses études aient examiné l'acceptation de l'IA, elles s'appuient souvent sur des données autodéclarées et ne tiennent pas compte des différences inter-individuelles. Ceci génère d’importantes lacunes concernant la compréhension des facteurs dont les nuances peuvent influencer l'acceptation de l'IA. Ce projet a pour objectif de contribuer à remédier aux limites des recherches existantes en menant une enquête approfondie sur l'acceptation des technologies de l'IA, en mettant l'accent sur l'évaluation expérimentale et sur l'étude des variations culturelles et individuelles.