Nos travaux

En lien avec l’Ecole Normale Supérieure et l’Ecole d’Intelligence Collective de l’Université Mohammed VI Polytechnique, nous hébergeons une activité de recherche de pointe sur les sujets de sciences cognitives, sciences comportementales et d’intelligence collective pour sans cesse développer notre expertise dans les méthodes de transformations éprouvées scientifiquement.

Nos chercheurs

Cette thèse explore la relation entre les processus de production du langage et les comportements de frappe au clavier de locuteurs natifs de l’anglais. Bien que la production au clavier soit de plus en plus répandue, l’utilisation de données de frappe reste sous-étudiée dans le domaine de la linguistique.

L'objectif principal de cette thèse est de comprendre comment les différentes propriétés linguistiques d’un texte influencent les processus de production nécessaires à sa frappe au clavier, et comment ceux-ci se traduisent par des comportements observables lors de l’analyse des keystroke logs. Tout au long de cette thèse, une série de tests et d'analyses vise à démontrer que les propriétés linguistiques d’un texte ont un impact significatif sur la façon dont il est frappé. Le modèle de production au clavier conceptualisé et testé pourra servir de référence pour comprendre la planification linguistique et son influence sur le comportement de frappe.

Notamment, cette thèse étudie la manière dont les pauses et les schémas de disfluences s'articulent autour de la production de textes. Elle approfondit ensuite l'analyse des unités de texte qui sont produites avec plus de fluidité et vise à estimer l'étendue de la planification et la quantité de langage traitée en une seule fois par le scripteur. Enfin, ce projet explore les différentes stratégies de correction et de modification des textes utilisée par les scripteurs et facilitée par les outils disponibles lors de l’écriture au clavier.

University de Buffalo (USA)

Dans les condensats de Bose-Einstein spinoriels (CBES), plusieurs états de spin coexistent, donnant lieu à des dynamiques pilotées par des interactions dépendantes du spin (interactions de contact (IC) et dipôle-dipôle (IDD)). En lien étroit avec les travaux expérimentaux de notre groupe, ce manuscrit présente une analyse théorique du comportement dynamique des CBES. On s’intéresse à la situation où les CBES se trouvent dans l’état fondamental ferromagnétique à magnétisation maximale, et qui sont portés hors de l’état d’équilibre.

Si le rôle de la discrimination statistique dans l'inégalité de traitement subie par les populations victimes de discriminations est désormais bien connu, des travaux récents montrent que ses conséquences sont démultipliées par des biais cognitifs provoquant une distorsion de l'information sur les qualifications. La thèse s'appuie donc sur les travaux sur les stéréotypes afin d'examiner les freins à leur remise en cause, notamment dans le processus de recrutement.

Centre d’Economie de la Sorbonne (Université Paris 1 Panthéon-Sorbonne) et Paris School of Economics
Plates-formes et mises à jour dynamiques configurables
Dr. Sebastien MartinezFullstack EngineerEn savoir plus

La mise à jour dynamique des logiciels permet de modifier ces derniers sans interrompre les services qu'ils fournissent. C'est un enjeu important à une époque où les logiciels sont omniprésents et où leur indisponibilité peut être coûteuse (service commercial) ou même dangereuse (système de sécurité). De nombreux mécanismes aux propriétés et besoins variés permettent d'atteindre cet objectif. Ces mécanismes sont employés par des plates-formes dédiées à des types de logiciel et/ou de mises à jour spécifiques. En se spécialisant, ces plates-formes facilitent l'écriture de mises à jour dynamiques mais peuvent être mal adaptées à l'application de certaines modifications imprévues. Il convient alors de sélectionner et combiner les mécanismes les mieux adaptés à chaque mise à jour afin d'assurer une meilleure compatibilité des plates-formes avec les différents logiciels et mises à jour. C'est autour de cet objectif que s'organisent les contributions de ce manuscrit: - Étudier les plates-formes et identifier des modèles génériques de plate-forme et de mise à jour - Étudier les besoins et les propriétés des mécanismes de mise à jour ainsi que leurs capacités à être combinés. - Développer des plates-formes configurables permettant de sélectionner les mécanismes les mieux adaptés pour chaque mise à jour. Les résultats obtenus ouvrent des pistes vers une nouvelle génération de plates-formes ainsi que vers de nouvelles utilisations de la mise à jour dynamique. Le troisième axe a mené au développement de Pymoult, plate-forme configurable pour programmes Python. Cette plate-forme fournit de nombreux mécanismes au travers d'une API de haut niveau adaptée à la conception de mises à jour dynamiques.

Analyse et de traitement de données
Dr. Sid TalhaData ScientistEn savoir plus

Pour lutter contre la perte d’autonomie liée au vieillissement dû à des altérations physiques et/ou psychiques, les nouvelles technologies, oeuvrent à retarder sa survenue, la détecter, l’évaluer et proposer des solutions modernes et innovantes. Dans ce contexte, notre projet de thèse vise à exploiter l’apport des techniques d’analyse et de traitement de données pour le suivi du comportement humain.Cette thèse cible deux parties importantes et complémentaires : la première réalise la synthèse journalière de l’ensemble des actions effectuées par la personne, afin de nous renseigner sur son degré d’autonomie. La deuxième partie propose une solution moderne basée sur l’exécution d’exercices physiques sous forme de mouvements contrôlés reconnus et corrigés.

Nos Thésards

Les hallucinations sont un phénomène où la sortie d’un modèle de langues génératif (LLM) apparait dépourvue de sens, non factuelle ou encore en contradiction avec les instructions données.

Ce phénomène représente un frein à l’adoption et au déploiement responsable des LLMs dans les applications où la fiabilité est un aspect critique. Nous pouvons citer les exemples des applications bancaires ou de la santé.

C’est pour cela que nous travaillons sur la détection, quantification et mitigation des hallucinations dans les LLMs.

LISN (Laboratoire Interdisciplinaire de Science Numérique)

Nous abordons le problème des données limitées et de mauvaise qualité pour les modèles d'IA.
Pour traiter ce problème nous utilisons les modèles de langues génératifs (LLM) pour surmonter ces obstacles.

Les données de mauvaise qualité peuvent être des données textuelles sans étiquette ou des données trop bruitées pour le problème.

Par exemple, un email client peut contenir une demande qui n'apparait pas dans les problèmes déjà identifiés ou une demande trop vague. Pour résoudre cela, nous utilisons les LLM génératifs pour interpréter le contexte et identifier l'étiquette manquante, en créant des prompts de haute qualité.

Une autre piste envisagée est la génération de texte de hautes qualités et entraîner des modèles de classification sur ces données dans le but de compenser les problèmes d'étiquetage.

Nous utilisons des données de benchmarks internationaux et évaluerons les modèles de langue en mode zero-shot.

Ces travaux nous permettront de développer des stratégies d'amorçage efficaces pour des données souvent rencontrées dans l'industrie, qui sont limitées ou de mauvaise qualité.

LISN (Laboratoire Interdisciplinaire de Science Numérique)