Les missions du poste

Établissement : Université Paris-Saclay GS Sciences de l'ingénierie et des systèmes École doctorale : Sciences et Technologies de l'Information et de la Communication Laboratoire de recherche : Laboratoire des Signaux et Systèmes Direction de la thèse : Antoine BERTHET ORCID 0000000205246814 Début de la thèse : 2026-10-01 Date limite de candidature : 2026-04-30T23:59:59 Cette thèse propose une nouvelle approche du problème des communications en plaçant les grands modèles de langage (LLMs) au coeur d'une nouvelle architecture de communication sémantique. Au lieu de transmettre des données sous forme de symboles bruts ou compressés, l'objectif est de communiquer des représentations latentes qui capturent le sens profond de l'information. En exploitant les capacités de raisonnement et la compréhension contextuelle des LLMs, ce travail vise à concevoir des systèmes de communication qui optimisent directement la performance orientée vers la tâche plutôt que la précision au niveau symbolique/syntactique. The foundation of modern digital communication rests on Shannon's separation theorem, which mandates the reliable, bit-for-bit transmission of symbols irrespective of their underlying meaning. While robust, this symbol-agnostic paradigm is fundamentally mismatched with the requirements of emerging data-intensive applications, such as augmented and virtual reality (AR/VR), autonomous systems, and the tactile internet. These applications are ultimately concerned with the successful execution of a goal (e.g., accurate scene understanding, a correct robotic command), not the perfect reception of a bit sequence. The classical approach, blind to semantic content and context, generates massive, and often unnecessary, data loads, pushing wireless networks toward a capacity and efficiency crisis.

Semantic communication (SemCom) has emerged as a transformative alternative, proposing a shift from the 'bit-pipe' model to a goal-oriented one. The objective is no longer the faithful reproduction of symbols but the successful delivery of meaning. Recent breakthroughs in artificial intelligence, specifically the rise of Large Language Models (LLMs) and other foundation models, provide the critical catalyst to realize this vision. These models are not merely tools for text generation; they are repositories of compressed world knowledge and powerful reasoners, capable of understanding, distilling, and reconstructing complex concepts. This thesis proposes a foundational shift in communication engineering by integrating LLMs as the core computational engine for a new semantic architecture. We posit that by leveraging the contextual understanding and generative capabilities of LLMs, we can move beyond transmitting a compressed version of data to communicating a latent representation of its essential meaning.
A key innovation of this work is the development of a novel joint source-channel coding (JSCC) training objective. In the first part of the thesis, we will design a single, end-to-end trainable neural encoder optimized not only for semantic density but also for inherent robustness to error-prone wireless channels. The loss function will be a hybrid metric that combines semantic similarity (e.g., via model embeddings), task success rate, and resilience to channel effects such as fading and noise. The second part of the thesis will extend the point-to-point LLM-SemCom model to a more realistic multi-user network setting. We will investigate collaborative encoding schemes that enable collective efficiency, where semantic representations are optimized with awareness of the global network state.

Le profil recherché

Tout candidat au doctorat devra posséder :
- un diplôme de master orienté recherche en mathématiques appliquées/statistiques, génie électrique, traitement du signal, ou équivalent, avec d'excellents résultats académiques, et éventuellement une ou deux publications dans des actes de conférences et/ou des revues internationales ;
- une solide formation en mathématiques et statistiques, ainsi qu'une connaissance approfondie d'au moins l'un des domaines suivants : théorie de l'information, théorie des communications, traitement du signal pour les communications, intelligence artificielle, apprentissage automatique, apprentissage statistique ;
- une capacité avérée à travailler de manière autonome et assidue ;
- de solides compétences en programmation dans l'un des langages suivants : MATLAB, C/C++ ou Python ;
- d'excellentes compétences en communication (français ou anglais), à l'oral comme à l'écrit ;
- une forte motivation pour la recherche et un goût pour les sujets analytiques et théoriques.

Postuler sur le site du recruteur

Ces offres pourraient aussi vous correspondre.

L’emploi par métier dans le domaine Mode à Paris