Thèse Cartographie de l'Architecture Fonctionnelle à Méso-Échelle dans le Cortex Visuel Supérieur à l'Aide de l'Imagerie Cérébrale 11.7 t et de l'Apprentissage Profond H/F - Doctorat.Gouv.Fr
- CDD
- Doctorat.Gouv.Fr
Les missions du poste
Établissement : Université Paris-Saclay GS Life Sciences and Health École doctorale : Signalisations et Réseaux Intégratifs en Biologie Laboratoire de recherche : Neuroimagerie Cognitive Direction de la thèse : Qi ZHU ORCID 0000000209933400 Début de la thèse : 2026-10-01 Date limite de candidature : 2026-05-05T23:59:59 Si la présence d'organisation colonnaire dans les aires visuelles primaires a été bien caractérisée, la présence de structures méso-échelle dans les régions corticales supérieures comme le cortex inferotemporal (IT) reste largement inexplorée. Les recherches actuelles sur l'organisation de cette région se situent à deux extrêmes: les modèles computationnels (Bao et al., Nature 2020; Margalit et al., Neuron 2024) suggèrent des cartes topographiques continues, tandis que les études empiriques se limitent à des patches catégoriels grossiers ou à des enregistrements de cellules individuelles avec une couverture spatiale insuffisante. S'appuyant sur nos récentes découvertes (Zhu et al., Nat Commun 2025), nous proposons une approche novatrice utilisant le scanner ultra-haut champ (11,7 T) de NeuroSpin, qui offre une sensibilité nettement améliorée par rapport aux systèmes standard d'IRM à 3 T. Le but est d'acquérir des données d'IRMf haute résolution à partir d'un grand nombre d'images diverses, et suffisamment de répétitions pour une analyse fiable en un seul essai. Cette approche sans précédent permet le premier décodage méso-échelle par essai unique des cartes théoriques de l'espace de représentation. Aussi, en alignant nos données d'IRMf avec les récents jeux de données d'électrophysiologie TVSD et Triple-N à l'aide d'un même modèle d'apprentissage profond, nous transformons des enregistrements de cellules individuelles éparses en une carte unifiée de l'espace de représentation pour le décodage des propriétés MFU. Cela permet des comparaisons entres espèces sans précédent du codage IT entre macaques et humains. Cette approche intégrée résout les disparités persistantes entre les approches computationnelles et empiriques de l'organisation de l'IT, offrant un cadre unifié pour comprendre la représentation neuronale des objets à travers les espèces et établissant un plan pour les futures investigations des hiérarchies corticales en sciences de la vision. For decades, visual neuroscience has been characterized by a fundamental disconnection between two complementary approaches: large-scale population imaging techniques like fMRI and fine-grained electrophysiological recordings. As a consequence, understanding mesoscale/columnar brain organization, the intermediate level between neurons and cortical areas, remains a key challenge in neuroscience (Kaas, 2012, PNAS; Roe, 2019, Netw. neurosci.). This gap is especially acute in high-level visual regions like inferotemporal (IT) cortex which are difficult to access due to thick tissue that prevents optical imaging, while existing tools lack both spatial resolution and broad coverage. Current research thus operates at extremes: computational models suggest continuous topographic maps (Bao et al., 2020, Nature; Margalit et al., 2024, Neuron), but empirical work is limited to either coarse fMRI patches (Grill-Spector & Weiner, 2014, Nat. Rev. Neurosci.) or single-unit recordings lacking cortical surface precision (Harris et al., 2016, Nat. Neurosci.).
Our recent work demonstrated that category-selective regions in primate IT cortex are organized into mesoscale functional units (MFUs)(Zhu et al., 2025), columnar-like structures resembling early visual areas. However, we were unable to decode what specific information each MFU encodes. This limitation was due to two critical constraints: 1) the block design used in our fMRI study with only 200 stimuli is insufficient to resolve the diversity of responses across MFUs; and 2) electrophysiological recordings, while offering high temporal resolution and single-neuron specificity, are limited by the extreme difficulty of precisely reconstructing recording sites across multiple sessions. Together, these limitations have prevented neuroscientists from answering a fundamental question: what are the specific visual features encoded by these IT MFUs?
This gap is particularly problematic because MFUs represent the fundamental computational units of visual processing (Mathis, 2023). Understanding their coding properties is essential for building accurate models of object recognition, developing neuroprosthetic interfaces, and deciphering how the brain transforms raw pixels into meaningful perceptual representations (Fujita et al., 1992; Livingstone & Hubel, 1988, 1983; Roe, 2019; Roe et al., 2020).
The key problem is that no existing fMRI study has successfully reconstructed single-trial responses in IT cortex at sufficient resolution to decode mesoscale coding. High-resolution fMRI studies typically use very limited stimulus sets (often 50-100 stimuli) presented in block designs, which average neural responses across time and cannot isolate single-trial activity. Meanwhile, electrophysiological studies use large stimulus sets (i.e., 1k to 25k+ images)(Li et al., 2025; Papale et al., 2025), but lack sufficient spatial coverage and precision to map these responses across the cortical surface in a way that aligns with fMRI-defined MFUs. Crucially, no one has ever collected ultra-high-resolution fMRI data with enough repetitions to enable reliable single-trial analysis at the mesoscale level. We propose a fundamentally new approach bridges the critical gap in understanding mesoscale/columnar brain organization, the intermediate level between neurons and cortical areas. Our strategy combines ultra-high-resolution fMRI with sufficient repetitions to extract reliable single-trial responses, enabling unprecedented mapping of object space in IT cortex. This data will reveal how theoretical object space maps (Bao et al., 2020) manifest at the mesoscale level. By integrating this approach with existing electrophysiological datasets (TVSD (Papale et al., 2025) and Triple-N (Li et al., 2025)), and leveraging DNN's representation space as a common reference frame, we can decode the coding properties of MFUs. This integrated strategy eliminates the need for expensive and technically challenging new electrophysiological recordings while solving the core problem of MFU coding.
Simultaneously, we will align DNN models with brain responses to develop stimulus-selection algorithms maximizing IT activation diversity. We will also evaluate topographic organization in recently developed brain-inspired DNN models (Blauch et al., 2022, PNAS; Margalit et al., 2024, Neuron), including their mesoscale structure, to reveal how biological and artificial representations correspond, and study mechanisms that give rise to fine-grained spatial organization.
Le profil recherché
Le candidat au doctorat doit posséder un mélange unique de profils et de compétences, comme suit:
Premièrement, une solide formation en physique et en neurosciences, en modélisation informatique ou en apprentissage automatique.
Deuxièmement, le candidat au doctorat doit bien connaître la conception expérimentale et les techniques d'acquisition de données à l'aide de systèmes d'imagerie par résonance magnétique (IRM).
En outre, des compétences exceptionnelles en programmation dans des langages tels que Python ou MATLAB sont essentielles pour le traitement, l'analyse et la visualisation des données. De solides capacités de communication écrite et orale permettront au candidat de présenter efficacement ses résultats lors de conférences et de publier des articles de recherche de grande qualité dans des revues de premier plan évaluées par des pairs. Le candidat idéal au doctorat doit également faire preuve d'excellentes compétences en matière d'organisation et de gestion du temps afin d'assurer la réalisation des étapes du projet dans les délais impartis.