Les missions du poste

Établissement : Université Paris-Saclay GS Informatique et sciences du numérique École doctorale : Sciences et Technologies de l'Information et de la Communication Laboratoire de recherche : Laboratoire en Informatique Haute Performance pour le Calcul et la simulation Direction de la thèse : Marc PERACHE ORCID 0000000316152749 Début de la thèse : 2026-10-01 Date limite de candidature : 2026-05-31T23:59:59 Les applications de transport de particules Monte-Carlo consistent à échantillonner aléatoirement les trajectoires des neutrons et leurs interactions avec le milieu dans lequel ils se déplacent en utilisant par exemple des calculs de taux de réaction. Dans le cadre d'un calcul Monte-Carlo d'évolution d'un coeur de REP (réacteur à eau pressurisée), il est nécessaire de calculer un très grand nombre de taux de réaction neutron-noyau, impliquant un volume de données pouvant dépasser la capacité mémoire d'un noeud de calcul sur les supercalculateurs actuels. Dans le cadre de Tripoli-5, les architectures à mémoire distribuée ont été identifiées comme cible pour le déploiement de calcul à haute performance. Pour exploiter de telles architectures il convient donc d'utiliser des approches de décomposition de données, notamment sur les taux de réaction. Toutefois, avec une méthode de parallélisation classique, les processus n'ont pas d'affinité particulière pour les taux qu'ils hébergent localement; au contraire, chaque taux reçoit des contributions de manière uniforme de tous les processus. Les accès aux données décomposées peuvent s'avérer coûteux quand ces derniers imposent une utilisation intensive des communications. Toutefois, des mécanismes de communications unidirectionnelles comme par exemple les MPI RMA (Message Passing Interface, Remote Memory Access) permettent de faciliter ses accès aussi bien en termes d'expressions que de performances.
L'objectif de cette thèse sera d'étudier les approches de décomposition de données, notamment des taux de réaction, en s'appuyant sur des mécanismes de communications unidirectionnelles performants tels que les MPI RMA. Dans le domaine de la simulation de transport de particules, la méthode Monte-Carlo [1] consiste à échantillonner aléatoirement les trajectoires des neutrons et leurs interactions avec le milieu dans lequel ils se déplacent, selon des lois de probabilités déterminées par la physique sous-jacente. Le Monte-Carlo n'introduit quasiment pas d'approximations dans la résolution de l'équation de transport et n'a pas besoin de discrétiser l'espace des phases, contrairement aux méthodes dites déterministes; pour cette raison, le Monte-Carlo est considéré la méthode de référence dans le domaine de la neutronique.
Les neutrons interagissent avec le milieu dans lequel ils se déplacent, et en particulier avec les noyaux qui le composent. Ces interactions font évoluer la composition isotopique des milieux irradiés. Dans le cadre d'un calcul Monte-Carlo d'évolution d'un coeur de REP (réacteur à eau pressurisée), il est nécessaire de calculer un très grand nombre de taux de réaction neutron-noyau. Le volume de données nécessaire au stockage de toutes ces quantités peut être de l'ordre du téraoctet, dépassant souvent la capacité mémoire d'un noeud de calcul sur les supercalculateurs actuels.
Le code Tripoli-5 est développé au CEA dans le but d'adapter la simulation Monte-Carlo aux nouvelles architectures logicielles et matérielles [2]. Les architectures à mémoire distribuée ont été identifiées comme cible pour le déploiement de calcul à haute performance. De telles architectures offrent un potentiel de stockage répondant au besoin d'une simulation d'évolution. Pour utiliser les ressources ainsi mises à disposition il convient d'utiliser des approches de décomposition de données.
Dans un contexte massivement parallèle reposant sur une hiérarchie de ressources de calcul (noeuds de calcul, coeurs de calcul, GPUs, etc.) l'utilisation de telles approches impose un arbitrage de la répartition des données pour garantir des accès efficaces et une distribution équilibrée. Cette distribution doit être définie à l'aide de structures de données et de méthodes de décomposition appropriées [3]. Les accès aux données décomposées peuvent s'avérer couteux quand ces derniers imposent une utilisation intensive des réseaux informatiques des supercalculateurs via des communications. Toutefois, des mécanismes de communications unidirectionnelles comme par exemple les MPI RMA [4] permettent de faciliter ses accès aussi bien en termes d'expressions que de performances. En effet, celles-ci permettent l'accès à l'ensemble des données sans impliquer explicitement les processus MPI propriétaires de ces données tout en tirant parti de la performance des réseaux rapides. L'objectif de cette thèse sera d'étudier les approches de décomposition de données, notamment des taux de réaction, en s'appuyant sur des mécanismes de communications unidirectionnelles performants tels que les MPI RMA.

Le profil recherché

HPC, MPI, informatique

Postuler sur le site du recruteur

Ces offres pourraient aussi vous correspondre.