Bienvenue aux Mines Paristech
Bienvenue à MINES ParisTech
Newsletter International
Website
Théorie & Pratique
Vous êtes

webTV

Lecture

Aftermovie du H4ck@mines 2019 MINES ParisTech

Lecture

MIG 2019 - Systèmes embarqués

Lecture

Teaser Journées Portes Ouvertes

Lecture

Season's Greetings - Meilleurs voeux 2019

Lecture

Plan stratégique de l'Ecole

+ Toutes les vidéos

Partager

Hugues THOMAS - Soutenance de thèse MINES ParisTech

Hugues THOMAS

Apprentissage de nouvelles représentations pour la sémantisation de nuages de points 3D

Titre anglais : Learning new representations for 3D point cloud semantic segmentation
Date de soutenance : 19/11/19
Directeurs de thèse : François GOULETTE, Beatriz MARCOTEGUI

Mots clés en français : 3D,Apprentissage profond,nuage de points,convolution,sémantisation,
Mots clés en anglais : 3D,point clouds,Deep Learning,convolution,semantic segmentation,

Résumé de la thèse en français
Les nuages de points sont des données géométriques communément utilisées dans les domaines de vision par ordinateur, infographie et robotique. Aujourd'hui, de nouvelles technologies permettent l'acquisition de scènes 3D volumineuses et précises. Les nouvelles applications ouvertes par ces technologies, comme les véhicules autonomes ou la maintenance d'infrastructure, reposent sur un traitement efficace des nuages de points à grande échelle. Les méthodes d'apprentissage profond par convolution, qui ont montré des résultats exceptionnels sur une multitude de problèmes allant de la vision par ordinateur, à la médecine, en passant par les traitements linguistiques, ne peuvent pas être utilisées directement avec des nuages ??de points. La puissance de ces méthodes se fonde sur leur capacité à apprendre des représentations sémantiquement fortes de leurs données. Dans le cas des images, les filtres convolutifs ont permis l'apprentissage de nouvelles représentations, jusqu'alors construites « à la main » dans les méthodes de vision par ordinateur plus anciennes. En suivant le même raisonnement, nous présentons dans cette thèse une étude des représentations construites utilisées pour le traitement des nuages ??de points. Certaines questions restant sans réponse dans l'état de l'art, nous proposons plusieurs contributions, qui serviront de base à la conception d'une nouvelle représentation convolutive pour le traitement du nuage de points. Parmi elles, une nouvelle définition de voisinages sphériques multi-échelles, une comparaison avec les k plus proches voisins multi-échelles, une nouvelle stratégie d'apprentissage actif, la segmentation sémantique des nuages ??de points à grande échelle, et une étude de l'influence de la densité dans les représentations multi-échelles. Cette compréhension des représentations construites offre des bases solides pour la conception de représentations pouvant être apprises sous la forme d'un nouvel opérateur de convolution pour les nuages ??de points. Nous introduisons la « Kernel Point Convolution » (KPConv), qui utilise des voisinages sphériques et un noyau défini par des points. Ces points jouent le même rôle que les pixels du noyau des convolutions en image. Nos réseaux convolutionnels surpassent les approches de segmentation sémantique de l'état de l'art dans presque toutes les situations. En plus de ces résultats probants, nous avons conçu KPConv avec une grande flexibilité et une version déformable. Pour conclure notre réflexion, nous proposons plusieurs éclairages sur les représentations que notre méthode est capable d'apprendre.

Résumé de la thèse en anglais
Point clouds are a type of geometric data widely used in computer vision, computer graphics, and robotics. In the recent years, new technologies have allowed the acquisition of large and precise 3D scenes. They have opened up new applications like self-driving vehicles or infrastructure monitoring that rely on efficient large scale point cloud processing. Convolutional deep learning methods, which have shown outstanding results on a multitude of applications in computer vision, medicine, or language processing, cannot be directly used with point clouds. The power of these methods revolve around their ability to learn meaningful representations of their data. In the case of images, convolutional filters brought the ability to learn new representations, which were previously hand-crafted in older computer vision methods. Following the same line of thought, we present in this thesis a study of hand-crafted representations previously used for point cloud processing. Some questions remaining unanswered in the state of the art, we propose several contributions, to serve as basis for the design of a new convolutional representation for point cloud processing. They include a new definition of multiscale radius neighborhood, a comparison with multiscale k-nearest neighbors, a new active learning strategy, the semantic segmentation of large scale point clouds, and a study of the influence of density in multiscale representations. This understanding of hand-crafted representations offers strong foundations for the design of learnable representations in the form of a new convolutional operator for point clouds. We introduce the Kernel Point Convolution (KPConv), which uses radius neighborhoods and a set of kernel points to play the role of the kernel pixels in image convolution. Our convolutional networks outperform state-of-the-art semantic segmentation approaches in almost any situation. In addition to these strong results, we designed KPConv with a great flexibility and a deformable version. To conclude our argumentation, we propose several insights on the representations that our method is able to learn.

Retour à l'annuaire des docteurs

actualité

Comment renforcer l'autonomie des salariés ?

Formation Comment renforcer l'autonomie des salariés ? Des entreprises toujours plus nombreuses souhaitent…
> En savoir +

MINES ParisTech sur le podium

Formation MINES ParisTech sur le podium Le Figaro Étudiant réalise un nouveau classement des…
> En savoir +

Doublé de thèses

Formation Doublé de thèses Un rare doublé de thèses au Centre de recherche en informatique (CRI) de MINES…
> En savoir +

Femmes dans la transition énergétique

Formation Femmes dans la transition énergétique « J'appelle toutes les #WomenInEnergy à prendre…
> En savoir +

La rénovation thermique réduit-elle vraiment votre facture d'énergie ?

Formation La rénovation thermique réduit-elle vraiment votre… La rénovation énergétique est l’un des piliers de…
> En savoir +

+ Toutes les actualités

contact

Régine MOLINS
Direction de l'Enseignement
Service du Doctorat
> envoyer un mail

Plan du site
MINES
ParisTech

60, Boulevard Saint-Michel
75272 PARIS Cedex 06
Tél. : +33 1 40 51 90 00

Implantations
Mentions légales | efil.fr | ©2012 MINES ParisTech | +33 1 40 51 90 00 |