Bienvenue aux Mines Paristech
Bienvenue à MINES ParisTech
Newsletter International
Website
Théorie & Pratique
Vous êtes

webTV

Lecture

Aftermovie du H4ck@mines 2019 MINES ParisTech

Lecture

MIG 2019 - Systèmes embarqués

Lecture

Teaser Journées Portes Ouvertes

Lecture

Season's Greetings - Meilleurs voeux 2019

Lecture

Plan stratégique de l'Ecole

+ Toutes les vidéos

Partager

Andrei BURSUC - Soutenance de thèse MINES ParisTech

Andrei BURSUC

Indexation et recherche de contenus par objet visuel

Titre anglais : Object-based visual content indexing and retrieval
Date de soutenance : 21/12/12
Directeur de thèse : Françoise PRETEUX

Mots clés en français : indexation basée sur le contenu,récupération d\'objets,services web,contenu multimédia,MPEG-7,descripteurs locaux
Mots clés en anglais : content-based indexing,object retrieval,web services,multimedia content,MPEG-7,local descriptors

Résumé de la thèse en français
Avec la prolifération des contenus vidéos sur Internet, l'indexation multimédia a connu, durant la dernière décennie, un large essor. L'enjeu consiste à concevoir et développer des méthodes optimisées de description de contenus visuels optimisées et adaptées à des objectifs aussi bien de requête dans des masses de données multimédias que d'enrichissement semi-automatique de contenus par propagation de signatures. Dans ce contexte, cette thèse apporte deux contributions principales. La première, intitulée DOOR (Dynamic Object Oriented Retrieval), présente un cadre méthodologique pour la recherche et l'extraction d'instances d'objets vidéo sélectionnés par un utilisateur. La seconde, OVIDIUS (On-line VIDeo Indexing Universal System), concerne la plate-forme développée pour la recherche des vidéos avec fonctionnalité de navigation, système d'extraction et interface avec l'architecture sous-jacente. Dans le cadre DOOR, la représentation de l'objet vidéo requête est obtenue de manière hybride par construction du graphe d'adjacence des régions correspondant à une sur-segmentation des trames vidéo avec agrégation de points d'intérêt. L'identification des instances d'objets à travers plusieurs vidéos est exprimée sous forme d'un problème d'optimisation d'une fonctionnelle d'énergie. Quatre stratégies d'optimisation sont proposées : Greedy, Greedy Glouton, recuit simulé et GraphCut. La similarité entre un objet et une trame est estimée selon une technique spectrale intégrant à la fois descripteurs colorimétriques et descripteurs par points d'intérêt. Le cadre DOOR est adapté à de très grandes bases de données vidéos comme des archives, grâce à l'utilisation d'une représentation par sac-de-mots, enrichie par un mécanisme de définition et d'expansion de la requête fondé sur une approche multimodale combinant texte, image et vidéo. Les performances des techniques proposées sont évaluées sur plusieurs corpus de test TRECVID. Les performances obtenues sont discutées. Dans la plate-forme OVIDIUS, les contributions portent sur le support assuré aux utilisateurs pour la recherche vidéo - navigation, extraction, interface graphique. OVIDIUS dispose des fonctionnalités de navigation hiérarchique qui exploite la norme MPEG-7 pour la description structurale du contenu vidéo. Le cadre DOOR est intégré dans la plate-forme OVIDIUS, assurant les fonctions de recherche du système. L'avantage majeur de l'architecture proposée réside dans sa structure modulaire qui permet de déployer le système sur des terminaux différents (fixes et mobiles), indépendamment des systèmes d'exploitation impliqués. Le choix des technologies employées pour chacun des modules composant la plate-forme est argumenté par rapport aux technologies à l'état de l'art. Finalement, différents scénarios et cas d'usage de la plate-forme OVIDIUS sont présentés et discutés.

Résumé de la thèse en anglais
With the ever increasing amount of available video content on video repositories the issue of content-based video objects retrieval is growing in difficulty and becomes a mandatory feature for video search engines.The present thesis advances a user defined video object retrieval framework and brings two major contributions. The first contribution is a methodological framework for user selected video object instances retrieval, entitled DOOR (Dynamic Object Oriented Retrieval), while the second one concerns the support offered for video retrieval, namely the video navigation and retrieval system and interface and its underlying architecture. Under the DOOR framework, the user defined video object comports a hybrid representation obtained by over-segmenting the frames, constructing region adjacency graphs and aggregating interest points. The identification of object instances across multiple videos is formulated as an energy optimization problem approximating an NP-hard problem. Object candidates are sub-graphs that yield an optimum energy towards the user defined query. In order to obtain the optimum energy four optimization strategies are proposed: Greedy, Relaxed Greedy, Simulated Annealing and GraphCut. The region-based object representation is further improved by the aggregation of interest points into a hybrid object representation. The similarity between an object and a frame is achieved with the help of a spectral matching technique integrating both colorimetric and interest points descriptors.The DOOR framework is suitable to large scale video archives through the use of a Bag-of-Words representation enriched with a query definition and expansion mechanism based on a multi-modal, text-image-video principle. The performances of the proposed techniques are evaluated on multiple TRECVID video datasets prooving their effectiveness. The second contribution is related to the user support for video retrieval - video navigation, video retrieval, graphical interface - and consists in the OVIDIUS (On-line VIDeo Indexing Universal System) on-line video browsing and retrieval platform. The OVIDIUS platform features hierarchical video navigation functionalities that exploit the MPEG-7 approach for structural description of video content. The DOOR framework is integrated in the OVIDIUS platform, ensuring the search functionalities of the system. The major advantage of the proposed system concerns its modular architecture which makes it possible to deploy the system on various terminals (both fixed and mobile), independently of the exploitation systems involved. The choice of the technologies employed for each composing module of the platform is argumented in comparison with other technological options. Finally different scenarios and use cases for the OVIDIUS platform are presented.

Retour à l'annuaire des docteurs

actualité

Prix Pierre Laffitte 2019

Formation Prix Pierre Laffitte 2019   « Une magnifique journée !» Tel est selon Elie Hachem, professeur à MINES ParisTech, le…
> En savoir +

Ingénieurs et transitions environnementales

Formation Ingénieurs et transitions environnementales Ingénieurs face au changement climatique C'est une grande…
> En savoir +

Inventer les systèmes énergétiques du futur

Formation Inventer les systèmes énergétiques du futur Se former auprès des meilleurs experts internationaux et…
> En savoir +

Deux docteurs MINES ParisTech distingués

Formation Deux docteurs MINES ParisTech distingués Le département Mécanique et Matériaux de MINES ParisTech une…
> En savoir +

L'École des mines 39-45

Formation L'École des mines 39-45 Être élève des Mines pendant la guerre Voisine du Palais du Luxembourg, dont la Luftwaffe…
> En savoir +

+ Toutes les actualités

contact

Régine MOLINS
Direction de l'Enseignement
Service du Doctorat
> envoyer un mail

Plan du site
MINES
ParisTech

60, Boulevard Saint-Michel
75272 PARIS Cedex 06
Tél. : +33 1 40 51 90 00

Implantations
Mentions légales | efil.fr | ©2012 MINES ParisTech | +33 1 40 51 90 00 |