Introduction à l’apprentissage profond

Disponible avec une licence Image Analyst.

Les outils d’apprentissage automatique sont un composant clé de l’analyse spatiale SIG depuis des décennies. L’apprentissage automatique dans ArcGIS permet de classifier des images, d’enrichir des données par agrégation ou de modéliser des relations spatiales. L’apprentissage automatique est une branche de l’intelligence artificielle dans laquelle des données structurées sont traitées par un algorithme pour résoudre un problème. Dans les données structurées traditionnelles, une personne étiquette les données, comme les images de chats et de chiens, afin de permettre aux algorithmes de comprendre les caractéristiques spécifiques de chaque type d’animal et d’identifier ces animaux sur les autres images.

L’apprentissage profond est un sous-jeu de l’apprentissage automatique qui utilise plusieurs couches d’algorithmes sous la forme de réseaux neuronaux. Les données en entrée sont analysées via différentes couches du réseau, chaque couche définissant des entités et modèles spécifiques dans les données. Par exemple, si vous voulez identifier des entités telles que des bâtiments et des routes, le modèle d’apprentissage profond est entraîné avec des images de différents bâtiments et routes, en traitant les images via les couches avec le réseau neuronal, puis en recherchant les identifiants requis pour classer un bâtiment ou une route.

Esri a développé des outils et processus pour tirer parti des dernières innovations de l’apprentissage profond et ainsi répondre aux questions les plus difficiles en matière d’applications SIG et de télédétection. La vision par ordinateur, ou la capacité qu’ont les ordinateurs à développer une compréhension à partir de vidéos ou d’images numériques, est un domaine qui s’est éloigné des algorithmes d’apprentissage automatique traditionnels au profit des méthodes d’apprentissage profond. Avant d’appliquer l’apprentissage profond à l’imagerie dans ArcGIS Pro, il est important de comprendre les différentes applications de l’apprentissage profond pour la vision par ordinateur.

Applications de l’apprentissage profond pour la vision par ordinateur

De nombreuses tâches de vision par ordinateur peuvent s’accomplir avec les réseaux neuronaux de l’apprentissage profond. Esri a développé des outils qui vous permettent d’effectuer une classification d’images, une détection d’objets, une segmentation sémantique et une segmentation d’instances. Toutes ces tâches de vision par ordinateur sont décrites ci-dessous, chacune avec un exemple de télédétection et un exemple de vision par ordinateur plus général.

Classification d’images dans la vision par ordinateur

La classification d’images implique l’attribution d’une étiquette ou d’une classe à une image numérique entière. Par exemple, l’image de drone sur la gauche pourrait porter l’étiquette Foule et la photo numérique sur la droite pourrait s’appeler Chat. Ce type de classification se nomme également classification d’objets ou reconnaissance d’images, et il peut servir dans les SIG pour classer les entités dans une image. Dans ArcGIS Pro, ce processus peut s’accomplir à l’aide de l’outil Classer des objets à l’aide de l’apprentissage profond.

Détection d’objets dans la vision par ordinateur

La détection d’objet consiste à localiser des entités dans une image. Par exemple, dans l’image de télédétection ci-dessus, le réseau neuronal a trouvé la localisation d’un avion. Dans un cas de vision par ordinateur plus général, un modèle peut être en capacité de détecter la localisation de différents animaux. Ce processus implique généralement le dessin d’une zone de contour atour des entités d’intérêt, et il peut servir dans les SIG pour localiser des entités spécifiques dans des images satellite, aériennes ou de drone et pour tracer ces entités sur une carte. Dans ArcGIS Pro, vous pouvez utiliser l’outil Détecter des objets à l’aide de l’apprentissage profond pour détecter des objets dans une image.

Segmentation sémantique dans la vision par ordinateur

La segmentation sémantique se produit lorsque chaque pixel dans une image est classé comme appartenant à une classe. Par exemple, dans l’image de gauche ci-dessus, les pixels de route sont classés séparément des autres pixels. Sur la droite, les pixels qui constituent un chat sur une photo sont classés en tant que chat, tandis que les autres pixels de l’image appartiennent à d’autres classes. En SIG, ce procédé est connu sous le nom de classification de pixels, de segmentation d’images ou de classification d’images, et il est souvent utilisé pour créer des cartes de classification de l’utilisation du sol. Dans ArcGIS Pro, vous pouvez utiliser l’outil Classer des pixels à l’aide de l’apprentissage profond pour la segmentation sémantique.

Segmentation d’instances dans la vision par ordinateur

La segmentation d’instances est une méthode de détection d’objets plus précise dans laquelle la limite de chaque instance d’objet est dessinée. Ce type d’application d’apprentissage profond également connu sous le nom de segmentation d’objets.

Apprentissage profond dans ArcGIS Pro

Pour en savoir plus sur l’apprentissage profond dans ArcGIS Pro, reportez-vous à la rubrique Apprentissage profond dans ArcGIS Pro.

Pour obtenir la liste des outils de géotraitement disponibles pour l’apprentissage profond, reportez-vous à la rubrique Vue d’ensemble du jeu d’outils de l’apprentissage profond.

Rubriques connexes