Fonctionnement des statistiques par bloc

Disponible avec une licence Spatial Analyst.

L'outil Statistiques par bloc effectue une opération qui calcule une statistique pour les cellules en entrée dans un ensemble fixe de fenêtres ou voisinages qui ne se superposent pas. La statistique (par exemple, la moyenne, le maximum ou la somme) est calculée pour toutes les cellules en entrée contenues dans chaque voisinage. La valeur résultante d'un bloc ou d'un voisinage individuel est affectée à tous les emplacements de cellule contenus dans le rectangle d'emprise minimale du voisinage spécifié.

Traitement de voisinage

Théoriquement, pour chaque bloc de cellules, l'algorithme calcule une statistique pour les cellules en entrée qui figurent dans la forme de voisinage spécifiée dans ce bloc. Les voisinages ne se superposant pas, toute cellule en entrée spécifique est incluse dans les calculs pour un seul bloc.

Plusieurs formes de voisinage prédéfinies sont disponibles à la sélection. Vous pouvez également créer une forme personnalisée. Les statistiques que vous pouvez calculer pour un voisinage sont les suivantes : majorité, maximum, moyenne, médiane, minimum, minorité, plage, écart type, somme et variété.

En principe, l’outil Statistiques par bloc fonctionne comme suit :

  • Il crée le premier voisinage spécifié (par exemple, un voisinage circulaire) dans le coin supérieur gauche de la fenêtre d'analyse.

    Voisinage circulaire du rayon spécifié

  • Calcule le rectangle d'emprise minimale pour déterminer la taille du bloc en sortie.

    Rectangle d'emprise minimale

  • Partitionne la surface restante du raster en blocs définis. Les blocs ne peuvent pas se superposer.

    Surface restante de l'entrée partitionnée en blocs

  • Identifie dans chaque bloc les emplacements de cellule utilisés dans les calculs de bloc. Les emplacements de cellule sont déterminés par la définition du voisinage spécifié (par exemple, un voisinage circulaire) qui s'inscrit dans le rectangle d’emprise.

    Les cellules incluses pour l'analyse dans le bloc sont identifiées.

  • Calcule la valeur en sortie de chaque voisinage de chaque bloc. Les valeurs résultantes sont affectées à chacun des emplacements de cellule dans le bloc en sortie correspondant.

Cellules NoData

Le paramètre Ignorer les valeurs NoData dans les calculs contrôle la façon dont les cellules NoData sont traitées dans la fenêtre de voisinage. Si ce paramètre est activé (ignore_nodata = "DATA" dans Python), toutes les cellules du voisinage dont la valeur est NoData sont ignorées dans le calcul de la valeur en sortie du bloc. S'il est désactivé, (ignore_nodata = "NODATA" dans Python) et qu'une cellule du voisinage possède la valeur NoData, toutes les cellules du bloc en sortie possèdent la valeur NoData.

Taille du voisinage

Quelle que soit la dimension, la taille maximale d’un voisinage est limitée à 2 048 cellules. En d’autres termes, les voisinages rectangulaires ne peuvent pas dépasser ce nombre de cellules, que ce soit dans le sens horizontal ou vertical. Pour les voisinages circulaires, le rayon ne peut pas dépasser 1 023 cellules.

Types de voisinage

La forme d’un voisinage peut être un anneau, un cercle, un rectangle ou un secteur. Vous pouvez également utiliser un fichier de noyau pour définir une forme de voisinage personnalisée et appliquer des pondérations différentes à certaines cellules du voisinage avant le calcul de la statistique.

La présentation ci-dessous décrit les différentes formes de voisinage et la manière dont elles sont définies :

  • Anneau
    • La forme en anneau se compose de deux cercles, l’un étant situé à l’intérieur de l’autre pour former un anneau. Les cellules dont le centre est situé à l’extérieur du rayon du petit cercle, mais à l’intérieur du rayon du grand cercle sont incluses dans le traitement du voisinage. La surface qui se trouve entre les deux cercles constitue le voisinage en anneau.
    • Le rayon est représenté en unités de cellule ou de carte et est mesuré perpendiculairement à l’axe x ou y. Lorsque les rayons sont indiqués en unités de carte, ils sont convertis en unités de cellule. Les rayons obtenus en unités de cellule produisent une surface qui représente le plus fidèlement possible la surface calculée à l’aide des rayons d’origine en unités de carte. Les centres de cellule englobés par l’anneau sont inclus dans le traitement du voisinage.
    • Le voisinage en anneau par défaut présente un rayon intérieur d’une cellule et un rayon extérieur de trois cellules.
    • Voici une illustration d’exemple d’un voisinage en anneau :

    Deux blocs avec voisinage en anneau par défaut
    Deux blocs de traitement sont illustrés avec le voisinage en anneau par défaut (rayon interne = 1 cellule, rayon externe = 3 cellules).

  • Cercle
    • Un voisinage circulaire est créé en spécifiant une valeur de rayon.
    • Le rayon est représenté en unités de cellule ou de carte et est mesuré perpendiculairement à l’axe x ou y. Lorsque le rayon est indiqué en unités de carte, une logique supplémentaire est utilisée pour déterminer quelles cellules font partie du voisinage de traitement. D’abord, la surface exacte d’un cercle défini par la valeur de rayon spécifiée est calculée. Ensuite, la surface est calculée pour deux cercles supplémentaires, un où la valeur de rayon spécifiée est arrondie au nombre inférieur et un autre où elle est arrondie au nombre supérieur. Après comparaison de ces deux surfaces avec celle obtenue à partir du rayon spécifié, le rayon de la surface la plus proche est utilisé dans l’opération.
    • Le rayon du voisinage circulaire par défaut comporte trois cellules.
    • Voici une illustration d’exemple d’un voisinage circulaire :

    Deux blocs avec voisinage circulaire par défaut
    Deux blocs de traitement sont illustrés avec le voisinage circulaire par défaut (rayon = 3 cellules).

  • Rectangle
    • Le voisinage rectangulaire est spécifié en fournissant une largeur et une hauteur en unités de cellule ou de carte.
    • Seules les cellules dont le centre est compris dans l’objet défini sont traitées dans le cadre du voisinage rectangulaire.
    • Le voisinage rectangulaire par défaut est un carré avec une hauteur et une largeur de trois cellules.
    • Voici une illustration d’exemple d’un voisinage rectangulaire :

    Deux blocs avec voisinage rectangulaire
    Deux blocs de traitement sont illustrés avec un voisinage rectangulaire (largeur = 6 cellules, hauteur = 4 cellules).

  • Secteur
    • Un secteur est un voisinage en forme de camembert défini par un rayon, un angle de départ et un angle d’arrivée.
    • Il s’étend dans le sens anti-horaire, de l’angle de départ vers l’angle d’arrivée. Les angles sont exprimés en degrés arithmétiques de 0 à 360, où 0 est l’axe x positif (3h00 sur une horloge), et peuvent être des valeurs entières ou à virgule flottante. Vous pouvez utiliser des angles négatifs.
    • Le rayon est représenté en unités de cellule ou de carte et est mesuré perpendiculairement à l’axe x ou y. Lorsque le rayon est indiqué en unités de carte, il est converti en unités de cellule. Le rayon obtenu en unités de cellule produit une surface qui représente le plus fidèlement possible la surface calculée à l’aide des rayons d’origine en unités de carte. Les centres de cellule englobés par le secteur sont inclus dans le traitement du voisinage.
    • Le voisinage sectoriel par défaut s’étend de 0 à 90 degrés, avec un rayon de trois cellules.
    • Voici une illustration d’exemple d’un voisinage sectoriel :

    Deux blocs avec voisinage sectoriel
    Deux blocs de traitement sont illustrés avec le voisinage sectoriel (rayon = 3 cellules, angle de départ = 0, angle d’arrivée = 270).

  • Irrégulière
    • Permet de spécifier un voisinage de forme irrégulière.
    • Le fichier de noyau irrégulier spécifie les positions de cellule à inclure dans le voisinage.
    • Les règles suivantes s'appliquent à un fichier de noyau avec un voisinage irrégulier :

      • Un fichier de noyau irrégulier est un fichier texte ASCII qui définit les valeurs et la forme d’un voisinage irrégulier. Le fichier peut être créé à l’aide de n’importe quel éditeur de texte. Il doit posséder une extension de fichier .txt.
      • La première ligne spécifie la largeur et la hauteur du voisinage (le nombre de cellules dans la direction x, suivi d’un espace, et le nombre de cellules dans la direction y).
      • Les lignes suivantes définissent la valeur à utiliser pour chaque position dans le voisinage qu'elles représentent. Les valeurs sont séparées par un espace.
      • Les valeurs définissent si une position dans le voisinage est incluse dans le calcul. En général, la valeur 1 permet d'identifier les positions à inclure dans les calculs d'un voisinage irrégulier, mais toute valeur positive ou négative non nulle peut être utilisée. Des valeurs à virgule flottante peuvent également être utilisées.
      • Pour exclure un emplacement du voisinage du calcul, utilisez la valeur 0 (et non un espace) à l'emplacement correspondant dans le fichier de noyau.

    • L’exemple ci-dessous montre un fichier de noyau irrégulier ASCII avec le voisinage correspondant :

    Noyau irrégulier et voisinage associé pour deux blocs
    Un noyau de voisinage irrégulier est présenté avec une illustration des cellules à traiter pour deux blocs.

  • Pondération
    • Similaire au type de voisinage irrégulier, le voisinage de type pondération permet de définir un voisinage irrégulier, mais permet également d'appliquer des pondérations aux valeurs en entrée.
    • Le fichier de noyau pondéré spécifie les positions de cellule à inclure dans le voisinage et les pondérations par lesquelles elles sont multipliées.
    • Vous ne pouvez employer le voisinage pondéré qu’avec des statistiques de type moyenne, écart type et somme.
    • Les règles suivantes s’appliquent dans le cas d’un fichier de noyau pour un voisinage de type pondération :

      • Un fichier de noyau pondéré est un fichier texte ASCII qui définit les valeurs et la forme d’un voisinage pondéré. Le fichier peut être créé à l’aide de n’importe quel éditeur de texte. Il doit posséder une extension de fichier .txt.
      • La première ligne spécifie la largeur et la hauteur du voisinage (le nombre de cellules dans la direction x, suivi d’un espace, et le nombre de cellules dans la direction y).
      • Les lignes suivantes définissent la valeur à utiliser pour chaque position dans le voisinage qu'elles représentent. Les valeurs sont séparées par un espace.
      • Pour la statistique de somme, une pondération peut correspondre à toute valeur entière positive ou négative, ou valeur à virgule flottante.
      • Pour les statistiques de moyenne et d'écart type, une pondération peut correspondre à toute valeur entière positive ou valeur à virgule flottante. Les valeurs négatives n'étant pas autorisées pour ces statistiques, toute position dont la pondération est négative est ignorée dans les calculs.
      • Pour exclure un emplacement du voisinage du calcul, utilisez la valeur 0 (et non un espace) à l'emplacement correspondant dans le fichier de noyau.

    • L'exemple ci-dessous montre le contenu d'un fichier de noyau pondéré avec le voisinage correspondant :

    Noyau pondéré et voisinage associé pour deux blocs
    Un noyau de voisinage pondéré est présenté avec une illustration des cellules à traiter pour deux blocs.

Type de statistique

Les statistiques disponibles sont les suivantes : moyenne, majorité, maximum, médiane, minimum, minorité, plage, écart type et variété. Le type de statistique par défaut est la moyenne.

  • Majorité
    • Vous ne pouvez utiliser qu’un raster de type entier en entrée.
    • La fréquence de chaque valeur de cellule unique dans chaque voisinage de bloc est déterminée. Si une valeur unique est dotée de la fréquence la plus élevée (ce qui est le plus fréquent), cette valeur est attribuée à toutes les cellules de ce voisinage. En cas d'égalité, la plus faible des valeurs de fréquence égale est attribuée.
  • Maximum
    • Si le raster en entrée est de type entier, le raster en sortie contient des nombres entiers. Si les valeurs en entrée sont à virgule flottante, les valeurs en sortie sont également à virgule flottante.
  • Moyenne
    • L’entrée peut être un raster de type entier ou à virgule flottante.
    • Le raster en sortie est toujours à virgule flottante.
    • Pour le type de voisinage de pondération, il s'agit de l'un des sous-ensembles de types de statistiques pris en charge. Pour en savoir plus sur le mode de calcul de cette statistique, reportez-vous à la section Voisinage pondéré.
  • Médiane
    • Vous ne pouvez utiliser qu’un raster de type entier en entrée.
    • Si le nombre de valeurs de cellule valides dans le voisinage est impair, la valeur médiane est calculée en sélectionnant la valeur centrale du classement des valeurs. Si le nombre de valeurs du voisinage est pair, les valeurs sont classées et la valeur la plus faible des deux valeurs médianes est sélectionnée.
  • Minimum
    • Si le raster en entrée est de type entier, le raster en sortie contient des nombres entiers. Si les valeurs en entrée sont à virgule flottante, les valeurs en sortie sont également à virgule flottante.
  • Minorité
    • Vous ne pouvez utiliser qu’un raster de type entier en entrée.
    • La fréquence de chaque valeur de cellule unique dans chaque voisinage de bloc est déterminée. Si une valeur unique est dotée de la fréquence la plus basse (ce qui est le moins fréquent), cette valeur est attribuée à toutes les cellules de ce voisinage. En cas d'égalité, la plus faible des valeurs de fréquence égale est attribuée.
  • Plage
    • Si le raster en entrée est de type entier, le raster en sortie contient des nombres entiers. Si les valeurs en entrée sont à virgule flottante, les valeurs en sortie sont également à virgule flottante.
    • Les valeurs de chaque emplacement de cellule dans le raster en sortie sont déterminées cellule par cellule en appliquant cette formule simple : Block Range = Block Maximum – Block Minimum.
  • Écart type
    • Le raster en sortie est toujours à virgule flottante.
    • Pour le type de voisinage de pondération, il s'agit de l'un des sous-ensembles de types de statistiques pris en charge. Pour en savoir plus sur le mode de calcul de cette statistique, reportez-vous à la section Voisinage pondéré.
    • L’écart type est calculé sur la population entière (méthode N). Il ne repose pas sur un échantillon (méthode N-1).
  • Somme
    • Si le raster en entrée est de type entier, le raster en sortie contient des nombres entiers. Si les valeurs en entrée sont à virgule flottante, les valeurs en sortie sont également à virgule flottante.
    • Pour le type de voisinage de pondération, il s'agit de l'un des sous-ensembles de types de statistiques pris en charge. Pour en savoir plus sur le mode de calcul de cette statistique, reportez-vous à la section Voisinage pondéré.
  • Variété
    • Vous ne pouvez utiliser qu’un raster de type entier en entrée.

Calculs de voisinage pondéré

Vous pouvez appliquer des pondérations pour ajuster l’influence de chaque valeur du voisinage sur le résultat final du bloc de traitement.

Les sections suivantes indiquent les formules utilisées pour calculer les résultats des statistiques de moyenne pondérée, d’écart type et de somme. Chaque formule est illustrée par un exemple qui indique les calculs pour un bloc de traitement et les résultats pour un voisinage rectangulaire de 3 x 3 cellules.

Statistique de moyenne pondérée

Dans le cas du voisinage pondéré avec la statistique de moyenne, la valeur en sortie des cellules d'un bloc de traitement correspond à la somme des produits des valeurs de pondération du noyau multipliées par les valeurs en entrée, divisée par la somme des valeurs de pondération du noyau.

La formule appliquée aux cellules d'un voisinage est la suivante :

Equation de la moyenne pondérée

Où :

  • µW représente la valeur de la moyenne pondérée de la population pour le bloc de traitement.
  • N représente le nombre de cellules dans le voisinage.
  • wi représente une valeur de pondération définie dans le noyau.
  • xi représente une valeur de cellule en entrée.

Héritage :

Dans les versions précédentes, les calculs utilisaient le nombre de cellules dans le voisinage comme dénominateur.

Les valeurs de pondération doivent être des valeurs positives et peuvent être entières ou à virgule flottante.

Exemple

Soit le bloc rectangulaire 3 x 3 de cellules en entrée suivant :

4 6 7 6 7 8 4 5 6

La moyenne mathématique (somme/nombre) de ces valeurs est 53/9 = 5,889.

Soit le noyau de cellules pondéré 3 x 3 suivant :

3 3 0,0 0,5 0,0 0,5 2,0 0,5 0,0 0,5 0,0

Ce noyau donne le degré d’influence le plus élevé à la cellule centrale du bloc (pondération égale à 2), réduit l’influence des quatre voisins orthogonaux sur la cellule centrale (pondération égale à 0,5) et fait en sorte que les quatre cellules des coins n’aient aucune influence (pondération égale à 0).

Si l'on applique l’équation de moyenne pondérée fournie ci-avant, le calcul permettant d'obtenir la valeur finale est le suivant :

= (w1x1 + w2x2 + w3x3 + w4x4 + w5x5 + w6x6 + w7x7 + w8x8 + w9x9) / (w1 + w2 + w3 + w4 + w5 + w6 + w7 + w8 + w9) = ((0*4)+(0,5*6)+(0*7)+(0,5*6)+(2,0*7)+(0,5*8)+(0*4)+(0,5*5)+(0*6)) / (0+0,5 + 0 + 0,5 + 2,0 + 0,5 + 0 + 0,5 + 0) = (0 + 3,0 + 0 + 3,0 + 14,0 + 4,0 + 0 + 2,5 + 0) / (0,5 + 0,5 + 2,0 + 0,5 + 0,5) = (3,0 + 3,0 + 14,0 + 4,0 + 2,5) / 4,0 = 26,5 / 4,0 = 6,625

En comparaison, la moyenne standard des neuf cellules en entrée serait de 5,889. Si seules les cinq cellules en entrée qui se trouvent à l'intérieur du noyau (où la pondération est de zéro) sont incluses, mais que les valeurs des pondérations ne sont pas prises en compte, la moyenne devient 6,4 (6 + 6 + 7 + 8 + 5 = 32, ensuite divisé par cinq).

Statistique de l’écart type pondéré

Dans le cas du voisinage de pondération avec la statistique d’écart type, la valeur en sortie des cellules d'un bloc de traitement est le résultat de l’équation suivante :

Equation de l'écart type pondéré

Où :

  • SDW représente la valeur de l'écart type pondéré de la population pour le bloc de traitement.
  • µW représente la valeur de la moyenne pondérée de la population pour le bloc de traitement.
  • N représente le nombre de cellules dans le voisinage.
  • wi représente une valeur de pondération définie dans le noyau.
  • xi représente une valeur de cellule en entrée.

Les valeurs de pondération doivent être des valeurs positives et peuvent être entières ou à virgule flottante.

Si toutes les valeurs en entrée d’un voisinage sont identiques, la valeur de l’écart type pour toutes les cellules d'un bloc de traitement est 0.

Exemple

Les valeurs de voisinage utilisées dans l’exemple de la moyenne pondérée ci-avant sont à nouveau utilisées dans cet exemple.

4 6 7 6 7 8 4 5 6

Les mêmes valeurs de noyau pondéré sont également utilisées :

3 3 0,0 0,5 0,0 0,5 2,0 0,5 0,0 0,5 0,0

Si l'on applique l’équation de l’écart type pondéré fournie ci-avant pour le bloc de cellules, le résultat du calcul est d'environ 0,85696. Cette valeur est écrite dans chacune des cellules de ce voisinage de bloc.

Statistique de somme pondérée

Dans le cas du voisinage de pondération avec la statistique de somme, la valeur en sortie des cellules d'un bloc de traitement est le résultat de l’équation suivante :

Equation de la somme pondérée

Où :

  • SW représente la valeur de la somme pondérée pour le bloc de traitement.
  • N représente le nombre de cellules dans le voisinage.
  • wi représente une valeur de pondération définie dans le noyau.
  • xi représente une valeur de cellule en entrée.

Les valeurs de pondération peuvent être des valeurs positives ou négatives et être entières ou à virgule flottante.

Exemple

Prenons l’exemple des valeurs de voisinage suivantes en entrée :

4 6 7 6 7 8 4 5 6

Soit le noyau de cellules pondéré 3 x 3 suivant :

3 3 -1 -2 -1 0 0 0 1 2 1

Si l'on applique l’équation fournie ci-avant, le calcul utilisé pour obtenir la valeur finale est le suivant :

= (w1x1 + w2x2 + w3x3 + w4x4 + w5x5 + w6x6 + w7x7 + w8x8 + w9x9) = ((-1*4) + (-2*6) + (-1*7) + (0*6) + (0*7) + (0*8) + (1*4) + (2*5) + (1*6)) = (-4) + (-12) + (-7) + 4 + 10 + 6 = -3

Utilisations des statistiques par bloc

L'outil Statistiques par bloc peut être utilisé à la place de l'outil Ré-échantillonner pour ré-échantillonner un raster d'une résolution fine en une résolution plus grossière. Au lieu d'utiliser la technique de rééchantillonnage par voisin le plus proche, bilinéaire ou cubique, il peut être préférable d'affecter aux cellules de raster plus grossières le maximum, le minimum ou la moyenne des valeurs dans la nouvelle étendue géographique englobée par les cellules plus grossières. Pour cela, les statistiques appropriées sont appliquées au bloc (par exemple, la moyenne ou le maximum).

L'outil Agréger du jeu d'outils Généralisation est similaire à l'outil Statistiques par bloc dans la mesure où il permet l'agrégation des emplacements de cellule en fonction de la somme, de la moyenne, de la médiane ou des valeurs minimum ou maximum à l'intérieur d'une fenêtre spatiale, déterminée par la résolution en sortie souhaitée. Il existe cependant deux différences majeures entre ces deux options :

  • Le raster en sortie résultant de l'outil Agréger est ré-échantillonné dans la résolution souhaitée.
  • Il n'existe pas de concept de voisinage spécifié dans l'outil Agréger. Le voisinage et le bloc en sortie sont les mêmes, sont toujours rectangulaires et englobent les mêmes emplacements de cellule. La taille du bloc dans l'outil Agréger est déterminée par l'agrégation des cellules nécessaires pour atteindre la résolution souhaitée.

Rubriques connexes