[MUSIQUE] La carte choroplèthe est la carte statistique la plus courante. C'est la représentation d'une information ordonnée dans des unités géographiques, en utilisant la variable valeur. Ce type de carte se rencontre aussi bien dans des cartes grand public que dans une cartographie destinée à des travaux de recherche. Pour passer de la série statistique à sa représentation, il faut regrouper en classe les différentes valeurs de la série. On nomme discrétisation ce découpage en classes. L'information quantitative est transformée en information ordonnée, pour permettre sa représentation cartographique. On a donc une réduction de l'information au service de sa mise en image. La discrétisation doit permettre de conserver au mieux l'information contenue dans la série statistique et de la transmettre par la carte la plus lisible possible. Les valeurs regroupées dans la même classe sont considérées comme identiques. Leurs différences sont éliminées. Aussi, il convient de construire des classes de la manière la moins arbitraire possible. Le regroupement des valeurs dans une même classe a un sens dans l'interprétation du phénomène représenté. Nous constatons une fois encore que l'image cartographique résulte d'une succession de choix. La discrétisation devra respecter quatre règles. Les classes établies couvrent l'ensemble des valeurs de la série statistique. Une valeur n'appartient qu'à une seule classe. Il ne doit pas y avoir ni recouvrement ni rupture dans les deux classes. Les valeurs limites de chaque classe sont précisées. Combien de classes? Quelle méthode de discrétisation choisir? Pour quelle raison? Nous allons voir les méthodes les plus couramment utilisées. La première décision à prendre, avant de discrétiser une série statistique, consiste à fixer le nombre de classes que l'on souhaite conserver. Ce nombre dépend essentiellement de l'objectif de la carte, c'est-à -dire du public auquel est destiné la représentation, du nombre d'unités géographiques étudiées, et dans une moindre mesure, des caractéristiques de la distribution statistique. Le nombre maximum de paliers de valeurs, donc de classes de données, oscille entre sept et dix. Pour une carte très simple, le nombre de classes pourrait être limité à trois. Mais, dans la majorité des cas, le nombre de classes se situe entre quatre et six. Au-delà de six classes, la représentation correspond à une cartographie pour une étude spécialisée destinée à un public averti. Le choix d'une méthode de discrétisation dépend de la forme de la distribution statistique. Il convient tout d'abord de classer l'ensemble des valeurs par ordre décroissant, de repérer l'existence ou non de valeurs exceptionnelles, de calculer quelques paramètres statistiques, la moyenne, la médiane, l'écart-type. Vous trouverez, dans un document ressource, les rappels sur les paramètres statistiques de base et les formules correspondantes dans un tableur. La forme de la distribution statistique s'apprécie par les valeurs centrales de la distribution, principalement par la moyenne et la médiane. La distribution statistique peut être symétrique, normale ou gaussienne, dissymétrique à gauche ou dissymétrique à droite, uniforme ou multimodale. Dans une distribution symétrique, la moyenne partage la série statistique en deux parties égales et symétriques. Il y a autant de valeurs assez faibles que de valeurs assez fortes. Autant de valeurs très faibles que de valeurs très fortes. Moyennes et médianes sont équivalentes. C'est le cas pour une distribution uniforme. C'est également le cas pour une distribution dite normale ou gaussienne. Lorsque la distribution est symétrique et que la majorité des valeurs se concentrent autour de la moyenne. Les valeurs extrêmes dans ce cas sont rares. Une distribution est dissymétrique lorsque les individus se concentrent soit du côté des valeurs les plus faibles soit du côté des valeurs les plus fortes. Moyennes et médianes ne se confondent pas. Dans le cas d'une dissymétrie à gauche, c'est-à -dire concentration du côté des valeurs les plus faibles, la moyenne est supérieure à la médiane. Dans le cas d'une dissymétrie à droite, c'est-à -dire du côté des valeurs les plus fortes, c'est le contraire, la moyenne est inférieure à la médiane. La moyenne n'est alors pas représentative de la majorité des valeurs. Ces grands types de distribution ne sont que des modèles. En géographie, les distributions observées ne sont jamais exactement normales ou symétriques. Mais reconnaître qu'une distribution se rapproche de tel ou tel modèle permet d'en dégager les caractéristiques et de choisir une méthode de discrétisation adaptée. La difficulté de ce choix est d'établir des classes homogènes qui se distinguent bien les unes des autres. C'est-à -dire de minimiser la variance à l'intérieur de chaque classe et de maximiser la variance entre les classes. Pour cela, il existe plus d'une dizaine de méthodes de discrétisation. Nous allons vous présenter les plus couramment utilisées. La méthode de discrétisation, selon les seuils observés ou seuils naturels, consiste à fixer les bornes de classes, en examinant le diagramme de distribution. Les valeurs de la série statistique sont placées sur un axe gradué, du minimum au maximum. Les bornes de classes sont fixées de manière assez intuitive, là où des ruptures sont apparentes, là où il y a des discontinuités dans la série statistique. L'interprétation de la notion de seuil est subjective et donc discutable. Cette méthode, simple à mettre en œuvre, peut être utilisée pour les distributions statistiques plurimodales, présentant de nombreuses irrégularités. Elle préserve les discontinuités et les valeurs exceptionnelles. Par contre, cette méthode subjective ne permet pas la comparaison entre plusieurs cartes, chaque discrétisation établie en fonction de la série statistique étudiée. Cette méthode ne peut pas être utilisée lorsque la série est importante. Et enfin, les effectifs à amplitude de classe peuvent être très inégaux. Deuxième méthode, la discrétisation en classes d'amplitudes égales, ou d'égales étendues, consiste à diviser l'étendue de la série entre le minimum et le maximum par le nombre de classes souhaité. Toutes les classes ont la même étendue, mais pas le même effectif. On peut, dans certains cas, réaliser une discrétisation de ce type après avoir isolé une valeur ou des valeurs exceptionnelles, en considérant l'étendue hors de ces valeurs exceptionnelles. Pour obtenir les limites de classes, on ajoute à la limite inférieure de chaque classe la valeur de l'amplitude. On arrondit l'amplitude et les nombres exprimant les bornes de classes, pour rendre la lecture de la légende plus aisée. Cette méthode convient bien dans les cas d'une distribution uniforme. Toutes les valeurs de la série statistique ont la même fréquence d'apparition. Elle est facile à construire, la légende est simple. Mais, les distributions uniformes sont rares et cette méthode ne convient absolument pas pour les distributions dissymétriques. Enfin, elle n'assure pas de comparaison avec d'autres cartes. La discrétisation en effectifs égaux ou quantiles construit des classes dans lesquelles il y a le même nombre d'individus statistiques. Elle consiste à diviser le nombre d'individus par le nombre de classes souhaité. Cette méthode accorde une place au rang dans la série statistique. Elle peut imposer des découpages qui regroupent dans une même classe des valeurs éloignées. Si le nombre de classe est pair, la médiane est la borne qui sépare les deux classes centrales. Si le nombre de classes est impair, la médiane est au milieu de la classe centrale. Les découpages les plus courants sont les quartiles. Quatre classes avec 25 % des effectifs chacune. Et les quintiles, cinq classes avec 20 % des effectifs. Cette méthode est adaptée à toutes les formes de distributions statistiques. Elle est construit une carte visuellement équilibrée. Elle permet une bonne comparaison entre différentes séries statistiques. En revanche, elle perd toute l'information sur l'allure de la distribution statistique. Les discontinuités de la distribution s'effacent avec cette méthode. Elle ne tient pas compte des valeurs exceptionnelles. L'image équilibrée qu'elle crée peut être trompeuse. La discrétisation standardisée se construit en considérant la moyenne et l'écart-type. Les valeurs sont classées selon leur écart à la moyenne, proportionnellement à l'écart-type. Suivant le nombre de classes, pair ou impair, la moyenne sera au milieu d'une classe, ou la limite entre deux classes. On peut par exemple définir six classes. Les bornes seront, dans ce cas là , la moyenne, la moyenne plus un écart-type, la moyenne plus deux écarts-types d'un côté. La moyenne moins un écart-type, la moyenne moins deux écarts-types de l'autre côté. Minimum et maximum de la série seront les bornes extrêmes. Cette méthode convient très bien pour les distributions statistiques normales, distributions statistiques centrées sur la valeur moyenne. Elle donne alors des classes assez homogènes et permet de situer les unités géographiques étudiées par rapport à cette moyenne. Lorsque cette méthode est retenue, il est souhaitable de préciser en légende la valeur de la moyenne et de l'écart-type. Cette discrétisation autorise la comparaison entre des configurations spatiales de différentes distributions. Mais, limite importante, cette méthode ne convient pas pour les distributions dissymétriques. La discrétisation selon la méthode de Jenks, proposée par Philcarto, permet d'obtenir des classes très proches de la forme de la distribution statistique en créant, par une procédure itérative, des classes les plus homogènes possibles, en minimisant la variance intraclasse et en maximisant la variance interclasses. Enfin, dernière méthode, la discrétisation avec une progression géométrique, qui est utilisée lorsque la distribution statistique est très dissymétrique. Les valeurs de la série sont transformées en logarithmes, une opération qu'il est aisé de faire dans Excel, avant de traiter la série dans Philcarto, où on choisira une méthode de discrétisation, le plus souvent un découpage en amplitude égale. Par exemple, dans le cas d'une dissymétrie à gauche, la transformation en logarithmes augmente l'intervalle entre les faibles valeurs, atténuent leur concentration, et permet alors un découpage plus fin de ces faibles valeurs. Il ne faut pas oublier de porter en légende les valeurs réelles, et non les valeurs transformées. Pour arrêter votre choix entre les différentes méthodes, vous considérerez en premier lieu la forme de la distribution statistique et la destination de la carte. S'agit-il d'une carte qui restera isolée, ou s'agit-il d'une carte qui sera comparée à d'autres? La mise en carte du tableau de données nécessite une réduction de l'information. Celle-ci doit être raisonnée. Comme nous venons de le voir, selon les formes de la distribution statistique, chaque méthode a ses avantages et ses inconvénients. Du côté de la statistique, on cherchera à perdre le moins possible d'informations, et surtout à respecter la forme de la distribution, et à mettre en valeur les particularités, les discontinuités, les valeurs exceptionnelles. Du côté de la cartographie, on cherchera à créer une image simple et mémorisable, ainsi qu'à construire une carte harmonieuse, visuellement équilibrée. Le logiciel Philcarto permet une comparaison rapide des résultats cartographiques obtenus selon diverses méthodes de discrétisation, et assure ainsi un choix préservant au mieux la géographie du phénomène représenté. Mais, il ne faut pas oublier qu'aucune méthode n'est parfaite. Une carte choroplèthe est toujours un compromis entre cartographie et statistique.