Les SIG (Systèmes d’Information Géographique) dans le cadre cancer-environnement

Quand la géomatique rencontre la santé publique

Le saviez-vous ?

Le sigle SIG signifie Systèmes d’Information Géographique et désigne un ensemble organisé de ressources permettant de collecter, stocker et traiter de l’information géographique.

La discipline liée aux SIG, la géomatique, n’existe que depuis la fin du XXème siècle. En revanche, l’usage de cartes à des fins d’analyse dans le domaine médical est répandu depuis le XIXème siècle.

Les SIG sont très utilisés en santé publique, notamment pour le suivi des épidémies.

Dans le cadre de l’étude des cancers, les SIG peuvent servir aussi bien à (faire) visualiser simplement des informations qu’à réaliser des traitements analytiques complexes.

Les progrès technologiques, la massification et la diversification de la production de données spatialisées et leur plus grande accessibilité sont amenés à décupler l’intérêt et donc l’exploitation des données géographiques dans le futur

Présentation

Les Systèmes d’Information Géographiques, dits SIG, sont souvent connus (lorsqu’ils le sont !) par le biais des logiciels du même nom. Ils ne se résument pourtant pas uniquement à cela et sont constitués de diverses ressources matérielles et logicielles (satellites, ordinateurs…), mais également humaines et organisationnelles (personnel, connaissances techniques…).

Apparus sous leur forme actuelle dans les années 1960, ils prennent la suite d’un historique d’utilisation de la cartographie à des fins d’analyse remontant au XIXème siècle dans le domaine médical.

Répandus dans le quotidien moderne (par exemple, avec l’incorporation de la technologie GPS (Global Positioning System) dans nos smartphones), ils sont également très utilisés dans un cadre de santé publique, à des fins de suivi épidémique, de communication…

Dans le cadre de l’étude des liens entre cancers et environnement, ils peuvent par exemple être employés pour observer le lien entre la distribution à l’échelle des régions, cantons ou même quartiers des cas de cancers et un autre phénomène (par exemple : obésité, niveau de pollution, taux de réussite aux examens, nombre de professionnels de santé…), ou pour des traitements géostatistiques plus poussés comme le krigeage (une technique d’interpolation spatiale).

Leur usage est amené à se développer encore davantage au fil des progrès technologiques.

(Barrett 2000, 2002 ; Cromley, 2019 ; Fletcher-Lartey, 2016 ; Franch-Pardo, 2021 ; Goodchild 1992, 2009 ; Harley, 1987-[2027] ; Joliveau 1996, 2020 ; McLeod, 2000 ; Musa, 2013 ; Occelli 2013 ; Sahar, 2019 ; Schootman, 2017 ; Wang, 2019)

  • Définitions

    Le sigle « SIG » se retrouve souvent employé indifféremment en lieu et place de trois notions liées mais distinctes :

    Les Systèmes d’Information Géographique

    Ce nom désigne un ensemble organisé de ressources permettant de collecter, stocker et traiter de l’information géographique. On y classe bien sûr les ressources matérielles (serveurs, satellites…) et logicielles, mais également des ressources humaines et organisationnelles (personnel, règles de structuration intra-entreprises…) (Joliveau, 1996 ; Sahar, 2019). Ce sont les SIG au sens strict. De nos jours, ils impliquent quasiment systématiquement le recours à l’informatique ; mais ils pourraient théoriquement s’en passer (par exemple, méthode de superposition et d’analyse créée par Ian McHarg, illustrée ci-dessous ; Joliveau 1996). Les SIG recourant de façon importante à des outils (de visualisation, d’édition…) ou à des données en lignes sont souvent appelés WebSIG.

    Figure 1. Carte de Ian McHarg et ses élèves expliquant la méthode dite layer-cake, détaillée dans l’ouvrage Design with Nature en 1969

    Figure 1. Carte de Ian McHarg et ses élèves expliquant la méthode dite « layer-cake », détaillée dans l’ouvrage « Design with Nature » en 1969. La cartographie est réalisée en superposant les représentations des données, permettant ainsi la constitution d’une image où les thématiques d’intérêt sont analysables comme un tout © Metropolis Magazine avec l’aimable autorisation de l’Université de Pennsylvanie (Architectural Archives)

    Les logiciels (Web)SIG :

    Ce sont des logiciels adaptés à une utilisation sur des données spatialisées, qui sont donc très souvent présents dans un Système d’Information Géographique. On désigne généralement par ce nom des logiciels métier dédiés à la manipulation et à la visualisation de données géographiques (par exemple, QGIS, logiciel spécialisé pour la cartographie et les géotraitements) ;  mais le terme est parfois employé pour des outils « grand public » (par exemple Mappilary, permettant le partage de photographies géolocalisées) ou des fonctions natives ou étendues de langages et outils professionnels mais généralistes (par exemple, extension PostGIS du SGBD PostgreSQL pour le stockage et la manipulation de données géographiques, librairie Javascript Leaflet pour la réalisation de cartes interactives) (Harley,  1987-[2027]).

    Les Sciences de l’Information Géographique (acronyme alternatif : ScIG)

    La définition la plus couramment acceptée des ScIG stipule qu’elles ont trait à l’étude systématique de la nature et des propriétés de l’information géographique (Goodchild, 1992). Cela dit, les contours exacts de cette discipline et son équivalence/recouvrement avec d’autres (sciences de l’information, géomatique…) ne font pas complètement consensus. On préfèrera donc ici rattacher l’usage des SIG à la géomatique (mot-valise issu des termes géographie et informatique). Il s’agit de la discipline s’intéressant aux méthodes et outils permettant de gérer des données spatialisées. Autrement dit, toute technique ou activité permettant de recueillir, d’analyser ou de diffuser des données pouvant être localisées dans l’espace (qu’elles aient ou non une réalité physique) pourra être rattachée à cette discipline. Les personnes travaillant dans ce domaine sont appelées géomaticiens/géomaticiennes, ou plus rarement sigistes. Selon les estimations, 55 à 80 % de ce qui nous entoure pourrait être associé à une position sur la Terre, donc être considéré comme de l’information géographique, on comprend donc que la géomatique peut se retrouver dans une grande variété de domaines : transports, écologie, défense, santé… (Occelli 2013)

  • Un peu d'Histoire

    La présomption d’un lien entre santé et environnement et la conscience que certaines maladies peuvent être plus ou moins répandues selon les zones géographiques, remontent aux balbutiements de la médecine. En Occident, Hippocrate devisait déjà sur les « maladies particulières à la localité » au Vème siècle avant Jésus Christ. La structuration de ces questions de façon plus scientifique a émergé au XVIIIème siècle, avec l’apparition en France du terme de « géographie médicale » (1er emploi connu par Dehorne, en 1784) puis la réalisation de la 1ère carte mondiale des maladies humaines par l’allemand Finke en 1792 (Barrett, 2000, 2002 ; Musa, 2013). L’utilisation de cartes dans le cadre médical à un usage d’analyse et non plus simplement descriptif – marquant, par la même occasion, la naissance de l’épidémiologie moderne – a eu lieu lors des épidémies de choléra en Angleterre au XIXème siècle (exemple ci-dessous : carte de Leeds en 1842, commandée dans le cadre d’un rapport examinant la situation sanitaire de la population ouvrière de Grande Bretagne). L’exemple le plus connu (McLeod, 2000) est celui du médecin John Snow [1813-1858], qui aurait démontré, en examinant la répartition spatiale des cas et des pompes, que l’épidémie de choléra ravageant Londres en 1854 avait pour origine l’eau de certaines pompes spécifiques de la ville. Ce type d’usage s’est ensuite formalisé puis développé à la fin du XIXème – début du XXème siècle.

    Figure 2. Extrait et légende d'une carte de Leeds de 1842 par Robert Baker, sur laquelle sont représentées conjointement des informations d’ordre sanitaire

    Figure 2. Extrait et légende d’une carte de Leeds de 1842 par Robert Baker, sur laquelle sont représentées conjointement des informations d’ordre sanitaire (quartiers touchés par le choléra et d’autres maladies contagieuses ; endroits de la ville les moins nettoyés) et socio-économique (classes sociales majoritaires ; localisation des usines/fabriques) © Cornell University – PJ Mode Collection of Persuasive Cartography

    Cette même période voit également l’apparition d’une nouveauté qui révolutionnera notre perception de l’espace : la photographie aérienne. D’abord prises par des biais désormais incongrus (montgolfières, cerfs-volants…), ces photographies sont pour la première fois capturées depuis un avion en 1909 – une technique toujours largement utilisée de nos jours.

    La géomatique à proprement parler n’a émergé qu’aux débuts de l’informatique, dans la deuxième moitié du XXème siècle (Harley, 1987-[2027] ; Joliveau, 2020). Hӓgerstrand serait le premier, au début des années 1950, à utiliser une machine mécanographique pour réaliser des calculs statistiques impliquant des coordonnées géographiques. Garrison introduit à la fin des années 1950 l’usage de l’ordinateur « moderne » dans le domaine des statistiques spatiales ; et Tobler y ajoute en 1959 une dimension cartographique – de façon plus conceptuelle que pratique, les capacités graphiques des ordinateurs de l’époque étant rudimentaires. C’est en 1962 que le premier Système d’Information Géographique est conçu – et le terme SIG créé, par la même occasion – avec la réalisation, sous l’impulsion de Tomlinson, d’une base de données cartographique qui deviendra le Canada Geographic Information System (CGIS). Les premiers logiciels généralistes de cartographie et d’analyse spatiale (par exemple, Synagraphic mapping program SYMAP) connaîtront une diffusion mondiale dans les années 1970, suite à leur développement par l’équipe de Fisher au Laboratory of Computer Graphics d’Harvard. Mais la géomatique en tant que discipline ne prend vraiment forme qu’une ou deux décennies plus tard, lorsque ses membres décident, vers 1980 au Québec, de réutiliser un terme utilisé pour nommer en 1971 une commission permanente du Comité central des travaux géographiques français dont Dubuisson décrit ainsi l’objet en 1975 : «  Le développement des fichiers informatiques généraux a fait apparaître le besoin d’une localisation géographique des évènements qui servent de base commune à tous ces fichiers ; c’est l’une des réalisations essentielles de cette discipline nouvelle que l’on appelle GEOMATIQUE ». (Joliveau 2020)

    Aujourd’hui, la géomatique est couramment utilisée dans un cadre de santé publique, pour des questions allant du suivi des phénomènes temporaires comme les pics épidémiques (la crise COVID-19, récemment, en a été un bon exemple) au traitement de questions « de fond » comme l’étude de l’équitabilité (ou non) de la répartition des hôpitaux sur un territoire. (Cromley, 2019 ; Fletcher-Lartey, 2016 ; Franch-Pardo, 2021 ;  Schootman, 2017 ; Wang, 2019)

  • Les SIG dans le cadre des liens entre cancers et environnement : exemples d’usages au Centre Léon Bérard

    L’étude des liens entre cancers et environnement est un vaste sujet, même en se limitant aux recherches requérant l’usage de SIG. On peut schématiquement l’envisager sur deux niveaux.

    • Un niveau « global/populationnel », dont les questionnements vont souvent avoir une coloration SHS assez marquée. Ainsi, on s’intéressera plutôt aux éventuelles sur/sous représentations de cancers à un endroit donné ; et aux caractéristiques remarquables de l’environnement à cet endroit-là, s’il y en a : région économiquement défavorisée, présence d’industries polluantes.
    Figure 3. Carte des disparités de mortalité dûe au cancer entre zones rurales et urbaines visualisable sur un des sites du National Health Institute américain © NIH

    Figure 3. Carte des disparités de mortalité dûe au cancer entre zones rurales et urbaines visualisable sur un des sites du National Health Institute américain © NIH

    • Un niveau « individuel » s’intéressant à la compréhension plus fine des phénomènes. Nous travaillons le plus souvent, au département Prévention Cancer Environnement, à ce niveau davantage « individu-centré ». Dans ce cadre, la question à composante spatiale la plus courante est le fait de s’interroger sur la localisation de personnes (témoins ou malades) par rapport à celle de facteurs suspectés de favoriser la survenue de cancers, afin d’en déduire leur niveau d’exposition à ces facteurs. Une fois cette information obtenue, il est alors possible d’explorer plus en détail cette éventuelle concordance spatiale pour étudier si un lien de causalité entre le facteur suspecté et le cancer peut être établi.

    En dehors de ces cas types, on peut également utiliser les SIG à des fins de prévention primaire, pour de la communication graphique ou l’établissement d’itinéraires à parcourir pour des opérations de sensibilisation ; de manière exploratoire, pour visualiser la répartition des cancers et voir s’il existe des regroupements de cas qui nécessiteraient d’être étudiés de plus près… (Fletcher-Lartey, 2016 ; Occelli, 2013 ; Sahar, 2019 ; Schootman, 2017)

    Les principaux outils et techniques utilisés au département Prévention Cancer Environnement du Centre Léon Bérard sont listés ci-après.

    La gestion et la mise en forme de données spatialisées

    Afin de manipuler et partager plus aisément les données spatialisées, il est nécessaire de les ordonner et de les stocker de façon cohérente, à l’aide de SGBD notamment. Les étapes consistant à identifier les données, les organiser de façon logique, les documenter, etc, bien qu’« invisibles » en externe, représentent en interne une part non négligeable du travail.

    Les traitements et analyses géostatistiques

    Il en existe autant que de questions de recherche : interpolation spatiale pour pallier à un manque de données dans une zone ; croisement de données spatialisées pour créer des indices comparables dans le temps et l’espace… Ils peuvent, selon les besoins et les compétences, être réalisés avec des logiciels généralistes ou des logiciels spécialisés SIG.

    La classification d’images

    Pour certains facteurs potentiellement cancérogènes, notamment les pesticides, il n’existe pas de données de référence donnant « clefs en main » la localisation spatiale du facteur suspecté. On déduit alors la présence probable du facteur de l’occupation et/ou usage du sol (par exemple les grandes cultures). Ceux-ci ne sont disponibles sous forme de données de référence que depuis les années 1990-2000 environ (par exemple la base OCS GE [OCcupation du Sol à Grande Échelle] de l’IGN). C’est insuffisant dans le cas des cancers, ceux-ci apparaissant parfois des décennies après l’exposition à un facteur de risque. Pour le reste du XXème siècle, il est donc nécessaire de déduire l’occupation du sol par photo-interprétation depuis des images aériennes, par délimitation manuelle ou à l’aide d’algorithmes de traitements d’images.

    Le géoréférencement et l’orthorectification

    Ces opérations sont usuellement réalisées conjointement et sont bien souvent complémentaires à la précédente. En effet, les images aériennes anciennes ne sont généralement pas associées à des coordonnées géographiques. Pour pouvoir croiser les informations qu’elles renferment avec d’autres données spatialisées, il convient d’affecter à l’image des coordonnées géographiques : c’est ce que l’on nomme le géoréférencement. De plus, les images aériennes capturent en 2D un territoire en 3D – occasionnant au passage des déformations. Pour se rapprocher de la réalité, il est ainsi nécessaire de corriger les effets de la perspective et du relief sur la représentation 2D : c’est ce que l’on appelle l’orthorectification.

    Le géocodage

    Il s’agit d’une opération consistant à retrouver, à partir d’une adresse textuelle et d’une base de données de référence, les coordonnées géographiques d’un point. Elle est très utilisée pour comparer la localisation des habitations ou des lieux de travail des témoins/malades avec la localisation de facteurs de risques potentiels (par exemple le radon).

    Figure 4. Outils de géocodage en ligne Mes adresses © IGN (Institut national de l’information géographique et forestière)

    Figure 4. Outils de géocodage en ligne Mes adresses © IGN (Institut national de l’information géographique et forestière)

    Les interfaces de visualisation web ou les sorties graphiques

    Évidemment, la réalisation de visuels depuis un logiciel de cartographie, notamment à des fins de communication au grand public, est sans doute la première chose qui vient à l’esprit quand on parle de SIG. Mais comme vous pouvez le voir aux éléments listés ci-dessus, elle ne constitue que la partie émergée de l’iceberg !

  • Et demain ?

    Le passage du temps va modifier notre rapport à certaines technologies (relativement) récentes. (Sahar, 2019 ; Schootman, 2017), notamment dans le cadre des études menées au CLB.

    De fait, certaines avancées de la deuxième moitié du XXème siècle, comme les images satellites (dont les débuts remontent aux années 1970) ou le LiDAR (light detection and ranging ou laser imaging detection and ranging ; une technique semblable au principe du radar mais utilisant des ondes lumineuses et non radio, apparue dans les années 1960 mais dont l’usage n’a commencé à se répandre que dans les années 1990) ne peuvent pas encore être utilisées de façon routinière dans le cas des recherches sur les cancers. Le long temps de latence de la plupart des cancers implique en effet de recueillir des informations et des données antérieures à 1960, et ne bénéficiant donc pas des « dernières » avancées technologiques. Or, avec les années, de plus en plus de personnes incluses dans des études seront nées après 1960 – permettant ainsi la levée des limites liées aux temps de développement des cancers.

    D’une manière plus générale, il est probable que l’usage des SIG évolue dans tous les domaines grâce à la démocratisation progressive des ressources logicielles, matérielles et informationnelles (données, formations) disponibles.

    Cette « démocratisation » se manifeste en 1er lieu au niveau matériel : les ordinateurs accessibles dans le domaine civil sont maintenant suffisamment puissants pour pouvoir manipuler de larges volumes de données. L’une des évolutions attendue est une émergence de plus en plus forte de recherches faisant appel à de la 3D (Goodchild, 2009) – par exemple, on peut imaginer modéliser plus finement la dispersion de polluants par le vent en tenant mieux compte des obstacles grâce à la 3D. Il s’agit donc de faire le chemin cartographique « à rebours » : après avoir trouvé le moyen de représenter sur une surface plane une réalité en 3D, le défi est maintenant d’arriver à penser en 3D des recherches habituellement menées en 2D.

    On peut également percevoir cette tendance à l’« ouverture » sur un plan plus humain et légal. La tendance (en France tout du moins) est en effet de rendre de plus en plus de données géographiques publiques et libres d’usage. Ainsi, l’IGN a ouvert courant 2021 l’accès à de nombreuses données auparavant payantes. Parallèlement, l’État encourage ses administrations publiques à utiliser des logiciels libres, y compris dans le cas des logiciels SIG – contribuant ainsi à les rendre plus visibles. Et qui dit plus de ressources accessibles et des logiciels plus interopérables, dit bien sûr plus de possibilité de collaborations et plus de recherches basées sur les données spatiales possibles… (Goodchild, 2009 ; Fletcher-Lartey, 2016)

Auteur : Annabelle Sueur, Géomaticienne, Département Prévention Cancer Environnement, Centre Léon Bérard

Relecture : Lény Grassot, Chercheur en Géomatique, Centre Léon Bérard

Mise à jour le 23 nove. 2023

Mais aussi...

Une question, un avis ?

Ce formulaire vous permet de contacter le Département Prévention Cancer Environnement. Nous veillerons à vous répondre dans les meilleurs délais.

Contactez-nous !

Ce contenu vous a été utile ?