Les SIG (Systèmes d’Information Géographique) dans le cadre cancer-environnement
Quand la géomatique rencontre la santé publique
Le saviez-vous ?
Le sigle SIG signifie Systèmes d’Information Géographique et désigne un ensemble organisé de ressources permettant de collecter, stocker et traiter de l’information géographique.
La discipline liée aux SIG, la géomatique, n’existe que depuis la fin du XXème siècle. En revanche, l’usage de cartes à des fins d’analyse dans le domaine médical est répandu depuis le XIXème siècle.
Les SIG sont très utilisés en santé publique, notamment pour le suivi des épidémies.
Dans le cadre de l’étude des cancers, les SIG peuvent servir aussi bien à (faire) visualiser simplement des informations qu’à réaliser des traitements analytiques complexes.
Les progrès technologiques, la massification et la diversification de la production de données spatialisées et leur plus grande accessibilité sont amenés à décupler l’intérêt et donc l’exploitation des données géographiques dans le futur
Les Systèmes d’Information Géographiques, dits SIG, sont souvent connus (lorsqu’ils le sont !) par le biais des logiciels du même nom. Ils ne se résument pourtant pas uniquement à cela et sont constitués de diverses ressources matérielles et logicielles (satellites, ordinateurs…), mais également humaines et organisationnelles (personnel, connaissances techniques…).
Apparus sous leur forme actuelle dans les années 1960, ils prennent la suite d’un historique d’utilisation de la cartographie à des fins d’analyse remontant au XIXème siècle dans le domaine médical.
Répandus dans le quotidien moderne (par exemple, avec l’incorporation de la technologie GPS (Global Positioning System) dans nos smartphones), ils sont également très utilisés dans un cadre de santé publique, à des fins de suivi épidémique, de communication…
Dans le cadre de l’étude des liens entre cancers et environnement, ils peuvent par exemple être employés pour observer le lien entre la distribution à l’échelle des régions, cantons ou même quartiers des cas de cancers et un autre phénomène (par exemple : obésité, niveau de pollution, taux de réussite aux examens, nombre de professionnels de santé…), ou pour des traitements géostatistiques plus poussés comme le krigeage (une technique d’interpolation spatiale).
Leur usage est amené à se développer encore davantage au fil des progrès technologiques.
Le sigle « SIG » se retrouve souvent employé indifféremment en lieu et place de trois notions liées mais distinctes :
Les Systèmes d’Information Géographique
Ce nom désigne un ensemble organisé de ressources permettant de collecter, stocker et traiter de l’information géographique. On y classe bien sûr les ressources matérielles (serveurs, satellites…) et logicielles, mais également des ressources humaines et organisationnelles (personnel, règles de structuration intra-entreprises…) (Joliveau, 1996 ; Sahar, 2019). Ce sont les SIG au sens strict. De nos jours, ils impliquent quasiment systématiquement le recours à l’informatique ; mais ils pourraient théoriquement s’en passer (par exemple, méthode de superposition et d’analyse créée par Ian McHarg, illustrée ci-dessous ; Joliveau 1996). Les SIG recourant de façon importante à des outils (de visualisation, d’édition…) ou à des données en lignes sont souvent appelés WebSIG.
Ce sont des logiciels adaptés à une utilisation sur des données spatialisées, qui sont donc très souvent présents dans un Système d’Information Géographique. On désigne généralement par ce nom des logiciels métier dédiés à la manipulation et à la visualisation de données géographiques (par exemple, QGIS, logiciel spécialisé pour la cartographie et les géotraitements) ; mais le terme est parfois employé pour des outils « grand public » (par exemple Mappilary, permettant le partage de photographies géolocalisées) ou des fonctions natives ou étendues de langages et outils professionnels mais généralistes (par exemple, extension PostGIS du SGBD PostgreSQL pour le stockage et la manipulation de données géographiques, librairie Javascript Leaflet pour la réalisation de cartes interactives) (Harley, 1987-[2027]).
Les Sciences de l’Information Géographique (acronyme alternatif : ScIG)
La définition la plus couramment acceptée des ScIG stipule qu’elles ont trait à l’étude systématique de la nature et des propriétés de l’information géographique (Goodchild, 1992). Cela dit, les contours exacts de cette discipline et son équivalence/recouvrement avec d’autres (sciences de l’information, géomatique…) ne font pas complètement consensus. On préfèrera donc ici rattacher l’usage des SIG à la géomatique (mot-valise issu des termes géographie et informatique). Il s’agit de la discipline s’intéressant aux méthodes et outils permettant de gérer des données spatialisées. Autrement dit, toute technique ou activité permettant de recueillir, d’analyser ou de diffuser des données pouvant être localisées dans l’espace (qu’elles aient ou non une réalité physique) pourra être rattachée à cette discipline. Les personnes travaillant dans ce domaine sont appelées géomaticiens/géomaticiennes, ou plus rarement sigistes. Selon les estimations, 55 à 80 % de ce qui nous entoure pourrait être associé à une position sur la Terre, donc être considéré comme de l’information géographique, on comprend donc que la géomatique peut se retrouver dans une grande variété de domaines : transports, écologie, défense, santé… (Occelli 2013)
Un peu d'Histoire
La présomption d’un lien entre santé et environnement et la conscience que certaines maladies peuvent être plus ou moins répandues selon les zones géographiques, remontent aux balbutiements de la médecine. En Occident, Hippocrate devisait déjà sur les « maladies particulières à la localité » au Vème siècle avant Jésus Christ. La structuration de ces questions de façon plus scientifique a émergé au XVIIIème siècle, avec l’apparition en France du terme de « géographie médicale » (1er emploi connu par Dehorne, en 1784) puis la réalisation de la 1ère carte mondiale des maladies humaines par l’allemand Finke en 1792 (Barrett, 2000, 2002 ; Musa, 2013). L’utilisation de cartes dans le cadre médical à un usage d’analyse et non plus simplement descriptif – marquant, par la même occasion, la naissance de l’épidémiologie moderne – a eu lieu lors des épidémies de choléra en Angleterre au XIXème siècle (exemple ci-dessous : carte de Leeds en 1842, commandée dans le cadre d’un rapport examinant la situation sanitaire de la population ouvrière de Grande Bretagne). L’exemple le plus connu (McLeod, 2000) est celui du médecin John Snow [1813-1858], qui aurait démontré, en examinant la répartition spatiale des cas et des pompes, que l’épidémie de choléra ravageant Londres en 1854 avait pour origine l’eau de certaines pompes spécifiques de la ville. Ce type d’usage s’est ensuite formalisé puis développé à la fin du XIXème – début du XXème siècle.
Cette même période voit également l’apparition d’une nouveauté qui révolutionnera notre perception de l’espace : la photographie aérienne. D’abord prises par des biais désormais incongrus (montgolfières, cerfs-volants…), ces photographies sont pour la première fois capturées depuis un avion en 1909 – une technique toujours largement utilisée de nos jours.
La géomatique à proprement parler n’a émergé qu’aux débuts de l’informatique, dans la deuxième moitié du XXème siècle (Harley, 1987-[2027] ; Joliveau, 2020). Hӓgerstrand serait le premier, au début des années 1950, à utiliser une machine mécanographique pour réaliser des calculs statistiques impliquant des coordonnées géographiques. Garrison introduit à la fin des années 1950 l’usage de l’ordinateur « moderne » dans le domaine des statistiques spatiales ; et Tobler y ajoute en 1959 une dimension cartographique – de façon plus conceptuelle que pratique, les capacités graphiques des ordinateurs de l’époque étant rudimentaires. C’est en 1962 que le premier Système d’Information Géographique est conçu – et le terme SIG créé, par la même occasion – avec la réalisation, sous l’impulsion de Tomlinson, d’une base de données cartographique qui deviendra le Canada Geographic Information System (CGIS). Les premiers logiciels généralistes de cartographie et d’analyse spatiale (par exemple, Synagraphic mapping program SYMAP) connaîtront une diffusion mondiale dans les années 1970, suite à leur développement par l’équipe de Fisher au Laboratory of Computer Graphics d’Harvard. Mais la géomatique en tant que discipline ne prend vraiment forme qu’une ou deux décennies plus tard, lorsque ses membres décident, vers 1980 au Québec, de réutiliser un terme utilisé pour nommer en 1971 une commission permanente du Comité central des travaux géographiques français dont Dubuisson décrit ainsi l’objet en 1975 : « Le développement des fichiers informatiques généraux a fait apparaître le besoin d’une localisation géographique des évènements qui servent de base commune à tous ces fichiers ; c’est l’une des réalisations essentielles de cette discipline nouvelle que l’on appelle GEOMATIQUE ». (Joliveau 2020)
Aujourd’hui, la géomatique est couramment utilisée dans un cadre de santé publique, pour des questions allant du suivi des phénomènes temporaires comme les pics épidémiques (la crise COVID-19, récemment, en a été un bon exemple) au traitement de questions « de fond » comme l’étude de l’équitabilité (ou non) de la répartition des hôpitaux sur un territoire. (Cromley, 2019 ; Fletcher-Lartey, 2016 ; Franch-Pardo, 2021 ; Schootman, 2017 ; Wang, 2019)
Les SIG dans le cadre des liens entre cancers et environnement : exemples d’usages au Centre Léon Bérard
L’étude des liens entre cancers et environnement est un vaste sujet, même en se limitant aux recherches requérant l’usage de SIG. On peut schématiquement l’envisager sur deux niveaux.
Un niveau « global/populationnel », dont les questionnements vont souvent avoir une coloration SHS assez marquée. Ainsi, on s’intéressera plutôt aux éventuelles sur/sous représentations de cancers à un endroit donné ; et aux caractéristiques remarquables de l’environnement à cet endroit-là, s’il y en a : région économiquement défavorisée, présence d’industries polluantes.
Un niveau « individuel » s’intéressant à la compréhension plus fine des phénomènes. Nous travaillons le plus souvent, au département Prévention Cancer Environnement, à ce niveau davantage « individu-centré ». Dans ce cadre, la question à composante spatiale la plus courante est le fait de s’interroger sur la localisation de personnes (témoins ou malades) par rapport à celle de facteurs suspectés de favoriser la survenue de cancers, afin d’en déduire leur niveau d’exposition à ces facteurs. Une fois cette information obtenue, il est alors possible d’explorer plus en détail cette éventuelle concordance spatiale pour étudier si un lien de causalité entre le facteur suspecté et le cancer peut être établi.
En dehors de ces cas types, on peut également utiliser les SIG à des fins de prévention primaire, pour de la communication graphique ou l’établissement d’itinéraires à parcourir pour des opérations de sensibilisation ; de manière exploratoire, pour visualiser la répartition des cancers et voir s’il existe des regroupements de cas qui nécessiteraient d’être étudiés de plus près… (Fletcher-Lartey, 2016 ; Occelli, 2013 ; Sahar, 2019 ; Schootman, 2017)
Les principaux outils et techniques utilisés au département Prévention Cancer Environnement du Centre Léon Bérard sont listés ci-après.
La gestion et la mise en forme de données spatialisées
Afin de manipuler et partager plus aisément les données spatialisées, il est nécessaire de les ordonner et de les stocker de façon cohérente, à l’aide de SGBD notamment. Les étapes consistant à identifier les données, les organiser de façon logique, les documenter, etc, bien qu’« invisibles » en externe, représentent en interne une part non négligeable du travail.
Les traitements et analyses géostatistiques
Il en existe autant que de questions de recherche : interpolation spatiale pour pallier à un manque de données dans une zone ; croisement de données spatialisées pour créer des indices comparables dans le temps et l’espace… Ils peuvent, selon les besoins et les compétences, être réalisés avec des logiciels généralistes ou des logiciels spécialisés SIG.
La classification d’images
Pour certains facteurs potentiellement cancérogènes, notamment les pesticides, il n’existe pas de données de référence donnant « clefs en main » la localisation spatiale du facteur suspecté. On déduit alors la présence probable du facteur de l’occupation et/ou usage du sol (par exemple les grandes cultures). Ceux-ci ne sont disponibles sous forme de données de référence que depuis les années 1990-2000 environ (par exemple la base OCS GE [OCcupation du Sol à Grande Échelle] de l’IGN). C’est insuffisant dans le cas des cancers, ceux-ci apparaissant parfois des décennies après l’exposition à un facteur de risque. Pour le reste du XXème siècle, il est donc nécessaire de déduire l’occupation du sol par photo-interprétation depuis des images aériennes, par délimitation manuelle ou à l’aide d’algorithmes de traitements d’images.
Le géoréférencement et l’orthorectification
Ces opérations sont usuellement réalisées conjointement et sont bien souvent complémentaires à la précédente. En effet, les images aériennes anciennes ne sont généralement pas associées à des coordonnées géographiques. Pour pouvoir croiser les informations qu’elles renferment avec d’autres données spatialisées, il convient d’affecter à l’image des coordonnées géographiques : c’est ce que l’on nomme le géoréférencement. De plus, les images aériennes capturent en 2D un territoire en 3D – occasionnant au passage des déformations. Pour se rapprocher de la réalité, il est ainsi nécessaire de corriger les effets de la perspective et du relief sur la représentation 2D : c’est ce que l’on appelle l’orthorectification.
Le géocodage
Il s’agit d’une opération consistant à retrouver, à partir d’une adresse textuelle et d’une base de données de référence, les coordonnées géographiques d’un point. Elle est très utilisée pour comparer la localisation des habitations ou des lieux de travail des témoins/malades avec la localisation de facteurs de risques potentiels (par exemple le radon).
Les interfaces de visualisation web ou les sorties graphiques
Évidemment, la réalisation de visuels depuis un logiciel de cartographie, notamment à des fins de communication au grand public, est sans doute la première chose qui vient à l’esprit quand on parle de SIG. Mais comme vous pouvez le voir aux éléments listés ci-dessus, elle ne constitue que la partie émergée de l’iceberg !
Et demain ?
Le passage du temps va modifier notre rapport à certaines technologies (relativement) récentes. (Sahar, 2019 ; Schootman, 2017), notamment dans le cadre des études menées au CLB.
De fait, certaines avancées de la deuxième moitié du XXème siècle, comme les images satellites (dont les débuts remontent aux années 1970) ou le LiDAR (light detection and ranging ou laser imaging detection and ranging ; une technique semblable au principe du radar mais utilisant des ondes lumineuses et non radio, apparue dans les années 1960 mais dont l’usage n’a commencé à se répandre que dans les années 1990) ne peuvent pas encore être utilisées de façon routinière dans le cas des recherches sur les cancers. Le long temps de latence de la plupart des cancers implique en effet de recueillir des informations et des données antérieures à 1960, et ne bénéficiant donc pas des « dernières » avancées technologiques. Or, avec les années, de plus en plus de personnes incluses dans des études seront nées après 1960 – permettant ainsi la levée des limites liées aux temps de développement des cancers.
D’une manière plus générale, il est probable que l’usage des SIG évolue dans tous les domaines grâce à la démocratisation progressive des ressources logicielles, matérielles et informationnelles (données, formations) disponibles.
Cette « démocratisation » se manifeste en 1er lieu au niveau matériel : les ordinateurs accessibles dans le domaine civil sont maintenant suffisamment puissants pour pouvoir manipuler de larges volumes de données. L’une des évolutions attendue est une émergence de plus en plus forte de recherches faisant appel à de la 3D (Goodchild, 2009) – par exemple, on peut imaginer modéliser plus finement la dispersion de polluants par le vent en tenant mieux compte des obstacles grâce à la 3D. Il s’agit donc de faire le chemin cartographique « à rebours » : après avoir trouvé le moyen de représenter sur une surface plane une réalité en 3D, le défi est maintenant d’arriver à penser en 3D des recherches habituellement menées en 2D.
On peut également percevoir cette tendance à l’« ouverture » sur un plan plus humain et légal. La tendance (en France tout du moins) est en effet de rendre de plus en plus de données géographiques publiques et libres d’usage. Ainsi, l’IGN a ouvert courant 2021 l’accès à de nombreuses données auparavant payantes. Parallèlement, l’État encourage ses administrations publiques à utiliser des logiciels libres, y compris dans le cas des logiciels SIG – contribuant ainsi à les rendre plus visibles. Et qui dit plus de ressources accessibles et des logiciels plus interopérables, dit bien sûr plus de possibilité de collaborations et plus de recherches basées sur les données spatiales possibles… (Goodchild, 2009 ; Fletcher-Lartey, 2016)
Nous utilisons des cookies sur notre site Web pour vous offrir l'expérience la plus pertinente en mémorisant vos préférences et en répétant vos visites. En cliquant sur "Accepter tout", vous consentez à l'utilisation de TOUS les cookies. Cependant, vous pouvez visiter les paramètres des cookies pour fournir un consentement contrôlé.
Ce site Web utilise des cookies pour améliorer votre expérience lorsque vous naviguez sur le site Web. Parmi ceux-ci, les cookies classés comme nécessaires sont stockés sur votre navigateur car ils sont essentiels au fonctionnement des fonctionnalités de base du site Web. Nous utilisons également des cookies tiers qui nous aident à analyser et à comprendre comment vous utilisez ce site Web. Ces cookies ne seront stockés dans votre navigateur qu'avec votre consentement. Vous avez également la possibilité de désactiver ces cookies. Mais la désactivation de certains de ces cookies peut affecter votre expérience de navigation.
Les cookies nécessaires sont absolument indispensables au bon fonctionnement du site. Cette catégorie comprend uniquement les cookies qui assurent les fonctionnalités de base et les fonctionnalités de sécurité du site Web. Ces cookies ne stockent aucune information personnelle.
Cookie
Durée
Description
cookielawinfo-checkbox-analytics
11 months
This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional
11 months
The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary
11 months
This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others
11 months
This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance
11 months
This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
JSESSIONID
session
The JSESSIONID cookie is used by New Relic to store a session identifier so that New Relic can monitor session counts for an application.
tarteaucitron
1 year
This cookie is used for saving the cookie preference of the visitor.
viewed_cookie_policy
11 months
The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.
Les cookies fonctionnels aident à exécuter certaines fonctionnalités telles que le partage du contenu du site Web sur les plateformes de médias sociaux, la collecte de commentaires et d'autres fonctionnalités tierces.
Cookie
Durée
Description
__cf_bm
30 minutes
This cookie, set by Cloudflare, is used to support Cloudflare Bot Management.
Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics the number of visitors, bounce rate, traffic source, etc.
Cookie
Durée
Description
_ga
2 years
The _ga cookie, installed by Google Analytics, calculates visitor, session and campaign data and also keeps track of site usage for the site's analytics report. The cookie stores information anonymously and assigns a randomly generated number to recognize unique visitors.
_ga_H6X209XB21
2 years
This cookie is installed by Google Analytics.
CONSENT
2 years
YouTube sets this cookie via embedded youtube-videos and registers anonymous statistical data.
sid
session
The sid cookie contains digitally signed and encrypted records of a user’s Google account ID and most recent sign-in time.
vuid
2 years
Vimeo installs this cookie to collect tracking information by setting a unique ID to embed videos to the website.
Les cookies publicitaires sont utilisés pour fournir aux visiteurs des publicités et des campagnes marketing pertinentes. Ces cookies suivent les visiteurs sur les sites Web et collectent des informations pour fournir des publicités personnalisées.
Cookie
Durée
Description
VISITOR_INFO1_LIVE
5 months 27 days
A cookie set by YouTube to measure bandwidth that determines whether the user gets the new or old player interface.
YSC
session
YSC cookie is set by Youtube and is used to track the views of embedded videos on Youtube pages.
yt-remote-connected-devices
never
YouTube sets this cookie to store the video preferences of the user using embedded YouTube video.
yt-remote-device-id
never
YouTube sets this cookie to store the video preferences of the user using embedded YouTube video.
yt.innertube::nextId
never
This cookie, set by YouTube, registers a unique ID to store data on what videos from YouTube the user has seen.
yt.innertube::requests
never
This cookie, set by YouTube, registers a unique ID to store data on what videos from YouTube the user has seen.