#actus : France Cohorte permet désormais le chaînage des données des cohortes avec celles du SNDS.
Glossaire
Ce glossaire classé par ordre alphabétique donne une définition des principaux termes utilisés au quotidien par les scientifiques et les équipes de France Cohortes. Il est enrichi et mis à jour régulièrement. Dernière mise à jour le 12/03/2024.
A
-
AIPD - analyse d'impact à la protection des données
L’AIPD est un outil qui permet de construire un traitement conforme au RGPD et respectueux de la vie privée, lorsqu’un traitement de données personnelles est susceptible d'engendrer un risque élevé pour les droits et libertés des personnes concernées.
Elle est obligatoire pour les traitements susceptibles d’engendrer des risques élevés. Elle est donc obligatoire pour toutes les cohortes souhaitant bénéficier des services de France Cohortes. C'est une obligation de fond s’imposant au responsable de traitement. Elle doit être achevée pour la mise en œuvre du traitement.
L'AIPD se décompose en trois parties :
- Une description détaillée du traitement mis en œuvre, comprenant tant les aspects techniques qu’opérationnels
- L’évaluation, de nature plus juridique, de la nécessité et de la proportionnalité concernant les principes et droits fondamentaux (finalité, données et durées de conservation, information et droits des personnes, etc.) non négociables, qui sont fixés par la loi et doivent être respectés, quels que soient les risques ;
- L’étude, de nature plus technique, des risques sur la sécurité des données (confidentialité, intégrité et disponibilité) ainsi que leurs impacts potentiels sur la vie privée, qui permet de déterminer les mesures techniques et organisationnelles nécessaires pour protéger les données.(en anglais : PIA pour privacy impact assessment)
-
Anonymisation
L'anonymisation est un traitement de données personnelles qui consiste à utiliser un ensemble de techniques de manière à rendre impossible, en pratique, toute réidentification de la personne, par quelque moyen que ce soit.
Le terme désidentification peut aussi être utilisé spécifiquement pour le cas des textes libres.
-
Archivage des données
L'archivage des données est une conservation à long terme des données de recherche pour assurer leur disponibilité future.
1) Archivage intermédiaire : Les données ne sont plus utilisées pour atteindre l'objectif fixé, mais présentent encore un intérêt administratif et/ou scientifique pour l'organisme, ou doivent être conservées pour répondre à une obligation légale. Consultation ponctuelle et motivée des données par des personnes spécifiquement habilitées. Il ne s’agit pas de conserver l’intégralité des données mais seulement celles qui sont indispensables ou requises par l’obligation légale.
Ces données ne peuvent plus être utilisées par les services opérationnels : elles sont désormais conservées dans un but précis et ne sont accessibles que de façon restreinte.2) Archivage définitif : En raison de leur "valeur" et intérêt, certaines informations sont archivées de manière définitive et pérenne. Ces données gardent un intérêt historique. Conditions fixées par le Code du patrimoine.
Le Service des Archives de France est en charge de cette mission.
-
Autorisation CNIL
L'autorisation CNIL est une formalité préalable au traitement des données à caractère personnel qui doit être soumise à la CNIL, Commission nationale informatique et liberté, si le traitement ne s'inscrit pas dans une procédure simplifiée. La CNIL a un délai de deux mois à compter de la réception de la demande pour se prononcer, sans laquelle la demande d'autorisation est réputée acceptée.
La CNIL peut, par décision unique, délivrer à un même responsable de traitement une autorisation pour des traitements répondant à une même finalité, portant sur des catégories de données identiques et ayant des catégories de destinataires identiques.
C
-
Centre participant
Un centre participant est un organisme détenant, collectant et/ou transmettant des données et/ou des échantillons biologiques utilisés dans le cadre de la recherche.
-
Certification
La certification concerne un produit (logiciel, matériel) ou une organisation. C’est une démarche qui permet d’attester que le produit et/ou l’organisation est robuste sur un périmètre donné. Il n’y a pas d’obligation légale à engager une certification.
La certification est donnée par un organisme indépendant tiers accrédité par le COFRAC (Comité Français d’Accréditation).
-
CESREES - Comité éthique et scientifique pour les recherches, les études et les évaluations dans le domaine de la santé
Le CESREES est chargé de rendre, avant l’autorisation de la CNIL, des avis sur les projets d’études n'impliquant pas la personne humaine nécessitant le recours à des données personnelles de santé.
-
Chaînage de données
Le chaînage des données est un procédé permettant de relier entre elles les données correspondant à un même individu. Le chaînage des données rend possible la mise en relation de différentes données se rattachant à un même individu et la réalisation de traitement de ces dernières.
-
CNIL - Commission nationale de l'informatique et libertés
La Commission nationale informatique et libertés est une autorité administrative indépendante créée par la loi Informatique et Libertés du 6 janvier 1978. Elle est chargée de veiller à la protection des données personnelles.
-
Cohorte
Une étude de cohorte, dans le contexte de la recherche en santé et en épidémiologie, se réfère à une étude répondant à une ou plusieurs questions de recherche précises et s'appuyant sur un groupe de personnes incluses sur la base d'un protocole connu et maitrisé. La cohorte est généralement constituée dans le but d'étudier l'incidence des maladies ou de suivre des résultats spécifiques sur une période de temps définie. Les membres d'une cohorte sont suivis longitudinalement afin d'observer et d'analyser l'évolution des événements au fil du temps.
Une étude de cohorte repose sur le respect d’un protocole préétabli, concernant d’une part la collecte d’informations et d’autre part, les modalités du suivi des participants (actif ou passif) qui permettent d’identifier la survenue des événements de santé d’intérêt.Il existe deux types principaux de cohortes :
1. Cohorte prospective : Les individus sont identifiés et suivis à partir d'un point temporel spécifique vers l'avant. Les données sont collectées à mesure que le temps avance, souvent à des intervalles réguliers, permettant aux chercheurs d'observer l'occurrence de maladies, de comportements ou d'autres événements au fil du temps.
2. Cohorte rétrospective : Les individus sont identifiés et les données sont recueillies à partir d'un point temporel antérieur. Cela implique souvent de rechercher des données historiques dans des archives médicales, des registres ou d'autres sources pour établir le statut d'exposition antérieur des individus.
Les cohortes sont utilisées pour étudier divers aspects de la santé, tels que l'identification des facteurs de risque pour certaines maladies, l'évaluation de l'efficacité des interventions médicales, et la compréhension des trajectoires de santé au fil du temps. Les études de cohorte sont considérées comme des approches puissantes pour évaluer la causalité dans les relations entre les expositions et les résultats, en raison de leur conception longitudinale et de leur capacité à suivre les participants sur une période prolongée.
-
Collecte de données
La collecte de données est un processus d'obtention active d'informations à partir de différentes sources conformément au protocole de recherche. Les sources sont issues de campagnes de questionnaires administrés à des volontaires ou à leur environnement (parent, médecins, etc.), issus d'extraction de matériel biologique (ex. génotypage, mesures biologiques, etc.), d'objets connectés, etc.
-
CPP - Comités de Protection des Personnes
Les comités de protection des personnes (CPP) sont chargés d’émettre un avis préalable sur les conditions de validité de toute recherche impliquant la personne humaine, au regard des critères définis par l’article L 1123-7 du Code de la Santé Publique (CSP).
D
-
Déclaration de conformité CNIL
La déclaration de conformité CNIL est une formalité préalable au traitement des données à caractère personnel. La CNIL élabore des référentiels et, pour la recherche, des méthodologies de référence. Dès lors que l’un de ces traitements (intérêt public ou recherche) est conforme, en tous points, à un référentiel ou à une MR élaborée par la CNIL, il peut être mis en œuvre, sans avoir besoin d’obtenir une autorisation, à la condition que le responsable de traitement adresse préalablement une déclaration attestant de cette conformité.
-
Destinataire de données
Le destinataire de données est une personne physique ou morale, l'autorité publique, le service ou tout autre organisme qui reçoit communication de données à caractère personnel, qu'il s'agisse ou non d'un tiers. Toutefois, les autorités publiques qui sont susceptibles de recevoir communication de données à caractère personnel dans le cadre d'une mission d'enquête particulière conformément au droit de l'Union ou au droit d'un État membre ne sont pas considérées comme des destinataires; le traitement de ces données par les autorités publiques en question est conforme aux règles applicables en matière de protection des données en fonction des finalités du traitement.
-
Donnée à caractère personnel
Une donnée à caractère personnel désigne toute information se rapportant à une personne vivante identifiée ou identifiable. Différentes informations, dont le regroupement permet d’identifier une personne en particulier, constituent également des données à caractère personnel.
Des données à caractère personnel qui ont été pseudonymisées, mais qui peuvent être utilisées pour identifier à nouveau une personne constituent toujours des données à caractère personnel et sont couvertes par le RGPD.
Selon le document des "Tables informatique et liberté" rédigé par la CNIL, sont notamment considérées données à caractère personnel un certain nombre de données sensibles : données biométriques (empreintes digitales, reconnaissance faciale) ; données relatives au handicap ; données de santé sensibles ; données concernant la vie sexuelle.
-
Données concernant la santé
Les données concernant la santé désignent des données à caractère personnel relatives à la santé physique ou mentale d'une personne physique, y compris la prestation de services de soins de santé, qui révèlent des informations sur l'état de santé de cette personne.
-
Données de géolocalisation
Les données de géolocalisation sont des informations qui permettent de déterminer ou de représenter la position géographique d'une personne.
-
Données génétiques
Les données génétiques sont des données à caractère personnel relatives aux caractéristiques génétiques héréditaires ou acquises d'une personne physique qui donnent des informations uniques sur la physiologie ou l'état de santé de cette personne physique et qui résultent, notamment, d'une analyse d'un échantillon biologique de la personne physique en question.
-
Données longitudinales
Les données longitudinales sont des informations collectées sur une même population ou un même individu à plusieurs moments dans le temps pour en suivre ou étudier l'évolution.
-
Démarche FAIR
La démarche FAIR (Findable, Accessible, Interoperable, Reusable) est un ensemble de principes et de lignes directrices visant à améliorer la gestion et la réutilisation des données scientifiques. Ces principes ont été élaborés pour remédier aux défis liés à la disponibilité et à l'utilisation efficace des données de recherche.
1. Findable (Facile à trouver) : Les données doivent être faciles à trouver pour les chercheurs et les scientifiques. Cela implique l'utilisation d'identifiants uniques (comme les DOI - Digital Object Identifiers) et de métadonnées descriptives, permettant une recherche efficace et une identification précise des données.2. Accessible (Accessible) : Une fois que les données ont été trouvées, elles doivent être accessibles. Cela signifie que les données doivent être disponibles avec autant de restrictions que nécessaire, mais aussi avec aussi peu de restrictions que possible. Les informations sur l'accès aux données doivent être clairement spécifiées.
3. Interoperable (Interopérable) : Les données devraient autant que possible pouvoir être intégrées et combinées facilement avec d'autres ensembles de données. Cela nécessite l'utilisation de normes et de formats ouverts qui favorisent l'interopérabilité entre différentes plates-formes et disciplines.
4. Reusable (Réutilisable) : Les données devraient être conçues de manière à pouvoir être réutilisées par d'autres chercheurs pour différentes analyses ou investigations. Cela implique la documentation détaillée des données, y compris les protocoles d'acquisition, les méthodes d'analyse et les conditions de collecte.
-
DPO - Data protection officer
Le data protection officer (Délégué à la protection des données) est la personne chargée d’informer ou de conseiller le responsable du traitement, les sous-traitants ainsi que les employés sur les obligations qui leur incombent en vertu du « RGPD » et d’autres dispositions en matière de protection des données, de contrôler le respect du RGPD et de coopérer avec la CNIL.
E
-
EDS - Entrepôt de données de santé
L'entrepôt de données, au sens règlement général à la protection des données (RGPD), se distingue d'un projet de recherche ponctuel. L’entrepôt vise à collecter des données massives sur une période prolongée pour une réutilisation des données dans plusieurs projets de recherche. Un projet de recherche, s'il prévoit une collecte de données particulières, répond à un objectif scientifique précis et est limité dans le temps.
Au sens technique, un entrepôt de données de santé (ou data warehouse de santé) est une infrastructure informatique qui stocke et intègre de grandes quantités de données de santé provenant de différentes sources. L'objectif principal d'un entrepôt de données de santé est de fournir un environnement centralisé et structuré pour stocker, gérer et analyser des données de santé provenant de multiples origines.
Sur le plan réglementaire, la création d’un entrepôt de données de santé nécessite le respect de certaines formalités, et la mise en conformité des traitements. Afin de simplifier les démarches pour les responsables de ces bases de données sensibles, la CNIL a adopté en octobre 2021 un référentiel. En complément, elle propose aujourd’hui une « check-list » de conformité. Ce référentiel ne s’applique qu’aux entrepôts de données de santé reposant sur l’exercice d’une mission d’intérêt public, au sens de l’article 6.1.e du RGPD.
La liste des données stockées doit être précisée dans le référentiel de données de santé.
En résumé, un EDS :- a une collecte de données massives
- a période prolongée
- permet une réutilisation des données dans plusieurs traitements ultérieurs
- a une alimentation au fil de l'eau
H
-
HDS - Hébergeur données de santé
L'hébergeur données de santé est une personne physique ou morale qui héberge des données de santé à caractère personnel pour le compte d'autres personnes ou pour le patient lui-même.
Tous les organismes publics ou privés qui hébergent, exploitent des données de santé à caractère personnel dans un système d'information de santé, ou réalisent des sauvegardes pour le compte d’un établissement de santé ou d’un tiers de santé doivent être certifiés HDS. À l’exception des services d'archivages informatiques qui ne sont pas concernés par ces obligations. Les établissements de santé qui gèrent leur propre Système d’Information de santé n’ont pas la nécessité d’être certifié HDS. Ces données sont recueillies à l’occasion d’activités de prévention, de diagnostic, de soins ou de suivi médico-social. L'hébergeur de données de santé doit être agréé ou certifié par l’Agence du Numérique en Santé (ANS), selon les exigences du Code de la santé publique (article L.1111-8). Source : ANS.
-
Homologation
L’homologation concerne une installation complète, elle couvre donc chacun de ses éléments. Une installation peut être homologuée sans qu’aucun de ses éléments ne soient certifiés. Une homologation peut être obligatoire par exemple en raison de problématique d’assurance, de réglementation, etc. L’homologation est déclarative.
I
-
Interopérabilité
L'interopérabilité désigne la capacité des systèmes informatiques à partager et à utiliser des informations entre eux de manière simple et permettant des comparaisons pertinentes. Cela nécessite l'utilisation de normes et de formats ouverts au sein de différentes plates-formes et disciplines.
-
Information et consentement
L'information et le consentement sont un processus par lequel les volontaires à une étude sont informés et comprennent les bénéfices et les risques potentiels avant de donner leur accord.
L' information aux participants doit être claire et transparente sur l’utilisation des données recueillies : le projet de recherche, les modalités de l'étude, les buts, l’utilité publique, la durée de leur traitement, les destinataires, et les droits qu’ils peuvent exercer sur leurs données, et la possibilité de réutiliser leurs données.
La définition RGPD indique toute manifestation de volonté, libre, spécifique, éclairée et univoque par laquelle la personne concernée accepte, par une déclaration ou par un acte positif clair, que des données à caractère personnel la concernant fassent l'objet d'un traitement.
Les participants ont également le droit de s'opposer à la réutilisation de leurs données personnelles à des fins de recherche. Ils peuvent exprimer leur opposition en tout temps, sans aucune conséquence pour eux et leur prise en charge.
-
ISO - International Organization for Standardization
L'organisation internationale pour la normalisation est une organisation non gouvernementale éditrice de normes internationales (plus de 19.500).
Par exemple, un système certifié ISO27001 assure qu'une méthodologie existe pour identifier les cybermenaces, maîtriser les risques associés aux informations cruciales de l’organisation, mettre en place les mesures de protection appropriées afin d’assurer la confidentialité, la disponibilité et l’intégrité de l’information.
M
-
Modification substantielle d'une étude
Une modification substantielle d'une étude désigne toute modification portant sur les caractéristiques principales du traitement de données à caractère personnel (par exemple : ajout de nouvelles finalités, collecte de nouvelles données sensibles, ajout d'une étude ancillaire, appariements avec des données personnelles recueillies par ailleurs, ajout de nouvelles sources, allongement de la durée de l'étude, modification des informations des personnes, ajout d'une nouvelle catégorie de destinataire des données, transfert de données hors de l'Union européenne, etc. ). Les comités compétents (CPP, CESREES,CNIL) se prononcent sur les modifications substantielles du traitement de données.
-
Métadonnées
Les métadonnées sont des informations qui décrivent et définissent des données, telles que la signification des variables et des codes.
-
Méthodologie de référence
Les méthodologie de référence sont un ensemble de procédures ou de lignes directrices établies par la CNIL pour encadrer le traitement des données personnelles. Ces méthodologies fournissent des orientations spécifiques sur la manière de collecter, conserver, traiter, et protéger les données personnelles afin de garantir le respect des droits des volontaires dans le cadre d'une recherche en santé.
Si la recherche est strictement conforme à une méthodologie de référence (MR-001, MR-002, MR-003, MR-004, MR-005 ou MR-006 selon la typologie de la recherche), seul un engagement de conformité auprès de la CNIL est nécessaire.
Le Responsable de traitement doit également être en mesure de démontrer sa conformité à la MR.
N
-
Normalisation des données
La normalisation des données indique un processus consistant à organiser et à structurer les données de manière cohérente pour faciliter la comparaison et l'analyse.
O
-
Observatoire de santé
Un observatoire de santé est un organisme ou une structure visant à observer de façon régulière la santé sur une problématique ou un territoire spécifique. Ces entités doivent mobiliser toutes les données pertinentes pour assurer leur mission.
-
Open Data
L'Open Data, donnée ouverte en français, est une pratique consistant à rendre les données accessibles au public pour favoriser la transparence et la collaboration. Les données de santé en open data sont nécessairement anonymisées de manière à empêcher tout risque de réidentification.
P
-
PGD - Plan de gestion de données ou datamanagement plan (DMP)
Un plan de gestion de données (PGD) décrit la façon dont les données sont produites, documentées, (ré)utilisées, gérées et partagées pendant et après le projet. C’est un outil d’aide pour mettre en place une réflexion autour des données de la recherche afin de les rendre FAIR (Faciles à trouver, Accessibles, Interopérables, Réutilisables). source : https://anr.fr/
-
Professionnel intervenant dans la recherche
Un professionnel intervenant dans la recherche est une personne physique qui collecte les données, dirige ou surveille la réalisation de la recherche dans un projet de recherche. Il s'agit notamment de l'investigateur, des collaborateurs de l'investigateur agissant sous sa responsabilité, des professionnels de santé participant au recueil et/ou à l'analyse.
-
Profil d'accès
Un utilisateur voulant accéder au système d'information de France Cohortes se connecte via un profil d'accès.
Ce profil conditionne les fonctionnalités (outils) mis à disposition à l'utilisateur, ainsi que les différents accès aux données qu'il peut manipuler. Un utilisateur peut disposer de plusieurs profils d'accès en fonction des opérations qu'il souhaite mener.
-
Projet de recherche
Projet de recherche est un projet ayant :
- une finalité précise, établie par un protocole scientifique
- une question scientifique déterminée et ponctuelle
- une durée limitée
-
Promoteur de recherche
Le promoteur de recherche est la personne physique, la société ou l’institution qui prend l’initiative d’un essai clinique et en assume les responsabilités et le financement.
En pratique, le promoteur est responsable de toute l’organisation, de la mise en place, du suivi de l’essai clinique : choisir l’investigateur, recruter des ARC contrôleurs de qualité, obtenir l’avis favorable du comité de protection des personnes et l’autorisation de l’autorité compétente le cas échéant, contracter une assurance et déclarer à l’autorité compétente les éventuels événements indésirables survenus au cours de la recherche. (Source : notre recherche clinique https://notre-recherche-clinique.fr/definition/promoteur/)
-
Protocole de recherche
Le protocole de recherche est un document rédigé par une équipe de recherche.
Il décrit notamment :
- la méthodologie de la recherche,
- l'objectif du traitement des données à caractère personnel,
- les catégories de personnes concernées par le traitement,
- l'origine, la nature et la liste des données à caractère personnel utilisées et la liste des justifications de recours à celles-ci,
- la durée et les modalités d'organisation de la recherche, de l'étude ou de l'évaluation,
- la méthode d'analyse des données, ainsi que, lorsque les caractéristiques de l'étude, de la recherche ou de l'évaluation l'exigent, la justification du nombre de personnes et la méthode d'observation ou d'investigation retenue.
-
Pseudonymisation
La pseudonymisation est un traitement de données à caractère personnel de telle façon que celles-ci ne puissent plus être attribuées à une personne concernée précise sans avoir recours à des informations supplémentaires.
En pratique, la pseudonymisation consiste à supprimer les données directement identifiantes (nom, prénoms, etc.) d’un jeu de données et à générer des données identifiantes non signifiantes (alias, numéro séquentiel, etc.). La pseudonymisation permet ainsi de traiter les données d’individus sans pouvoir identifier ceux-ci de façon directe.
-
PSSI - Politique de la sécurité des systèmes d'information
La politique de la sécurité des systèmes d'information (PSSI) est la référence pour la mise en œuvre de la sécurité au sein de l’Inserm, en application des nombreux textes législatifs et réglementaires. Elle est déclinée pour les systèmes d'information (SI) des structures administratives et les SI de recherche de l’Inserm.
R
-
Recherche en santé
La recherche en santé est une méthode scientifique d'acquisition de nouvelles connaissances sur un problème en santé.
Une recherche est « monocentrique » si elle est menée :- à partir de données recueillies dans le cadre du suivi (thérapeutique ou médical) individuel des patients ;
- et par les personnels assurant ce suivi ;
- et pour leur usage exclusif.
Une recherche est « multicentrique » si elle implique que les données soient rendues accessibles à des personnes en dehors de l’équipe de soins. Il s’agit des recherches qui ne remplissent pas les critères d’une recherche « monocentrique ».
-
Responsable de traitement (des données)
Le ou la responsable de traitement (des données) est une personne physique ou morale qui, seule ou conjointement avec d'autres, est responsable d'une recherche, en assure la gestion, vérifie que son financement est prévu et qui détermine les finalités et les moyens des traitements nécessaires à celle-ci. Il peut s'agir du promoteur de la recherche.
Si la recherche est menée dans le cadre d’une thèse ou d’un mémoire, le responsable de traitement est soit l’université, soit l’établissement de soin de rattachement de l’étudiant. Ce dernier ne peut pas être qualifié de responsable de traitement.
-
Responsable opérationnel
Le ou la responsable opérationnel(le) est une personne physique ou morale, une autorité publique, un service ou un organisme autre que la personne concernée, le responsable du traitement, le sous-traitant et les personnes qui, placées sous l'autorité directe du responsable du traitement ou du sous-traitant, sont autorisées à traiter les données à caractère personnel.
-
Ré-identification
La ré-identification désigne la capacité à découvrir l'identité réelle d'une personne ou plusieurs personnes dont on ne connaît pas directement l'identité, en utilisant des méthodes telles que la déduction ou l'inférence sur un ou plusieurs jeux de données.
-
Référentiel SNDS (système national des données de santé)
Le référentiel de sécurité du SNDS énonce les principes et les exigences de sécurité qui doivent être respectés pour garantir la confidentialité, l'intégrité et la disponibilité des données stockées dans le SNDS. Voici quelques-unes des exigences générales du référentiel de sécurité du SNDS. Le Référentiel Sécurité du SNDS implique :
- La pseudonymisation des identifiants patients
- L’authentification forte de l’utilisateur et la conformité du poste de travail
- La traçabilité de toutes les actions et l’information des utilisateurs
- Le contrôle des traitements
- La sensibilisation et la formation des utilisateurs
- L’interdiction de sortir du SNDS des données non anonymes
-
Référentiel Entrepôt de données de santé (EDS)
Le référentiel entrepôt de données de santé (EDS) indique une liste d'exigences associées à l'EDS fourni par la CNIL. Chacune de ces exigences doivent être vérifiées, avec au moins un élément de preuve (documentation, outillage, etc.) permettant de garantir que l'exigence est bien couverte. Les exigences peuvent porter sur des points techniques et fonctionnels.
-
Registre
Un registre est un recueil continu et exhaustif de données nominatives intéressant un ou plusieurs événements de santé dans une population géographiquement définie, à des fins de recherche et de santé publique, par une équipe ayant les compétences appropriées.
-
RSSI - Responsable de la Sécurité des Systèmes d’Information
Le ou la responsable de la sécurité des systèmes d’information, définit et développe la politique de sécurité de l’information de l'Inserm applicable à toutes les plateformes. Il est garant de sa mise en œuvre et en assure le suivi.
-
Responsable scientifique de la recherche
Le responsable scientifique de la recherche est la personne désignée par le responsable de traitement, et agissant sous sa responsabilité, veillant à la qualité, l'intégrité et à la sécurité des informations et de leur traitement, ainsi qu'au respect de la finalité de celui-ci. Il peut s'agir de l'investigateur coordonnateur.
S
-
SNDS - système national des données de santé
Le SNDS est constitué d’une base principale composée des éléments décrits ci-dessous auxquels s’ajoute un ensemble de bases de données ne couvrant pas l’ensemble de la population, appelé « catalogue du SNDS ».
La "base principale" du Système national des données de santé (SNDS) regroupe et chaîne les principales bases de données françaises pour rassembler les informations de santé de plus de 65 millions de personnes. Son utilisation à des fins scientifiques fait appel à un haut niveau de technicité et à des connaissances très fines et spécifiques. Le SNDS rassemble :- Les données des remboursements de l’Assurance maladie (base Sniiram),
- Les données de gestion médico-économique des hospitalisations (base PMSI),
- Les données des causes médicales de décès (base du CépiDc de l’Inserm),
- Les données des Maisons départementales des personnes handicapées (MDPH) et de la Caisse nationale de solidarité pour l’autonomie (CNSA),
- Les données relatives à la Covid-19 extraites des bases Vaccin Covid et SI-DEP (système d’information et de dépistage).
L’arrêté relatif aux données alimentant la base principale et aux bases de données du catalogue du SNDS (arrêté du 12 mai 2022, à consulter sur le site legifrance.gouv.fr) liste les premières bases ayant vocation à intégrer le « catalogue du SNDS ». Parmi ces premières bases, on trouvera la base « EpiCov », enquête statistique sur l’état de santé et les conditions de vie en lien avec l’épidémie due au coronavirus, la base « HEPATHER » relative aux patients atteints d’hépatite B ou C ou encore la base « OSCOUR » sur les données de passage aux urgences.
Ces données pourront rejoindre la base principale du SNDS dès lors qu’elles seront exhaustives sur l’ensemble de la population.
-
Sous-traitant
Un sous-traitant est une personne physique ou morale, autorité publique, service ou organisme qui traite des données à caractère personnel pour le compte du Responsable de traitement. Il s'agit par exemple du centre participant, d'une société de recherche sous contrat ou d'un prestataire de services informatiques, de centres de ressources biologiques ou d'hébergeurs de données de santé.
-
Stockage des données
Le stockage des données fait référence à la conservation et à l'organisation des informations de manière à les rendre accessibles, sécurisées et durables. Dans le contexte de la gestion des données, le stockage joue un rôle crucial pour assurer la disponibilité, l'intégrité et la confidentialité des informations. Voici quelques aspects importants du stockage des données :
Types de stockage
Stockage local : Sur des périphériques de stockage physiques tels que disques durs, SSD (Solid State Drives) ou clés USB.
Stockage réseau : À travers des serveurs partagés sur un réseau local (LAN) ou étendu (WAN).
Stockage en nuage (Cloud) : Utilisation de services de stockage en ligne gérés par des fournisseurs cloud.France Cohortes stocke les données des cohortes sur des serveurs sécurisés situés en France.
Systèmes de fichiers
Organisation des données dans une structure hiérarchique utilisant des répertoires et des fichiers.
Les systèmes de fichiers déterminent comment les données sont stockées, nommées, et structurées sur un périphérique de stockage.Bases de données
Utilisation de systèmes de gestion de bases de données (SGBD) pour stocker et organiser les données de manière structurée.
Les bases de données permettent d'effectuer des requêtes complexes et de garantir l'intégrité des données.Redondance et sauvegarde
Mise en place de dispositifs de redondance pour assurer la disponibilité des données en cas de défaillance matérielle.
Réalisation de sauvegardes régulières pour prévenir la perte de données en cas de panne, d'erreur humaine ou d'incident.Sécurité des données
Implémentation de mesures de sécurité, telles que le chiffrement, pour protéger les données contre les accès non autorisés.
Contrôle d'accès pour garantir que seules les personnes autorisées peuvent accéder aux données.Scalabilité
Conception du stockage de manière à pouvoir évoluer en fonction des besoins croissants en termes de volume de données.Normes et conformité
Respect des normes et des réglementations en vigueur pour garantir la conformité en matière de gestion des données.Gestion du cycle de vie des données (Data Lifecycle Management)
Suivi et gestion des données depuis leur création jusqu'à leur suppression ou leur archivage.
-
Système "fils" du SNDS
Système "fils" du SNDS est un système d'information hébergeant une extraction des données du SNDS central, contenant soit uniquement des données du SNDS central, soit des données personnelles issues d'un autre traitement (ex. cohorte, registre) chainées aux données du SNDS central. Le système permet d'assurer leur mise à disposition pour les finalités prévues dans le Code de la santé publique.
Le système d'information de France Cohortes est considéré comme un système fils SNDS.
-
Système d'information sur la santé
Un système d'information sur la santé est une plateforme informatique utilisée pour collecter, stocker et gérer les informations liées à la santé.
France Cohortes propose un système d'information intégré permettant la totalité des actions décrites ci-dessus.
-
Sécurité des données
La sécurité des données consiste en une série de mesures techniques et organisationnelles mises en place pour protéger les données contre tout accès non autorisé, altération ou perte.
T
-
Traitement des données
Le traitement des données désigne toute opération ou tout ensemble d'opérations effectuées ou non à l'aide de procédés automatisées et appliquées à des données ou des ensembles de données à caractère personnel, telles que la collecte, l'enregistrement, l'organisation, la structuration, la conservation, l'adaptation ou la modification, l'extraction, la consultation, l'utilisation, la communication par transmission, la diffusion ou toute autre forme de mise à disposition, le rapprochement ou le chaînage, la limitation, l'effacement ou la destruction.