Fichiers - Bases de Données

1. Les démarches de recherche à l'échelle des populations



1.5. Les réalisations



Les bases de données, contenant toutes les informations utiles à la réalisation d'une étude sont donc un "outil" pour les recherches. Le traitement de ces nombreuses données passe souvent par des études statistiques.

Études statistiques

Les études statistiques sont très souvent utilisées dans le traitement de volume important de données. Ces calculs mathématiques permettent préalablement à la réalisation des études proprement dites :

  • de vérifier la distribution et la dispersion des variables et des effectifs dans les différentes classes de données,
  • d'identifier des indicateurs de tendance (moyenne, médiane) et de dispersion (valeurs extrêmes et écart type).(cf Formation Association 2006 Inserm-Leem-Eurordis "Lecture du protocole de recherche clinique")


Il ne faut jamais oublier que la statistique n’est qu’un calcul, qu’une vision de l’esprit, donc :

  • un résultat statistiquement significatif peut être au niveau clinique parfaitement stupide et le résultat restera donc …Stupide,
  • un mauvais test statistique ou son interprétation erronée apporte des résultats faux,
  • le choix des tests est donc une étape critique pour l'obtention d'un résultat pertinent.


Dans le cas de traitement statistique, il faut faire particulièrement attention aux :

  • Variabilités individuelles : elles peuvent être dues à une erreur de mesure (exemple : approximation lors d'un dosage) ou une variation en fonction du temps d'une donnée biologique (exemple : le taux de glycémie n'est pas constant au cours d'une journée). Cette variabilité peut être maîtrisée pour rendre les résultats plus significatifs si elle est anticipée (par exemple utiliser la moyenne de 2 ou 3 mesures).
  • Facteurs de confusion : ils représentent des données qui se surimposent aux variables étudiées et modifient le résultat de l'étude (par exemple : l'efficacité d'un traitement peut être faussée par l'évolution naturelle de la maladie, un traitement concomitant ou régime alimentaire).
  • Biais* : ils sont souvent introduits par une erreur de choix de la population étudiée qui n'est pas représentative de la population cible définie par l'étude (biais de sélection) ; ces biais induisent une erreur systématique (par exemple : recherche de la couverture vaccinale contre la rougeole chez les enfants de moins de 6 ans avec une interrogation auprès des mères de famille lors d'une visite de suivi à la PMI : il peut y avoir un biais de sélection car les enfants suivis en PMI sont plus souvent vaccinés).
  • Contrôles : La recherche de la significativité d'un résultat se fait souvent en comparant la variable étudiée à une variable contrôle. Cette dernière peut être obtenue sur une population témoin (exemple : cohorte Stanislas sur les maladies cardiovasculaires ), sur le sujet lui-même (exemple : comparaison du muscle du bras droit traité par thérapie génique, avec celui du bras gauche non traité) ou par comparaison avec des résultats antérieurs (exemple : mise en place du système de défense immunitaire de façon stable chez les enfants immunodéficients après traitement par la thérapie génique comparé à l'évolution de la maladie chez des enfants non traités).



Les bases de données associées aux calculs statistiques permettent des études de corrélations, des validations de résultats, des obtentions de preuves, des études épidémiologiques.

Des études de corrélation*

Les études de corrélation correspondent à une observation systématique et répétée de 2 variables pour évaluer si elles sont liées entre elles conformément à l'hypothèse biologique de départ (exemple : il existe une corrélation positive entre le tabagisme et le cancer du poumon)

Le coefficient de corrélation est la mesure de la relation linéaire entre les 2 variables (exemple : effet-dose d'un médicament). Mais si 2 variables varient conjointement, cela ne suffit pas pour affirmer que l'une est la cause de l'autre : "Regardons la liaison entre mon âge et le prix de l'essence, la corrélation (positive) est presque parfaite, mais personne ne s'aviserait d'y voir une cause commune" (SG Gould, 1997. La Mal-mesure de l'Homme. Ed Odile Jacob).

La mesure de corrélation est une approche descriptive ; il faut confirmer le lien de causalité par une méthode expérimentale.


Des confirmations de résultats individuels ou ponctuels,

Les bases de données permettent de confirmer ou d'infirmer sur une population un résultat trouvé sur un ou un petit nombre d'individus (exemple : mise en évidence d'une mutation chez un patient, confirmation de l'existence de la mutation chez les familles atteintes de la même pathologie).

Preuves d'efficacité d'un traitement

Les essais thérapeutiques sont réalisés pour tester un bénéfice clinique apporté par un traitement. Le suivi d'une cohorte, avant et après traitement ou en comparaison avec une population témoin permet d'obtenir des résultats sur l'efficacité dudit traitement.


Étude épidémiologique*

Les études épidémiologiques sont réalisées sur de grandes quantités de données souvent par le biais d'études statistiques. Elles peuvent être :

  • Descriptives : elles permettent de connaître une population ou de décrire une maladie. Ces études peuvent servir de base à un travail de santé publique (exemple : le Centre d'épidémiologie sur les causes médicales de décès : Cépi Dc de l'INSERM est chargé de centraliser et d'analyser les causes médicales de décès. Ce registre permet de faire de nombreuses recherches sur les causes de mortalité des français) Pour les associations, ces études peuvent leur servir à argumenter leurs besoins auprès des instances officielles (exemple : les données collectées sur les maladies orphelines ont pu prouver qu'elles concernaient 4 millions de français ce qui a été un des arguments pour mettre en place le plan "maladies rares" du ministère de la santé).

  • Analytiques : elles étudient les causes des maladies cherchant à mettre en évidence une association statistique entre un facteur de risque et une maladie (exemple : association du syndrome hémolytique et urémique de l'enfant qui amène une insuffisance rénale grave et d'une contamination par Escherichia Coli producteur de Shigatoxines).

  • Évaluatives : elles ont pour objet spécifique l'identification des meilleurs programmes de santé, thérapeutiques ou actions de prévention (exemple : étude SU.VI.MAX a permis le suivi de 13 000 personnes pendant 8 ans pour tester l'impact d'un apport supplémentaire en vitamines et minéraux antioxydants, à dose nutritionnelle, dans la prévention des cancers et des maladies cardiovasculaires).



Les recherches ne peuvent se faire que sur des bases de données de qualité.