Un article de la revue Science du 2 janvier (ici) a suscité un certain nombre de réactions dans la presse (ici ou là) et les différents articles ont titré sur la part de hasard dans les cancers. Le travail de recherche est très intéressant mais il ne parle absolument pas du risque de cancer.
En effet le but de l’étude est d’expliquer les variations du risque de cancer et le titre de l’article est clair : “Variation in cancer risk among tissues can be explained by the number of stem cell divisions”. L’idée des auteurs est la suivante : le cancer est provoqué par des mutations dans l’ADN, des mutations peuvent être causées par, entre autres choses, la réplication de l’ADN. Donc, plus les cycles de réplication de l’ADN sont nombreux (c’est à dire qu’il y a de nombreuses divisions cellulaires dans un tissu particulier), plus le risque de cancer est élevé.
Pour tester cette hypothèse, les auteurs ont analysé les données sur le risque de cancer au long de la vie et le taux de division cellulaire des tissus où se développent 31 types de cancer. Ces données suggèrent qu’il existe une relation entre le risque de cancer et le nombre de divisions cellulaires. Mais il ne dit rien sur la proportion de cancers due à la division cellulaire. Si on regarde l’archipel normand de Chausey, on peut voir près de 365 îlots à marée basse contre environ 52 îles à marée haute. Ceci informe sur les variations de hauteurs d’eau (l’estran) mais ça ne dit rien sur la profondeur des fonds marins.
Revenons donc aux travaux des auteurs : leur premier graphe représente le graphe du risque de cancer au long de la vie et le nombre total de divisions de cellules souches (log10 des valeurs).
La relation linéaire est très forte alors que les risques de cancer sont très variables. Si l’on trace sur ce graphe la droite qui s’ajuste le mieux aux données (voir un cours de régression linéaire pour plus de détails), on peut chercher les cancers qui sont les plus proches de la droite et ceux qui en sont le plus éloignés. Ceci permet aux auteurs de séparer les cancers en deux groupes : ceux dont on peut associer l’apparition à la division cellulaire (par exemple le cancer du pancréas) et ceux donc on ne peut pas résumer le cancer à la division cellulaire (par exemple le cancer colorectal ou le cancer du poumon). Le premier groupe contient 22 cancers et représente le groupe des cancers dont l’apparition est associée à la division cellulaire ; ceci a été résumé par «la malchance» alors que pour le deuxième groupe (9 cancers) la division cellulaire est moins importante et donc on ne peut pas parler uniquement de «malchance». Le raccourci qui consiste à dire que 2/3 (soit environ 22/31) des cancers sont «dus» à la malchance est un double raccourci frauduleux : (i) L’article explique les variations et non les risques, (ii) il y a des cancers beaucoup plus fréquents que d’autres. Ce dernier point est connu chez les psychologues comme un biais d’équiprobabilité. Si vous lancez deux dés, beaucoup de gens pensent que les deux sommes 11 et 12 ont la même probabilité d’apparaître. La justification classique est que le hasard détermine la somme et donc ne favorise pas une issue ou une autre. Or, 11 est en réalité deux fois plus probable que 12, parce que deux configurations (5-6 et 6-5) des dés correspondent à une somme de 11, alors qu’une seule (6-6) correspond à une somme de 12.
On peut aussi avoir un petit retour historique et se souvenir que dans les cancers classés comme n’étant pas «dus» qu’à la division cellulaire, la recherche épidémiologique a du recul : en 1775, Percivall Pott, à Londres, décrivait le cancer du scrotum des ramoneurs et Hill en 1761 établit un lien entre cancer nasal et tabac prisé. Ce que rappelle la ligue contre le cancer dans l’affiche en logo de ce billet (ici).
Si nous revenons à la figure de l’article, nous pouvons chercher la part de la variation du taux de cancer qui n’est pas due à la division cellulaire et donc la «malchance». Cette stratégie est utilisée pour examiner l’effet de fumer sur les taux de cancer du poumon. Le risque de cancer est 18 fois plus élevé chez les fumeurs que les non-fumeurs. A peu près 18 pour cent de la population adulte des États-Unis fume (selon le Center for Disease Control and Prevention), ce qui suggère que pour le cancer du poumon, environ 75 pour cent du risque est dû au tabagisme (le risque supplémentaire à cause du tabac est multiplié par la proportion de fumeurs divisé par le risque total du cancer du poumon) (voir ici aussi). Ce résultat est parfaitement cohérent avec la littérature et à l’opposé du résumé que l’on a pu lire dans la presse.
A ce moment là de l’histoire on peut donc se demander comment une étude scientifique finit par être présentée de manière si biaisée. Un raccourci rapide serait d’incriminer les journalistes scientifiques mais ce ne sont pas les seuls responsables.
-* L’abstract utilise ce mot malheureux de «bad luck» pour parler de la partie de la variation expliquée par la division cellulaire. Cela a probablement été vu comme un raccourci un peu racoleur afin de plaire aux relecteurs. C’est malheureux car un article dans une revue comme Science a plus de chances de se retrouver dans la presse grand public qu’un article dans une revue plus spécialisée.
- La couverture par Science est «the bad luck of cancer». C’est pour le moins douteux et donne a penser que Science est une revue pour salle d’attente de cabinet de dentiste .
- Le communiqué de presse indique« By [the authors’] measure, two-thirds of adult cancer incidence across tissues can be explained primarily by “bad luck »» . C’est plus que rapide et on finit par ne plus faire la différence entre un communiqué de presse et une pub pour soda.
Tout ceci montre qu’on doit pouvoir intéresser à la science sans faire du racolage et qu’il y a peut être un chaînon manquant entre les revues scientifiques et les journaux grand public.
Post-scriptum
Une première version de ce billet a été publié sur le blog Statistiquement vôtre.
Il est possible d’utiliser des commandes LaTeX pour rédiger des commentaires — mais nous ne recommandons pas d’en abuser ! Les formules mathématiques doivent être composées avec les balises .
Par exemple, on pourra écrire que sont les deux solutions complexes de l’équation .
Si vous souhaitez ajouter une figure ou déposer un fichier ou pour toute autre question, merci de vous adresser au secrétariat.