La p-value c'est de la merde.
Bon j'exagère mais retiens bien que la p-value a extrêmement peu de signification, c'est vraiment de la merde faut insister sur ce point.
En gros tu fais une hypothèse (dans le jargon qualifiée d'hypothèse nulle "H0"), tu supposes qu'elle est vraie, et tu regardes ton échantillon de la vraie vie.
Étant donné cet échantillon quel paramètre il aurait fallu pour que ton hypothèse produise ce résultat/à quel point mon échantillon est rare dans le cadre de mon hypothèse, si le paramètre est délirant/tellement rarissime parmi mon hypothétique population que c'est pas croyable, alors tu peux décider de rejeter l'hypothèse, pour ce motif statistique.
Ou alors tu peux décider de ne pas rejeter l'hypothèse, car tu respectes ton seuil arbitraire, pour ce motif statistique.
Donc tu vois bien qu'en terme de signification c'est très très très faible, ça dit vraiment pas grand chose, ça dit juste "bon avec cet échantillon, je peux pas dire que cette hypothèse est complètement fausse"
Donc ça dit absolument pas qu'elle est vraie!
Mais attention, tout ça ça reste encore des simplifications, il faut avant tout que tu comprennes la notion de Test Statistic https://en.wikipedia.org/wiki/Test_statistic
Et surtout ce passage:
https://en.wikipedia.org/wiki/P-value#Calculation
C'est le plus important et ça affaiblit encore plus cette notion.
Et ça implique que tu comprennes bien la notion de variable aléatoire et de distribution.
Wikipédia donne ensuite de très bons exemples pour monter l'absence total de signification de cette notion selon son utilisation, le plus simple:
Tu utilises la p-value pour une population observée de 1. Juste un seul jet de dé, ton hypothèse nulle c'est que le dé est équilibré. Et on voit que le résultat n'a pas d'intérêt.
One roll of a pair of dice
Suppose a researcher rolls a pair of dice once and assumes a null hypothesis that the dice are fair, not loaded or weighted toward any specific number/roll/result; uniform. The test statistic is "the sum of the rolled numbers" and is one-tailed. The researcher rolls the dice and observes that both dice show 6, yielding a test statistic of 12. The p-value of this outcome is 1/36 (because under the assumption of the null hypothesis, the test statistic is uniformly distributed) or about 0.028 (the highest test statistic out of 6×6 = 36 possible outcomes). If the researcher assumed a significance level of 0.05, this result would be deemed significant and the hypothesis that the dice are fair would be rejected.
In this case, a single roll provides a very weak basis (that is, insufficient data) to draw a meaningful conclusion about the dice. This illustrates the danger with blindly applying p-value without considering the experiment design.