Les matheux sont dans la place - pt=prout

**Anonyme20240202** · 06/09/2017, 01h51

La p-value c'est de la merde.

Bon j'exagère mais retiens bien que la p-value a extrêmement peu de signification, c'est vraiment de la merde faut insister sur ce point.

En gros tu fais une hypothèse (dans le jargon qualifiée d'hypothèse nulle "H0"), tu supposes qu'elle est vraie, et tu regardes ton échantillon de la vraie vie.

Étant donné cet échantillon quel paramètre il aurait fallu pour que ton hypothèse produise ce résultat/à quel point mon échantillon est rare dans le cadre de mon hypothèse, si le paramètre est délirant/tellement rarissime parmi mon hypothétique population que c'est pas croyable, alors tu peux décider de rejeter l'hypothèse, pour ce motif statistique.

Ou alors tu peux décider de ne pas rejeter l'hypothèse, car tu respectes ton seuil arbitraire, pour ce motif statistique.

Donc tu vois bien qu'en terme de signification c'est très très très faible, ça dit vraiment pas grand chose, ça dit juste "bon avec cet échantillon, je peux pas dire que cette hypothèse est complètement fausse"

Donc ça dit absolument pas qu'elle est vraie!

Mais attention, tout ça ça reste encore des simplifications, il faut avant tout que tu comprennes la notion de Test Statistic https://en.wikipedia.org/wiki/Test_statistic

Et surtout ce passage:

https://en.wikipedia.org/wiki/P-value#Calculation

C'est le plus important et ça affaiblit encore plus cette notion.

Et ça implique que tu comprennes bien la notion de variable aléatoire et de distribution.

Wikipédia donne ensuite de très bons exemples pour monter l'absence total de signification de cette notion selon son utilisation, le plus simple:

Tu utilises la p-value pour une population observée de 1. Juste un seul jet de dé, ton hypothèse nulle c'est que le dé est équilibré. Et on voit que le résultat n'a pas d'intérêt.

One roll of a pair of dice

Suppose a researcher rolls a pair of dice once and assumes a null hypothesis that the dice are fair, not loaded or weighted toward any specific number/roll/result; uniform. The test statistic is "the sum of the rolled numbers" and is one-tailed. The researcher rolls the dice and observes that both dice show 6, yielding a test statistic of 12. The p-value of this outcome is 1/36 (because under the assumption of the null hypothesis, the test statistic is uniformly distributed) or about 0.028 (the highest test statistic out of 6×6 = 36 possible outcomes). If the researcher assumed a significance level of 0.05, this result would be deemed significant and the hypothesis that the dice are fair would be rejected.

In this case, a single roll provides a very weak basis (that is, insufficient data) to draw a meaningful conclusion about the dice. This illustrates the danger with blindly applying p-value without considering the experiment design.

**Anonyme20240202** · 06/09/2017, 02h08

Donc pour revenir sur ta régression.

Tu vas typiquement faire l'hypothèse: "mes données ne sont pas liées entre elles: une régression n'a pas de sens ici."

Et tu vas pouvoir/vouloir rejeter (statistiquement) cette hypothèse.

Et là tous les sagouins sans aucune morale ni rigueur vont en tirer la conclusion que tu peux l'accepter et que donc la régression est correcte. Mais tu vois bien que ça dit juste qu'on décide statistiquement de rejeter une hypothèse arbitraire, ça veut pas dire grand chose. Même si en pratique pour une régression ça peut passer (mais c'est très très dangereux potentiellement surtout si on parle de vie humaine et qu'on fait des choix à la con basés sur une p value sans aucun sens).

Si tu regardes le passage que j'ai linké sur les test statistics tu vas voir d'où vient le fameux t, de ton t-test.

Tu auras l'exemple complet de ton cas pour une régression ici:

https://en.wikipedia.org/wiki/Studen...egression_line

- - - Mise à jour - - -

Donc TL;DR

1. chez moi on se sert de ce test dans le cadre d'une régression linéaire avec R, donc c'est quoi l'hypothèse de départ ?
Hypothèse de départ, le coefficient de la droite de regression est nul (données pas liée entre elles, pas de régression à faire)
2. nous on garde les coefficients qui justement ont une p value < 5% (au lieu de les rejeter ?)
Ce que tu "veux" c'est que ta régression soit vraie, donc tu veux rejeter l'hypothèse nulle et """"""""""""""accepter"""""""""""""" les coeffs où l'hypothèse est rejetée

Les guillemets sont importants

**Aghora** · 06/09/2017, 03h39

Je savais qu'il existait plusieurs types de tests stats dont le test classique de Neyman-Pearson, de Bayes ou de Kolmogorov mais c'est la 1re fois que j'en vois un lié à la régression linéaire. Peut-être pas tant que ça si je me souviens bien de Kolmogorov.

La p-value, jamais entendu parler sous ce nom là.
Ce dont je me souviens, c'est qu'on parlait de risque de 1re espèce, c'est-à-dire le risque de rejeter H0 sachant qu'elle est vraie. Avec une valeur fixée à 5 ou 1%.

Ah et au passage : https://fr.wikipedia.org/wiki/Valeur_p

On lira avec beaucoup d'intérêt la page Wikipedia en anglais sur le p-value qui est beaucoup plus à jour que cette page.

On voit le mec qui a la flemme de traduire. Pas la peine d'être contributeur dans ce cas.

**Alab** · 06/09/2017, 10h29

Envoyé par ducon

Normalement, tu as dû étudier ça en TS dans le chapitre sur les intervalles de fluctuation asymptotiques (au seuil de 5% dans ce cas).

Ouais enfin bon la TS ça remonte à 7 ans et demi déjà.

Et puis quand on pratique pas les maths c'est fou à quel point ça part vite, ça me déprime un peu (bon les stats j'en ai jamais trop fait non plus après aussi).

Merci pour les autres explications, ça m'a bien éclairé.

**Anonyme20240202** · 06/09/2017, 10h54

ducon je sais pas si t'es au courant mais c'est enseigné de manière catastrophique! (bon je vais pas relancer le sujet du topic des sciences)

C'est déprimant, typiquement les travers soulignés par wikipédia et la recette de cuisine sans AUCUN sens.

Si tu tapes "intervalles de fluctuation asymptotiques" sur google et que tu regardes ce qu'il y a c'est assez évident qu'un élève ne pourra pas faire le lien avec les test statistic et la vraie compréhension du truc.

C'est un cas particulier mal expliqué, et très souvent (j'en ai fait l'expérience en terminale et dans les cours de stats en école d'ingé), le prof présente la méthodologie pour pouvoir effectuer le test, et point barre.

Je mets ma main à couper que 90% du temps c'est expliqué, texto, comme ça: (même exemple, mêmes valeurs, etc. copier/coller et sans élaborer)

**Gobbopathe** · 06/09/2017, 12h04

Kamikaze, en fait je comprends pas que tu dises "c'est de la merde".

Ou alors tu peux décider de ne pas rejeter l'hypothèse, car tu respectes ton seuil arbitraire, pour ce motif statistique.
Donc tu vois bien qu'en terme de signification c'est très très très faible, ça dit vraiment pas grand chose, ça dit juste "bon avec cet échantillon, je peux pas dire que cette hypothèse est complètement fausse"
Donc ça dit absolument pas qu'elle est vraie!

Bien sûr, ce que tu écris est tout à fait vrai ! C'est le principe en stats. Dès lors que tu ne bosses que sur un échantillon, tu ne peux pas espérer par magie sortir des vérités sur une population entière sans risque d'erreur. Donc en effet la seule conclusion que tu pourras faire, c'est que tu valides ton hypothèse H1 avec un risque alpha de 5% ou 1% (ou moins). Et alors ? Que peux-tu faire de mieux ?
Ensuite, ce seront les collègues dans le monde qui réitéreront ton protocole expérimental, ou bien des expériences approchantes, etc. Bref c'est comme ça que fonctionne la science non ?

**Anonyme20240202** · 06/09/2017, 14h30

Ouais je pousse le trait, mais c'est parce que malheureusement, à chaque fois que j'ai vu enseigner cette notion, et dans de nombreuses publications sa signification, son utilisation sont déformées et elle sert de validation.

Son contexte d'utilisation et toutes les nombreuses hypothèse qui l'entourent sont hyper importantes, et je voulais insister sur la ""faiblesse"" de sa signification. Ce qui compte c'est la réalité physique derrière les données observées, bien sûr la p-value peut-être un outil utile, mais ça dit ce que ça dit, pas plus.

(bon alors bien sûr pour ceux qui connaissent déjà le sujet, j'enfonce des portes ouvertes)

C'est pour ça que y'a un article wikipédia entier dédié à la mauvaise compréhension de cette notion

https://en.wikipedia.org/wiki/Misund...gs_of_p-values

Et plusieurs comics xkcd dédiés

- - - Mise à jour - - -

- - - Mise à jour - - -

Va dans un cours d'économétrie et demande à un élève ce qu'est la p-value, il va te dire que c'est le chiffre calculé par la machine qui dit si la regression est bonne ou pas

**Gobbopathe** · 06/09/2017, 16h26

Envoyé par Kamikaze

Va dans un cours d'économétrie et demande à un élève ce qu'est la p-value, il va te dire que c'est le chiffre calculé par la machine qui dit si la regression est bonne ou pas

Ah oui effectivement un type qui dit ça, faut lui mettre une baffe. C'est clair que qn qui croit que si p<0,05 alors ce que je raconte est forcément vrai, ça va pas le faire.

**ducon** · 06/09/2017, 20h55

Envoyé par Kamikaze

ducon je sais pas si t'es au courant mais c'est enseigné de manière catastrophique! (bon je vais pas relancer le sujet du topic des sciences)

Pour l’avoir enseigné en TES, je confirme mais justement, je fais attention à ne pas dire trop de merde (et sur ce sujet, les manuels eux-mêmes en sont truffés).
Le seul problème : regarde les sujets de bac, tu vas vite comprendre pourquoi j’emmerde le monde, notamment les élèves qui veulent des recettes.

**Molina** · 14/09/2017, 16h54

Les gens j'ai un problème.

Je voulais faire un truc tout con : Comparer des âges médians de deux échantillons avec une distribution non-normale stratifié par une variable Y. Alors hop, je chercher les test non paramétrique, je prends un Wilcoxon. Je cherche les conditions de validation et je trouve :

1 : Echantillon indépendant = > Normalement c'est vrai même si je pourrais pinailler dessus

2 : Variable continue = > Ok
3: egalité des variance = > A tester
4 : Même distribution.

Pour la 4, j'ai fait un test de kolmogorov smirnov, dans l'idée que si on ne rejetait pas l'hypothèse nulle, c'était bon, on pouvait utiliser le wilcoxon.

Ce que je ne vous ai pas dit, c'est que mes échantillons sont ENORMES (CM

. Plus de 100k personnes. Donc ... forcément... même avec la stratification, ça me fait de gros nombre qui tâchent, et forcément, tout les tests me reviennent significatifs.

Du coup, voilà ma question : En toute honnêteté scientifique, si mes conditions de validité ne sont pas réunis pour mon Wilcoxon, qu'est ce que je peux utiliser pour faire ma putain de comparaison de médiane (qui en plus de visu ne sont pas différentes).

(Et c'est dingue qu'aucun cours de stat en français ne donnent les conditions de validité pour les test non-paramétriques..).

**corentintilde** · 29/09/2017, 12h31

Pour ceux que ça intéresse : un problème à un million de dollars est plus ou moins en train de tomber. En l'occurrence c'est l'existence et unicité des solutions de Navier-Stokes, une des équations fondamentales de la méca flu. L'existence est réglée depuis Leray (1934), et pas mal de monde pensait qu'en poussant assez l'unicité arriverait, mais apparemment ça n'est pas le cas.

**Gobbopathe** · 29/09/2017, 12h42

C'est intéressant, merci. Il faut que la publi passe le feu croisé des matheux du monde entier maintenant, c'est peut-être l'étape la plus dure

**Enyss** · 29/09/2017, 13h14

Après, ce papier (s'il est correct) ne cloture pas la question : ils n'ont pas montré la non-unicité dans C^0_t L^2_x :

**corentintilde** · 29/09/2017, 13h35

Les auteurs ne sont pas d'obscurs cinglés, personnellement j'ai assez peu de doutes sur le fait que le papier est correct.
Par contre effectivement les solutions construites sont très faibles, mais elles sont bien continues à valeur L2, et même un peu mieux (l'espace H^beta c'est mieux que L2). C'est la énième itération d'idées dans l'air du temps qui ont fait leur preuve sur d'autres équations. Vu le niveau de concurrence sur ce thème (je peux le dire tranquillement car j'y travaille pas ! ) je pense que les gens sont poussés à sortir le plus vite possible un papier dès qu'ils font un progrès parce que 1) ça sera accepté dans une excellente revue 2) ils flippent de se faire griller.
On peut donc raisonnablement penser que ça va encore être raffiné. Enfin d'autres personnes (Vladimir Sverak) travaillent sur une approche différente, potentiellement plus puissante puisque ça donnerait la non unicité des solutions de Leray (qui est plus restrictif que la continuité L2), et ont commencé à avoir des résultats probants : https://arxiv.org/abs/1704.00560

Enfin la formulation sur le site du clay institute est assez floue, c'est du genre "faire des progrès significatifs sur l'existence de solutions", mais il me semble que les deux résultats attendus c'est la non unicité des solutions de Leray-Hopf, et la singularisation en temps fini des solutions régulières.

**Shosuro Phil** · 01/10/2017, 19h15

Désolé, pas de vraies maths a vous proposer, mais une blague que ma femme a testee avec succès sur des agrégatifs de maths... (j'ai teste avec des collègues un tout petit peu moins matheux, ça ne marche pas avec tout le monde!)

C'est deux suites de Cauchy qui vont a une soirée No Limits.
Elles arrivent devant la boite, et la, le videur les regarde et leur dit: "C'est complet".

**Vautour** · 01/10/2017, 19h32

Non mais pas de blague comme ça.

Voevodsky est mort hier ...

**Maalak** · 01/10/2017, 20h51

Deux mathématiciens viennent de prouver que deux infinis sont égaux.
Ca semble logique par la nature même de l'infini, mais encore fallait-il le prouver mathématiquement.

Accessoirement, vous pourrez faire le plain de gifs avec le lien que je vous donne.

**Vautour** · 01/10/2017, 20h56

Quel article de merde.

**darkpoulp** · 01/10/2017, 21h29

Slate arrive à faire moins bien que l'article en anglais de QuantaMagazine, qui était déjà mauvais.
Et non, N et R n'ont pas le même cardinal, malgré ce que dit l'article.

**ducon** · 01/10/2017, 21h38

Et l’argument diagonal, c’est de la merde ?

**Enyss** · 01/10/2017, 22h27

Si un mathématicien arrive à prouver que R et N ont même cardinaux, il mérite effectivement la médaille Field : il aura réussi à montrer que ZF(C) n'est pas cohérente ! Et ça c'est un résultat énorme

**Møgluglu** · 02/10/2017, 10h07

Envoyé par Vautour

Voevodsky est mort hier ...

Ah merde, et je n'ai toujours pas compris son axiome d'univalence.

**darkpoulp** · 02/10/2017, 11h09

Envoyé par ducon

Et l’argument diagonal, c’est de la merde ?

Apparemment, le journaliste qui a chié cet article est un prof de math. Quelle honte...

**Gobbopathe** · 02/10/2017, 11h35

Du coup ils ont prouvé quoi ?

**Souly** · 02/10/2017, 11h54

Apparemment que p=t.
De plus : Aleph0 < p = t <= 2^Aleph0.
En revanche, on ne peut pas décider si cette dernière inégalité est stricte dans ZFC, la formalisation adéquate de ces ensembles.

Pour savoir ce que sont p et t, ben euh, des cardinaux savamment définis sur des ensembles de N.

**Gobbopathe** · 02/10/2017, 12h07

merci

**corentintilde** · 02/10/2017, 21h10

2^N=R ça je sais le faire. N=! R aussi, et on sait qu'on ne peut pas décider si il y a des infinis entre N et 2^N. Du coup c'est quoi qui a été prouvé ?

**darkpoulp** · 02/10/2017, 21h22

Entre N et 2^N, yen a deux qui sont égaux.

**ducon** · 02/10/2017, 21h32

Il s’agit de cardinaux d’idéaux d’anneaux infinis de caractéristique 2.
https://gowers.wordpress.com/2017/09...isingly-equal/

**darkpoulp** · 02/10/2017, 22h29

C'est marrant, j'avais cru comprendre l'article de Tim Gowers, mais je vois pas du tout le lien avec le résumé que tu en fait. Est-ce que tu peux développer stp?

Discussion: Les matheux sont dans la place - pt=prout

Outils de la discussion

Règles de messages