Crunchez vos adresses URL
|
Calculez la conso électrique de votre PC
|
Hébergez vos photos
Page 111 sur 111 PremièrePremière ... 1161101103104105106107108109110111
Affichage des résultats 3 301 à 3 310 sur 3310
  1. #3301
    Tu l'as voulu, tu l'as eu Avatar de Kamikaze
    Ville
    Val de marne
    La p-value c'est de la merde.

    Bon j'exagère mais retiens bien que la p-value a extrêmement peu de signification, c'est vraiment de la merde faut insister sur ce point.

    En gros tu fais une hypothèse (dans le jargon qualifiée d'hypothèse nulle "H0"), tu supposes qu'elle est vraie, et tu regardes ton échantillon de la vraie vie.

    Étant donné cet échantillon quel paramètre il aurait fallu pour que ton hypothèse produise ce résultat/à quel point mon échantillon est rare dans le cadre de mon hypothèse, si le paramètre est délirant/tellement rarissime parmi mon hypothétique population que c'est pas croyable, alors tu peux décider de rejeter l'hypothèse, pour ce motif statistique.

    Ou alors tu peux décider de ne pas rejeter l'hypothèse, car tu respectes ton seuil arbitraire, pour ce motif statistique.

    Donc tu vois bien qu'en terme de signification c'est très très très faible, ça dit vraiment pas grand chose, ça dit juste "bon avec cet échantillon, je peux pas dire que cette hypothèse est complètement fausse"

    Donc ça dit absolument pas qu'elle est vraie!

    Mais attention, tout ça ça reste encore des simplifications, il faut avant tout que tu comprennes la notion de Test Statistic https://en.wikipedia.org/wiki/Test_statistic

    Et surtout ce passage:

    https://en.wikipedia.org/wiki/P-value#Calculation

    C'est le plus important et ça affaiblit encore plus cette notion.

    Et ça implique que tu comprennes bien la notion de variable aléatoire et de distribution.

    Wikipédia donne ensuite de très bons exemples pour monter l'absence total de signification de cette notion selon son utilisation, le plus simple:

    Tu utilises la p-value pour une population observée de 1. Juste un seul jet de dé, ton hypothèse nulle c'est que le dé est équilibré. Et on voit que le résultat n'a pas d'intérêt.

    One roll of a pair of dice

    Suppose a researcher rolls a pair of dice once and assumes a null hypothesis that the dice are fair, not loaded or weighted toward any specific number/roll/result; uniform. The test statistic is "the sum of the rolled numbers" and is one-tailed. The researcher rolls the dice and observes that both dice show 6, yielding a test statistic of 12. The p-value of this outcome is 1/36 (because under the assumption of the null hypothesis, the test statistic is uniformly distributed) or about 0.028 (the highest test statistic out of 6×6 = 36 possible outcomes). If the researcher assumed a significance level of 0.05, this result would be deemed significant and the hypothesis that the dice are fair would be rejected.

    In this case, a single roll provides a very weak basis (that is, insufficient data) to draw a meaningful conclusion about the dice. This illustrates the danger with blindly applying p-value without considering the experiment design.
    Dernière modification par Kamikaze ; 06/09/2017 à 02h36.

  2. #3302
    Tu l'as voulu, tu l'as eu Avatar de Kamikaze
    Ville
    Val de marne
    Donc pour revenir sur ta régression.

    Tu vas typiquement faire l'hypothèse: "mes données ne sont pas liées entre elles: une régression n'a pas de sens ici."

    Et tu vas pouvoir/vouloir rejeter (statistiquement) cette hypothèse.

    Et là tous les sagouins sans aucune morale ni rigueur vont en tirer la conclusion que tu peux l'accepter et que donc la régression est correcte. Mais tu vois bien que ça dit juste qu'on décide statistiquement de rejeter une hypothèse arbitraire, ça veut pas dire grand chose. Même si en pratique pour une régression ça peut passer (mais c'est très très dangereux potentiellement surtout si on parle de vie humaine et qu'on fait des choix à la con basés sur une p value sans aucun sens).

    Si tu regardes le passage que j'ai linké sur les test statistics tu vas voir d'où vient le fameux t, de ton t-test.

    Tu auras l'exemple complet de ton cas pour une régression ici:

    https://en.wikipedia.org/wiki/Studen...egression_line

    - - - Mise à jour - - -

    Donc TL;DR

    1. chez moi on se sert de ce test dans le cadre d'une régression linéaire avec R, donc c'est quoi l'hypothèse de départ ?
    Hypothèse de départ, le coefficient de la droite de regression est nul (données pas liée entre elles, pas de régression à faire)
    2. nous on garde les coefficients qui justement ont une p value < 5% (au lieu de les rejeter ?)
    Ce que tu "veux" c'est que ta régression soit vraie, donc tu veux rejeter l'hypothèse nulle et """"""""""""""accepter"""""""""""""" les coeffs où l'hypothèse est rejetée

    Les guillemets sont importants

  3. #3303
    Je savais qu'il existait plusieurs types de tests stats dont le test classique de Neyman-Pearson, de Bayes ou de Kolmogorov mais c'est la 1re fois que j'en vois un lié à la régression linéaire. Peut-être pas tant que ça si je me souviens bien de Kolmogorov.

    La p-value, jamais entendu parler sous ce nom là.
    Ce dont je me souviens, c'est qu'on parlait de risque de 1re espèce, c'est-à-dire le risque de rejeter H0 sachant qu'elle est vraie. Avec une valeur fixée à 5 ou 1%.

    Ah et au passage : https://fr.wikipedia.org/wiki/Valeur_p
    On lira avec beaucoup d'intérêt la page Wikipedia en anglais sur le p-value qui est beaucoup plus à jour que cette page.
    On voit le mec qui a la flemme de traduire. Pas la peine d'être contributeur dans ce cas.
    Citation Envoyé par Julizn
    Sinon, moi j'en ai jamais utilisé. Le gingembre frais ça s'achète en petite quantité. Y'a des glucides partout, dans les systèmes communistes.

  4. #3304
    T'Choupi découvre le monde Avatar de Alab
    Ville
    Gelbique
    Citation Envoyé par ducon Voir le message
    Normalement, tu as dû étudier ça en TS dans le chapitre sur les intervalles de fluctuation asymptotiques (au seuil de 5% dans ce cas).
    Ouais enfin bon la TS ça remonte à 7 ans et demi déjà.
    Et puis quand on pratique pas les maths c'est fou à quel point ça part vite, ça me déprime un peu (bon les stats j'en ai jamais trop fait non plus après aussi).

    Merci pour les autres explications, ça m'a bien éclairé.

  5. #3305
    Tu l'as voulu, tu l'as eu Avatar de Kamikaze
    Ville
    Val de marne
    ducon je sais pas si t'es au courant mais c'est enseigné de manière catastrophique! (bon je vais pas relancer le sujet du topic des sciences)

    C'est déprimant, typiquement les travers soulignés par wikipédia et la recette de cuisine sans AUCUN sens.

    Si tu tapes "intervalles de fluctuation asymptotiques" sur google et que tu regardes ce qu'il y a c'est assez évident qu'un élève ne pourra pas faire le lien avec les test statistic et la vraie compréhension du truc.

    C'est un cas particulier mal expliqué, et très souvent (j'en ai fait l'expérience en terminale et dans les cours de stats en école d'ingé), le prof présente la méthodologie pour pouvoir effectuer le test, et point barre.

    Je mets ma main à couper que 90% du temps c'est expliqué, texto, comme ça: (même exemple, mêmes valeurs, etc. copier/coller et sans élaborer)


  6. #3306
    Kamikaze, en fait je comprends pas que tu dises "c'est de la merde".

    Ou alors tu peux décider de ne pas rejeter l'hypothèse, car tu respectes ton seuil arbitraire, pour ce motif statistique.
    Donc tu vois bien qu'en terme de signification c'est très très très faible, ça dit vraiment pas grand chose, ça dit juste "bon avec cet échantillon, je peux pas dire que cette hypothèse est complètement fausse"
    Donc ça dit absolument pas qu'elle est vraie!
    Bien sûr, ce que tu écris est tout à fait vrai ! C'est le principe en stats. Dès lors que tu ne bosses que sur un échantillon, tu ne peux pas espérer par magie sortir des vérités sur une population entière sans risque d'erreur. Donc en effet la seule conclusion que tu pourras faire, c'est que tu valides ton hypothèse H1 avec un risque alpha de 5% ou 1% (ou moins). Et alors ? Que peux-tu faire de mieux ?
    Ensuite, ce seront les collègues dans le monde qui réitéreront ton protocole expérimental, ou bien des expériences approchantes, etc. Bref c'est comme ça que fonctionne la science non ?
    Tutos Youtube Dwarf Fortress, Dungeon Crawl Stone Soup, Cataclysm DDA et Aurora 4X : Gobbostream (synopsis et vidéos à télécharger ici). Chaîne Twitch. Chan CPC mumble Dwarf Fortress dans la section Divers

  7. #3307
    Tu l'as voulu, tu l'as eu Avatar de Kamikaze
    Ville
    Val de marne
    Ouais je pousse le trait, mais c'est parce que malheureusement, à chaque fois que j'ai vu enseigner cette notion, et dans de nombreuses publications sa signification, son utilisation sont déformées et elle sert de validation.

    Son contexte d'utilisation et toutes les nombreuses hypothèse qui l'entourent sont hyper importantes, et je voulais insister sur la ""faiblesse"" de sa signification. Ce qui compte c'est la réalité physique derrière les données observées, bien sûr la p-value peut-être un outil utile, mais ça dit ce que ça dit, pas plus.

    (bon alors bien sûr pour ceux qui connaissent déjà le sujet, j'enfonce des portes ouvertes)

    C'est pour ça que y'a un article wikipédia entier dédié à la mauvaise compréhension de cette notion

    https://en.wikipedia.org/wiki/Misund...gs_of_p-values

    Et plusieurs comics xkcd dédiés





    - - - Mise à jour - - -



    - - - Mise à jour - - -

    Va dans un cours d'économétrie et demande à un élève ce qu'est la p-value, il va te dire que c'est le chiffre calculé par la machine qui dit si la regression est bonne ou pas
    Dernière modification par Kamikaze ; 06/09/2017 à 14h44.

  8. #3308
    Citation Envoyé par Kamikaze Voir le message
    Va dans un cours d'économétrie et demande à un élève ce qu'est la p-value, il va te dire que c'est le chiffre calculé par la machine qui dit si la regression est bonne ou pas
    Ah oui effectivement un type qui dit ça, faut lui mettre une baffe. C'est clair que qn qui croit que si p<0,05 alors ce que je raconte est forcément vrai, ça va pas le faire.
    Tutos Youtube Dwarf Fortress, Dungeon Crawl Stone Soup, Cataclysm DDA et Aurora 4X : Gobbostream (synopsis et vidéos à télécharger ici). Chaîne Twitch. Chan CPC mumble Dwarf Fortress dans la section Divers

  9. #3309
    Citation Envoyé par Kamikaze Voir le message
    ducon je sais pas si t'es au courant mais c'est enseigné de manière catastrophique! (bon je vais pas relancer le sujet du topic des sciences)
    Pour l’avoir enseigné en TES, je confirme mais justement, je fais attention à ne pas dire trop de merde (et sur ce sujet, les manuels eux-mêmes en sont truffés).
    Le seul problème : regarde les sujets de bac, tu vas vite comprendre pourquoi j’emmerde le monde, notamment les élèves qui veulent des recettes.
    une balle, un imp (Newstuff #491, Edge, Duke it out in Doom, John Romero, DoomeD again)
    Canard zizique : ?, , Φ, , ¤ , PL, 10h, , , , , , 💩, , 🎮, 🎸 𝄢 🎹, 🎼, , , blues, BOF, BOJV, , 👅, 👄, 🎻, 𝄞, 2, 80, 🎹, , , funk, fusion, 🎸, , 🏭, 🗻, 🎷, 🌴, 🍔, 💀 , noise, pop, , , $ $, , et ⚑, soul, , 🍄, (allez là si vous ne voyez pas les miquets)

  10. #3310
    Les gens j'ai un problème.

    Je voulais faire un truc tout con : Comparer des âges médians de deux échantillons avec une distribution non-normale stratifié par une variable Y. Alors hop, je chercher les test non paramétrique, je prends un Wilcoxon. Je cherche les conditions de validation et je trouve :

    1 : Echantillon indépendant = > Normalement c'est vrai même si je pourrais pinailler dessus
    2 : Variable continue = > Ok
    3: egalité des variance = > A tester
    4 : Même distribution.

    Pour la 4, j'ai fait un test de kolmogorov smirnov, dans l'idée que si on ne rejetait pas l'hypothèse nulle, c'était bon, on pouvait utiliser le wilcoxon.

    Ce que je ne vous ai pas dit, c'est que mes échantillons sont ENORMES (CM. Plus de 100k personnes. Donc ... forcément... même avec la stratification, ça me fait de gros nombre qui tâchent, et forcément, tout les tests me reviennent significatifs.

    Du coup, voilà ma question : En toute honnêteté scientifique, si mes conditions de validité ne sont pas réunis pour mon Wilcoxon, qu'est ce que je peux utiliser pour faire ma putain de comparaison de médiane (qui en plus de visu ne sont pas différentes).

    (Et c'est dingue qu'aucun cours de stat en français ne donnent les conditions de validité pour les test non-paramétriques..).
    Bon blog de critique littéraire : https://gnossiennes.wordpress.com/

Règles de messages

  • Vous ne pouvez pas créer de nouvelles discussions
  • Vous ne pouvez pas envoyer des réponses
  • Vous ne pouvez pas envoyer des pièces jointes
  • Vous ne pouvez pas modifier vos messages
  •