Crunchez vos adresses URL
|
Rejoignez notre discord
|
Hébergez vos photos
Page 2 sur 2 PremièrePremière 12
Affichage des résultats 31 à 57 sur 57
  1. #31
    Citation Envoyé par jokletox Voir le message
    T'entends quoi par "mots négatifs" ?
    Les mots qui n’apparaissent pas spécialement chez le rédacteurs. En gros quand tu vois ces mots ça indique que c'est un autre membre de la rédaction qui a écrit l'article. Donc en gros les mots qui sont utilisé par le reste de la rédaction (ou un rédacteur en particulier) et/ou qui ne sont pas utilisé par le rédacteur.
    Ça rejoins ce que disais Izual :
    D'ailleurs, j'ai lu avec satisfaction la liste des mots qui ne me correspondent pas : "titre" et "gameplay", deux mots que je vomis, sont tout en haut.
    "Les faits sont têtus."


  2. #32
    Superbe, cette deuxième fournée. Mais pourquoi Kahn ne dit jamais "jeux" ? Pourquoi, Kahn ? Pourquoi ?


  3. #33
    Citation Envoyé par Laya Voir le message
    Les mots qui n’apparaissent pas spécialement chez le rédacteurs. En gros quand tu vois ces mots ça indique que c'est un autre membre de la rédaction qui a écrit l'article. Donc en gros les mots qui sont utilisé par le reste de la rédaction (ou un rédacteur en particulier) et/ou qui ne sont pas utilisé par le rédacteur.
    Ça rejoins ce que disais Izual :
    Ok, je comprends mieux
    Citation Envoyé par Wikipédia
    Le psychisme des trolls est depuis peu un sujet d'étude. Il en ressort une corrélation entre le comportement de troll et le sadisme, la psychopathie et le machiavélisme.

  4. #34
    Je n'aime pas du tout ça j'envoie une plainte à la CNIL.

    Plus sérieusement c'est très marrant à voir, merci pour le travail.

  5. #35
    Il ne faut pas hésiter à regarder le score aussi en bas. La plupart du temps c'est entre 0 et 2, mais Kahn Lusth par exemple monte vers 2-4 sur les mots "puisque" et "lorsqu" qu'il doit particulièrement utiliser.
    Contrairement à Izual, Pipomantis abuse du mot "titre" pour décrire les jeux.
    "Les faits sont têtus."


  6. #36
    C'est génial, merci beaucoup ! Je suis très contente que le mot « chien » soit présent dans la deuxième fournée, et ça me fait réaliser que je devrais me débarrasser de certains tics langagiers (suremploi du mot « incarner », notamment).

  7. #37
    Citation Envoyé par Izual Voir le message
    Superbe, cette deuxième fournée. Mais pourquoi Kahn ne dit jamais "jeux" ? Pourquoi, Kahn ? Pourquoi ?
    Parce que c'est le chef. Et les chefs, c'est pas là pour s'amuser.

  8. #38
    Citation Envoyé par Catel Voir le message
    Parce que c'est le chef. Et les chefs, c'est pas là pour s'amuser.
    D'un autre coté, il faut se rappeler qu'il faisait aussi (fait encore?) les poubelles de steam. Du coup le non emploi du mot jeu s'impose.

  9. #39
    Quoique, si j'ai bien compris le principe, ce n'est pas nécessairement les mots qu'ils emploient le plus souvent ou le moins souvent, mais les mots qui les caractérisent le plus.

    Je vais prendre l'exemple de Fallout (qui en fait n'est pas si bon), quand on le voit, on se dit qu'il y a plus de chances que ce soit Izual que n'importe quel autre rédacteur, peu importe qu'il ait été utilisé une fois ou mille fois.

    Tout comme j'ai été étonné de ne pas voir apparaître tronçonneuse.
    On a inévitablement (ça, c'est un mot que l'algo me donnerait en positif, on m'a déjà dit que je l'utilisais plus fréquemment que la moyenne XD) des expressions qui sont rattachées à des rédacteurs, même si leur usage est peut-être moins typique/fréquent que l'utilisation d'autres mots moins "remarquables/remarqués". On a une analyse différente à celle d'une machine quand on lit un texte.

    Enfin, ça c'est ma compréhension de ce truc. En tout cas, c'était bien amusant.

  10. #40

  11. #41
    Marrant cet analyse.
    Aller, histoire de chercher des poils aux oeufs : Laya, est-ce que tu as fait une validation croisée ?
    Rien ne me choque moi, je suis un scientifique ! - I. Jones

  12. #42
    Désolé, mais cette analyse a une faille, il manque le mot "splendide", qui est l'indice infaillible qu'il s'agit d'un texte écrit par Ackboo
    Personne d'autre n'utilise ce mot.
    Exemple dans le numéro 401 page 32.
    Dernière modification par atrepaul ; 17/12/2019 à 16h36.

  13. #43
    Citation Envoyé par Helix Voir le message
    Marrant cet analyse.
    Aller, histoire de chercher des poils aux oeufs : Laya, est-ce que tu as fait une validation croisée ?
    Désolé je viens de voir, non j'ai pas fait de validation croisée, mais à vrai dire j'ai pas trop cherché à optimiser la prédiction.
    J'ai d'autre chose en tête qu'il faudra que je teste quand j'aurais du temps .

    Splendide faudrait que je regarde si ça revient assez haut. si personne d'autre l'utilise il devrait revenir assez haut effectivement.
    "Les faits sont têtus."


  14. #44
    S'il n’apparaît pas, c'est peut-être parce que Ackboo ne l'utilise qu'une seule fois par article.

  15. #45
    Je l'utilise tout le temps, désolé


  16. #46
    Citation Envoyé par Laya Voir le message
    Désolé je viens de voir, non j'ai pas fait de validation croisée, mais à vrai dire j'ai pas trop cherché à optimiser la prédiction.
    J'ai d'autre chose en tête qu'il faudra que je teste quand j'aurais du temps .
    Pas de soucis. En fait je m'interrogeais sur la véritable capacité de prédiction du bouzin. Si tu as le temps, prends un nouvel article et regarde ce que ta classif te donne à partir de l'apprentissage déjà effectué.
    Rien ne me choque moi, je suis un scientifique ! - I. Jones

  17. #47
    Citation Envoyé par Helix Voir le message
    Pas de soucis. En fait je m'interrogeais sur la véritable capacité de prédiction du bouzin. Si tu as le temps, prends un nouvel article et regarde ce que ta classif te donne à partir de l'apprentissage déjà effectué.
    Il faudra que je vérifie mais normalement c'est ce que j'ai fait. En faite dans ma tête la validation croisée c'était les types plus complexe genre k-fold cross-validation, mais si j'ai pas trop fait ça à l'arrache j'ai bien fait un train et un jeu de données test et donc vers les 80% de réussite. Faudrait que je regarde les échantillons si c'est représentatif aussi.
    "Les faits sont têtus."


  18. #48
    Citation Envoyé par Laya Voir le message
    Il faudra que je vérifie mais normalement c'est ce que j'ai fait. En faite dans ma tête la validation croisée c'était les types plus complexe genre k-fold cross-validation, mais si j'ai pas trop fait ça à l'arrache j'ai bien fait un train et un jeu de données test et donc vers les 80% de réussite. Faudrait que je regarde les échantillons si c'est représentatif aussi.
    Oki. Je n'avais pas vu que tu avais séparé entrainement et test. Si c'est le cas, c'est encore plus amusant comme résultat
    Rien ne me choque moi, je suis un scientifique ! - I. Jones

  19. #49
    Ces infos mériteraient tellement une mise à jour
    (Comment ça je remonte le topic, non non )

  20. #50
    Citation Envoyé par olih Voir le message
    Ces infos mériteraient tellement une mise à jour
    (Comment ça je remonte le topic, non non )
    Je compte bien refaire tourner ça, mais je réfléchis aussi à des améliorations possibles sympas, faut que je vois quand je débloque un peu de temps pour ça.
    "Les faits sont têtus."


  21. #51
    Deuxième saison basé sur un échantillon d'article (entre 50 et 100 pour la plupart) sur pas mal des rédacteurs et anciens rédacteurs (Même méthode qu'expliqué dans le premier post de ce sujet ) :
    Plus exactement :
    Dandu 100 articles
    Ellen Replay 87 articles
    L-F. Sébum 84 articles
    Izual 83 articles
    Noel Malware 70 articles
    Ackboo 68 articles
    Kahn Lusth 64 articles
    Maria Kalash 64 articles
    Ivan Le Fou 62 articles
    oni 55 articles
    Netsabes 54 articles
    Pipomantis 48 articles

    (je peux probablement augmenter l'échantillon si ça intéresse pour une partie des rédacteurs, par exemple si vous avez l'impression que les résultats ne sont pas bons). Sachant qu'il y a pas mal de sections donc ça se trouve par exemple certain rédacteurs sont surtout testés sur leurs news et non sur leurs tests de jeux vidéo.

    Normalement c'est basé sur les articles qui viennent sur le site donc probablement par ordre chronologique (les derniers articles).


    Le premier lot j'ai gardé les mots avec + de 10 utilisations et les mots sans valeur (stop words). On va donc potentiellement voir apparaître des mots assez rare (10 utilisations minimum sur + de 50 articles) mais caractéristiques des rédacteurs
    La dernière fois j'avais supprimés ces mots car ils ne sont pas porteur de sens, mais cette fois je les ais gardés pour mettre en avant les habitudes des rédacteurs de canards pc. Certains utilisent "on", "vous", "et" d'autres pas du tout etc...
    Par exemple visiblement l'utilisation de 'il' ne va pas du tout de paire avec LF Sebum alors que Noel Malware l'utilise très couramment à priori ( en tout cas ça le distingue des autres rédacteurs).

    Pour rappelle :
    + la barre verte est haute + c'est caractéristique du rédacteur.
    + la barre rouge est haute moins c'est caractéristique du rédacteur








    Le deuxième lot arrive dans le poste suivant

    - - - Mise à jour - - -

    Suite du topic au dessus

    Dans le second lot j'ai gardé les mots avec + de 30 utilisations et aucun stop words (enfin sur la liste que j'ai). On va donc potentiellement voir apparaître des mots + fréquemment utilisé et + porteur de sens caractéristiques des rédacteurs.








    N'hésitez pas à demander si vous ne comprenez pas, ou si vous avez d'autre idée à explorer je peux faire assez facilement des graphiques dessus.
    Je vais regarder un peu les résultats et voir les performances du modèle en général. (je vais sûrement mettre à jour un peu ce poste).

    Pour donner une idée sur l'échantillon que j'ai le modèle prédit le bon rédacteur dans 88% des cas environ.
    Ça veux dire que si vous lui donner un article au pif de canard pc, il devrait avoir 88% de chance de donner le bon nom du rédacteur qui l'a écrit. (en supposant que mon échantillon est représentatif ce qui peut se contester ).
    Dernière modification par Laya ; 15/11/2021 à 21h06.
    "Les faits sont têtus."


  22. #52
    Wow, merci pour ce taf !

    Et comment ça je suis le seul à dire "perso"


  23. #53
    Vu que tu parles beaucoup de RPG, c'est logique, non

  24. #54
    Ouais merci, c'est trop cool. Par contre je comprends pas : "Zelda" "Breath" "Wild" ? Est-ce un message caché ? Peut-être une danseuse...

  25. #55
    Citation Envoyé par Noel Malware Voir le message
    Ouais merci, c'est trop cool. Par contre je comprends pas : "Zelda" "Breath" "Wild" ? Est-ce un message caché ? Peut-être une danseuse...
    Je sais pas mais hier, en regardant la 3è image avec les termes de Sebum, j'ai vu des enchaînements rigolos dans sa colonne verte : "horreur digne" et "mérite aux sorcières".

    Comment ça, les fans de Doom des satanistes ?

  26. #56
    Citation Envoyé par Izual Voir le message
    Wow, merci pour ce taf !

    Et comment ça je suis le seul à dire "perso"
    Ya' même pas "Fallout" dans tes verts. Je suis déçu.

    -.-.-– nAKAZZ, depuis 2024

  27. #57
    J'adore ces analyses :D

    Est-ce tu accepterais de refaire tes petites phrases de résumé du genre "tel rédacteur est obsédé par X et apprécie beaucoup Y, en revanche il n'aime pas A et B" ? :D

Règles de messages

  • Vous ne pouvez pas créer de nouvelles discussions
  • Vous ne pouvez pas envoyer des réponses
  • Vous ne pouvez pas envoyer des pièces jointes
  • Vous ne pouvez pas modifier vos messages
  •