Team bleu, ou "l'hydre à 3 têtes" !!
Merci Awake, c'est vraiment marrant comme "outil", je trouve que le mur de mots clés correspond pas mal dans mon cas; la méthode de classification est élégante !
Chaine Youtube : vidéos sur le Seigneur des Anneaux JCE et autres jeux divers et variés.
Beau travail.
Merci
Dommage, je ne poste pas assez pour avoir droit à mon mur.
Hôte et animateur du topic rugby : on n'a pas gagné la Coupe du Monde () mais on est toujours là !
17 ans de forum pour me retrouver à la périphérie avec griffon et dreadmetis, putain la haine
C'est quand même plutôt basé sur les messages relativement récents, même si y a plusieurs AnonymeXXXXX.
Pas de signature.
Ca me donne envie de shitposter pour savoir ce que le TF-IDF retiendra de moi en termes de mots.
(A partir de combien de posts / masse textuelle il y a calcul, d'ailleurs ?)
En vrai, ça m'amuse beaucoup car l'analyse des réseaux, le TF-IDF, ce sont des outils que j'utilse au boulot pour analyser la production scientifique de mon établissement... C'était inattendu de les retrouver ici
Je crois qu'il ne prend que les TyranausOr donc il te reste 4771 shitposts à faire, commence toute de suite
Coucou
Fufufu.
Au pire, le code est dispo pour en refaire un.
Je suis prête à ressortir ma potite formation Python et essayer de comprendre enfin pour voir mon graphique
La méthodo pour les données est :
Et il faut au moins que cela représente 200 message pour le canard concerné pour avoir un nuage de mots.Données
Les données ont été extraites selon la méthode suivante : dans chaque section (sauf celles exclues), récupération de tous les sujet dans lesquels il y a eu au moins un message dans l'année précédente. Puis, dans tous les messages de ces topics, récupérer les données des messages qui ont été postés après le 1er janvier 2020. On a donc 3 ans de données sur plusieurs sections du forum (entre autres : Jeux vidéos sur PC, Jeux Online, Canard Café). Tout le scraping a été fait "manuellement", dans le sens qu'un bot a parcouru le forum comme un utilisateur pour lire les pages, sans avoir accès à la base de données source du forum. Les données sont donc toutes publiques, et il y a la liste des sujets extraits sur le site ("Corpus" dans le footer).
Ok c'est plus large que je pensais, vu le peu de gens dans le graph je m'attendais à un minimum plus élevé. Merci Awake.
Coucou
C'est prévu de faire un nouveau run avec les corrections proposées ou c'est comme ca et on ferme notre gueule a tout jamais ?
Grand maître du lien affilié