Crunchez vos adresses URL
|
Rejoignez notre discord
|
Hébergez vos photos
Page 27 sur 43 PremièrePremière ... 17192021222324252627282930313233343537 ... DernièreDernière
Affichage des résultats 781 à 810 sur 1288
  1. #781
    Je teste midjourney et bon dieu que je hais Discord, mon royaume pour une web app
    Grand maître du lien affilié

  2. #782
    Citation Envoyé par Enyss Voir le message
    C'est déjà accessible sur une machine perso ce genre de trucs. Pas l'entrainement du réseau (vu que ça demande beaucoup de temps GPU), mais une fois qu'il est entrainé, il ne suffit que d'un PC avec un GPU correct pour pouvoir générer des images.

    https://rentry.org/SDInstallGuide
    A voir combien de Go le modèle prend et notamment en RAM/VRAM.
    J'avais été étonné à quel point un GPT 2 était lourd par exemple ( 22 Go à télécharger et en RAM devais falloir au moins 32 Go pour le charger, chez moi ça passait pas en tout cas).

    Mais en plus il vient de sortir un papier pour réduire la taille des modèles d'un facteur 4 avec une concession assez légère en performance et ça pourrait du coup aller plus vite encore que je le supposais.
    "Les faits sont têtus."


  3. #783
    Le modèle de stable diffusion fait moins de 5Gb et il faut 10Gb de ram sur le gpu pour le faire tourner avec des flottants 32bits. Mais on peut faire tourner le modèle avec des flottants 16bits, donc à peu près moitié moins pour la configuration "minimum"

  4. #784
    Comme je l'avais lu sur reddit, on est pas ici dans le même cas que l’avènement de la photographie?
    Un nouveau media/avancée technique qui n'a pas pour autant mis tous les peintres au chômage. Aujourd'hui encore la peinture se porte bien. L'art dans la photographie est très différent de l'art de la peinture, comme l'art dans la génération d'image est très différent de l'art de la création d'image.

    Dans le cas de ce premier prix, le résultat primé était un peu plus compliqué que d'appuyer sur un bouton (écriture de la commande, tri, photoshop, processus itératif, etc...). Une tempête dans un verre d'eau ?

  5. #785
    Citation Envoyé par Enyss Voir le message
    Le modèle de stable diffusion fait moins de 5Gb et il faut 10Gb de ram sur le gpu pour le faire tourner avec des flottants 32bits. Mais on peut faire tourner le modèle avec des flottants 16bits, donc à peu près moitié moins pour la configuration "minimum"
    Merci pour les ordres de grandeur, c'est bon à savoir.
    Du coup moyennant une carte graphique des dernières générations ça passe pas mal à minima pour le moment, donc on peut imaginer assez rapidement facilement.

    Je ne sais plus qui en parlait, mais typiquement si demain tu veux faire un jeu de carte en ligne, c'est quand même hyper pratique comme outils pour un prix de revient imbattable avec un résultat totalement honnête pour le peu que tu prennes du temps à faire le tri.
    Alors dans mon coeur ça ne vaudra probablement pas les artwork de carte magic , mais si je voulais faire un jeu de carte avec un budget limité je n'hésiterais pas une seule seconde.
    "Les faits sont têtus."


  6. #786
    Petite question pour un petit projet perso en IA avec de la Computer Vision, mais vu que je m'y connais pas.

    Je voudrais faire une app qui compte les résultats de D6 à partir d'une photo. C'est quoi l'état de l'art en ce moment en détection et reconnaissance d'images simple à implémenter?

  7. #787
    Si je comprend bien ta demande, c'est de prendre une photo avec des d6 puis d'avoir un algo qui identifie les dés puis lis ce qu'il y a sur les dés, et les sommer?
    "Les faits sont têtus."


  8. #788
    Oui, enfin les sommer, les dénombrer pour faire des opérations derrières.

  9. #789
    Je n'ai jamais touché à ce genre d'algo, mais il y a quelques projets qui trainent sur GitHub.
    Plus ou moins complexes (de la détéction de formes basiques aux machine learning).

    https://github.com/BenyaminZojaji/Di...ognition.ipynb
    https://github.com/Kishaan/Dice-Dete...etection.ipynb
    https://github.com/nell-byler/dice_detection

  10. #790
    Le dernier est bien sympa et il a même mis le dataset d'image de dés qu'il a fait!
    Ca a l'air de faire un bon point de départ et il y a de la place pour bricoler, merci

    Il me semble qu'un truc qui se fait c'est d'augmenter les data en mettant du bruit, changeant les contrastes/couleurs, déformations. Il le fait déjà dans son code? j'ai pas l'impression, j'ai vu ça (qui est facile, juste du bruit) ou ça ( plus dans les déformations, un peu plus laborieux pour pour les labels, mais une librairie qui gère automatiquement cette partie ca doit se trouver non? et c'est keras pourquoi je me pose la question)
    Dernière modification par ian0delond ; 06/03/2023 à 17h40.

  11. #791
    Les deux premiers projets n'utilisent aucune IA c'est de la pure computer vision. Je suis pas sûr de l'apport de l'IA vu que ce sont des formes assez simples, faut voir si tu veux simplement utiliser une lib qui fait de la détection/classification d'objets ou implémenter le truc à plus bas niveau.

    Avec une transformée de Hough (ce que fait le premier projet) c'est assez simple de faire un algo maison pour avoir le compte. Perso je recommanderais de partir là dessus, ça te donnera une bonne base, que tu pourras enrichir après

    Pour aller plus loin tu peux ajouter une projection du plan pour supporter plusieurs angles de caméra

  12. #792
    oui, mais, nous pouvons le construire le modèle, nous en avons la possibilité technique, il sera supérieur a ce qu'il était avant le ML, le plus fort, le plus rapide, en un mot, le meilleur.

    C'est sur que pour un truc pro c'est ridicule (quoi que pour financer un projet innovant....) mais surtout là pour être rigolo à bidouiller. et la transformée de Hough ça fait plus rêver les français depuis qu'on a ces réseaux neuronaux qui font des trucs.

  13. #793
    Citation Envoyé par Kamikaze Voir le message
    Les deux premiers projets n'utilisent aucune IA c'est de la pure computer vision. Je suis pas sûr de l'apport de l'IA vu que ce sont des formes assez simples, faut voir si tu veux simplement utiliser une lib qui fait de la détection/classification d'objets ou implémenter le truc à plus bas niveau.
    Je partirais également sur une solution d'analyse d'image un peu classique (détection de lignes et de points, du seuillage et de l'étiquettage). De l'apprentissage artificiel me semble un peu "too much".
    Rien ne me choque moi, je suis un scientifique ! - I. Jones

  14. #794
    Citation Envoyé par ian0delond Voir le message
    oui, mais, nous pouvons le construire le modèle, nous en avons la possibilité technique, il sera supérieur a ce qu'il était avant le ML, le plus fort, le plus rapide, en un mot, le meilleur.

    C'est sur que pour un truc pro c'est ridicule (quoi que pour financer un projet innovant....) mais surtout là pour être rigolo à bidouiller. et la transformée de Hough ça fait plus rêver les français depuis qu'on a ces réseaux neuronaux qui font des trucs.

    Mais y'a pas de problème mon bon monsieur, c'est simplement que c'était ambigu le "simple à implémenter", généralement "implémenter" ça entend que tu vas pas forcément être trop haut niveau à combiner des libs

    Dans ce cas là partir sur des libs avec des CNNs (s'plus pour du flux vidéo généralement mais bon ça fera l'affaire) te mettra bien ouais

    Au pif peut-être que tu peux mater ça: https://towardsdatascience.com/a-two...h-e5620e5fa0a3

    J'imagine que doit y avoir pas mal de projets du genre ouais (avec des dés, des cartes, des jeux de table quoi)

  15. #795
    C'est la faute à Arteis

  16. #796
    Présentation des résultats de google pour leur dernier papier IA Musicale.



    TLDW : la génération de musique par IA du même type que pour les images va arriver très vite.

  17. #797
    Ca existe déjà tu as déjà des plateformes payantes qui sont utilisées par des professionnels.
    Grand maître du lien affilié

  18. #798
    Citation Envoyé par tompalmer Voir le message
    Ca existe déjà tu as déjà des plateformes payantes qui sont utilisées par des professionnels.
    Pff

  19. #799
    https://soundraw.io/
    https://www.beatoven.ai/

    Y'a encore de la place sur le marché je trouve que c'est un peu cher
    Grand maître du lien affilié

  20. #800
    Non mais j'avais bien compris ce que tu voulais dire, c'est juste que ce n'est pas du tout la même technique que le papier.

    C'est comme si quelqu'un venait poster sur GPT-4 et que tu disais que ça existe déjà avec les markov chains.

  21. #801
    Hum, tu es sur que ce n'est pas la même technique ?
    J'ai pas lu le dernier papier de google, mais comme ils bossent surtout sur les IAs génératives, il y a des chances que ce soit peu ou prou une amélioration et une application des techniques en cours dans le domaine depuis pas mal de temps, qui sont également très probablement celles utilisées maintenant par certains site non ?

  22. #802
    L'enfer

    Edit : j'ai pas le temps de partir en croisade pour savoir qui a raison ou tord la dedans, mais au moins vous pourriez regarder la vidéo, ou lire le papier. Je suis relativement persuadé que les techniques génératives utilisées dans les sites proposés par tompalmer n'ont rien à voir avec l'IA de google. Les premières sont plus procédurales de ce que je comprend, tandis que la nouvelle IA de google génère un morceau fini à partir d'un prompt, via du Deep Learning, à la façon d'une image pour Dall-E 2.
    Dernière modification par Awake ; 21/03/2023 à 12h07.

  23. #803
    Tu pourrais aller lire le papier tout autant

    Sinon, c'est exactement ce que je te disais : les techniques de générations de musiques via des réseaux de neurones profond c'est assez connus et vieux maintenant (on faisait de la génération de son via réseaux de neurones il y a une dizaines d'année déjà de mémoire (edit, encore plus vieux en fait, c'est fait depuis le début des réseaux de neurones, les années 70, et ça a continué de manière tranquille avec l'évolution des techniques)), et il y a eu pas mal de publis de travaux donc pas mal de choses fonctionnelles qui sont peu ou prou accessibles à tous. Je ne sais pas quelles algos les sites du milieux utilisent (pas convaincu qu'on puisse vraiment le savoir, la plupart disent simplement « IA ») mais il serait surprenant qu'ils n'aient pas déjà intégré ce qui se fait ... surtout que la plupart de ces sites/outils ont moins de 5 ans... soit a peu près quand on a commencé à pondre ces algos de deep learning en masse de manière visible pour le grand public. (voir une liste ici)

    Edit : après recherche : Riffusion, par exemple, c'est dit explicitement que c'est basé sur les mêmes procédés génératif que stable diffusion etc. mais en fait la plupart c'est peu ou prou les même techniques derrière. Quand tu regarde les résultats de soundraw c'est presque sur que c'est des dérivés de réseaux de neurones génératifs, le résultat est trop bon pour être autre chose.

    Ça ne veut pas dire que Google ne fait pas mieux qualitativement, mais ta comparaison avec GPT4 et les chaines de Markov est un peu fallacieuse et loin du compte.
    Dernière modification par Nilsou ; 21/03/2023 à 12h33.

  24. #804
    Donc si je comprend bien, Google a publié un papier avec un résultat inférieur à ce qui se fait depuis 5 ans (y'a qu'à écouter les morceaux sur les sites que propose tom et la vidéo, genre le jazz, pour s'en rendre compte), sans grande avancé technique non plus.

  25. #805
    C'est mal de détourner le propos des gens et d'être aussi salé que les plages de guerandes .

    Je m'autocite :

    Ça ne veut pas dire que Google ne fait pas mieux qualitativement, mais ta comparaison avec GPT4 et les chaines de Markov est un peu fallacieuse et loin du compte.
    Et pour répondre : non, ça veut juste dire que Google s'inscrit dans une progression de petit pas. (Comme beaucoup de leurs avancées techniques d'ailleurs) . Et qu'ils ont simplement amélioré et appliqués à d'autres contextes des techniques très largement diffusées. En l’occurrence des variantes de réseaux de neurone génératif.

    La comparaison entre le saut technique fondamental qu'il y a entre des chaine de Markov et GPT4 est juste erronée.
    (Scientifiquement, sur le fond, il y a de l'idée cependant, car GPT4 est finalement une chaine de markov avec un très gros degrés de finesse, mais techniquement le substrat n'a rien à voir).

  26. #806
    Mes excuses, je n'aurais jamais du prendre personnellement vos réponses. Je vous connais en plus. Je me suis fait eu comme un bleu.

  27. #807
    Aucun soucis ^^

    Ceci dit, même si je trouve ça très peu probable, il n'est pas impossible qu'il y ait quelque chose de fondamentalement révolutionnaire dans le papier en question sur la musique. Mais après avoir vu la vidéo, je n'ai franchement pas l'impression.
    (ça ne veut pas dire qu'il n'y aura pas des applications pratiques explosives, attention. GPT3 n'est pas franchement révolutionnaire scientifiquement, ni même techniquement, par rapport à GPT2, mais c'est une version « plus encore » qui dépasse un seuil psychologique d'efficacité suffisante pour commencer à amorcer des changements dans la société humaine. Il n'y a pas besoin d'être « révolutionnaire » scientifiquement, ni même techniquement pour amorcer une ... révolution, dans le secteur social, si tu progresse par petit pas tu finis par atteindre un seuil ou certaines pratiques en sociétés deviennent obsolètes, ce qui amorce de lourd changements sociaux).
    Dernière modification par Nilsou ; 21/03/2023 à 13h02.

  28. #808
    Petit test du coté multimodal de GPT4.



    C'est pas encore au point

  29. #809
    Citation Envoyé par Nilsou Voir le message
    C'est pas encore au point
    Moi je vois qu'on lui montre une image de chat, et il se met à utiliser des emojis chats. Il n'y a donc aucun problème...

  30. #810
    Citation Envoyé par Nilsou Voir le message
    Petit test du coté multimodal de GPT4.

    https://zupimages.net/up/23/12/vyot.png

    C'est pas encore au point
    En fait il sait que c'est un chat parce que c'est dans l'URL. Une autre image avec une URL cryptique fait qu'il dit qu'il ne sait pas "voir" une image (et donc la décrire).

    Pour le moment je suis déçu de l'intégration de Bing à droite de la page web. Il ne sait pas non plus lire les pdf, même lorsqu'ils sont ouverts dans le navigateur. Il faut surligner le texte, et c'est limité à 2000 mots.

Règles de messages

  • Vous ne pouvez pas créer de nouvelles discussions
  • Vous ne pouvez pas envoyer des réponses
  • Vous ne pouvez pas envoyer des pièces jointes
  • Vous ne pouvez pas modifier vos messages
  •