Je vais pas reposter tout ce que j'avais déjà posté plus haut. Pour faire simple: avec une prompt basique, du genre juste le nom de l'artiste, tu obtiens parfois des trucs proches des originaux. Extrêmement facile de trouver l'image source.
Alors bien sûr avec des prompts plus élaborées y'a déjà un peu plus de travail et de "valeur ajoutée". Mais de la même manière (encore une fois exemple pour faire court) que quand tu réutilises du code source tu respectes la license, ça serait un minimum que d'être transparent quant au corpus d’entraînement.
Il est évident que les images de Darek ont été utilisée pour l’entraînement, comment ils ont acquis les images, ont il au moins payé l'artiste, ou ne serait-ce que le notifier, non.
Effectivement comme tu le dis Sosuro il est déjà extrêmement facile de voler des images sur internet, mais de manière générale ça va être relativement grillé si tu la réutilises telle quelle. Là un des problèmes, c'est que sur le site qui fait part du corpus, l'artiste original se retrouve côte à côte avec des images similaire à ce qu'il pourrait produire quand tu regardes ça en diagonal, mais c'est pas de lui.
J'avais joué à ce jeu vite fait pour essayer de faire piger aux canards mais certains avaient pas l'air de bien saisir le truc:
Le jeu c'est de trouver une prompt qui génère une image, tel qu'ensuite tu peux facilement trouver l'image source derrière l'image générée.
(Alors bien évidemment que c'est plus compliqué que "1 image source -> 1 image générée", j'espère qu'on est clair que c'est pas le sujet.)
Donc l'exemple classique (là c'est du domaine public donc "tout va bien"): tu tapes "La Pieta", tu vas te retrouver avec une image de La Pieta de Michel Ange, très clairement reposant entièrement sur l'image source de la Pieta, j'avais posté ça plus haut.
Ensuite j'avais utilisé comme prompt le nom d'un artiste Instagram "vendeur" assez connu, Ilya Kuvshinov. Et j'ai facilement généré des images proches des images sources.
J'pense que beaucoup de canard se perdent dans des tentatives d'explications autour des réseaux de neurones, en prenant leur interlocuteur un peu de haut lol.
Mais le sujet est très simple, faut être transparent sur les corpus d'entrainement, qui au final, c'est simplement un niveau d'indirection supplémentaire, contribue au modèle.
Ca finira sûrement par affecter un artiste que vous aimez bien. Si y'avait une transparence clair à ce niveau (prompt obligatoire liée à l'image, corpus d'entrainement, etc.) ça résoudrait pas mal de problème, bien sûr qu'on évitera jamais les dérives, mais faut bien commencer quelque part.
Y'a des sites qui font plus ou moins de la reverse research de prompt (en gros tu cherches les prompts des gens quoi), et là ça devient plus flagrant
du genre
https://prompthero.com/search?q=Darek+Zabrocki
- - - Mise à jour - - -
(et encore une fois pas du tout pour faire chier ceux qui font des trucs sympas en mode géo trouvetout sur le topic hein, simplement pour rapporter un peu ce qui se passe et discuter des potentiels problèmes)