A A A
Avatar

Please consider registering
guest

sp_LogInOut Log In sp_Registration Register sp_MemberList Members

Register | Lost password?
Advanced Search

— Forum Scope —




— Match —





— Forum Options —





Minimum search word length is 3 characters - maximum search word length is 84 characters

sp_Feed Topic RSS sp_Related Related Topics sp_TopicIcon
Les abus de l'IA Générative, les sources pour comprendre le problème (et lutter contre, en partie).
[Infos Pratiques]
Topic Rating: 0 Topic Rating: 0 Topic Rating: 0 Topic Rating: 0 Topic Rating: 0 Topic Rating: 0 (0 votes) 
10 mars 2024
16:47 pm
Avatar
Gribouille Sensei
Forum Posts: 10752
Member Since:
26 juin 2013
sp_UserOfflineSmall Offline

Bon, je vous préviens tout de suite, je n'ai malheureusement pas le temps de faire long sur le sujet, mais je vais y mettre les bases pour comprendre le problème.

Pour les gens qui veulent quelque que chose de plus long, j'ai mon Thread Twitter, qui suit la chose depuis...

Littéralement UN AN ! gah

Vous y trouverez assez d'éléments de preuves des abus à travers le temps, mais aussi de la volonté des TechBro de pousser le modèle en avant bien plus pour se faire de l'argent rapidement que pour un quelconque réel "progrès pour l'humanité, les artistes,...". Artistes qui, il faut le comprendre, ont été les premières principales victimes et que ces abus et ont vu de RÉELLES conséquences sur leur métiers, mais absolument AUCUNE de positive. bad

Alors que paradoxalement, et comme on commence à le prouver via les différents procès aux USA, l'entièreté du Modèle de Développement des Algorithmes de ces IA, ainsi que le Business Model des boîtes qui sont derrière (Open AI, Midjourney, Stable AI, etc) repose entièrement sur LE VOL DE DONNÉES LE PLUS MASSIF DE L'HISTOIRE. Car oui, sans les bases de données gigantesques comme LAION (qui au départ n'était destinée qu'à la recherche, et qui est constituée de millions de fichiers, textes, images prises sur Internet sans jamais demander la moindre autorisation à qui que ce soit), les fameuses IA Génératives ne pourraient tout simplement rien faire. ouuuups

On vante aussi leurs progrès à travers le temps et le fait que ce qu'elles produisent actuellement est plus crédible, réaliste, difficile à identifier comme étant produit par une IA... Mais il faut encore une fois comprendre que l'IA elle même ne fait pas de progrès : les Devs des IA raffinent les algorithmes pour qu'ils fournissent un résultat plus précis par rapport à la demande, mais l'essentiel des "Progrès" viennent... Du fait de voler encore et toujours plus de données. omg

Et à quoi ça aura servi pour le moment ? Au mieux, à faire des articles bidons sur internet, générés rapidement pour remplir des sites de Com ou de News, ou encore faire des images de Com, des couvertures de livres, sans demander à un vrai artiste de s'y mettre... Et souvent avec un résultat d'une qualité encore très discutable, surtout par rapport au travail d'un professionnel, et sachant qu'on aura volé le dit travail précédent de ces mêmes professionnels pour en arriver là. wacko

Et au pire ? On a des Fake News encore plus "réalistes" qu'avant (alors que les gens se faisaient déjà avoir par des trucs bien moins poussés) ou, bien sur, tout ce qui est Deep Fake Porn et autres horreurs de ce genre. brooding

Bref, pour le moment, ces IA Génératives n'ont très franchement rien apporté de bon, à part remplir les poches des gens les moins scrupuleux de la planète. dry

Si vous n'avez pas de problème avec l'anglais, voici la vidéo Youtube qui traite du sujet de la façon la plus complète qui soit. wink

AI Vs Artist

Actuellement, on est donc bel et bien sur une période dite "Vendor Driven", ou ce sont les Business qui vont tenter de vous faire croire au côté "positif" de cette Tech pour faire un max de pognon avec, et ce avant la phase "Legislator Driven"... En gros, celle ou les législateurs vont se pencher sur la légalité des procédés, encadrer les abus, mettre à jour les règles existantes pour y intégrer ces nouveautés... Du coup, il faut bien comprendre qu'actuellement, tout ce fait dans un environnement ou les abus sont "la norme". Si vous utilisez une de ces IA Génératives, la probabilité que vous le fassiez avec quelque chose qui a été volé à quelqu'un quelque part, est tout simplement de 100% (si vous n'utilisez pas votre propre base de donnée, uniquement composée de vos propre textes, dessins, etc. Mais dans un tel cas, le résultat sera sans doute bien moins impressionnant, je vous préviens. whistle).

Une fois que la phase "Legislator Driven" sera passée, et que les lois et règlements seront mis en place, commencera la réelle phase intéressante : "User Driven", celle ou les utilisateurs auront un outils, un vrai, qu'il pourront employer sans se poser des questions d'éthique sur le résultat... Et même pouvoir en revendique les droits sur le contenu ! Car oui, pour le moment, TOUT ce qui est produit par une IA Générative n'est pas reconnu en terme de Propriété Intellectuelle ni de Copyright, pour le simple fait que la personne qui demande à la machine de générer du contenu n'est en fait qu'un "commanditaire" et absolument pas l'auteur du résultat. L'auteur étant la machine, la propriété intellectuelle et le copyright ne peuvent pas lui être octroyé. ouuuups

Ce qui met nos cher TechBro dans une situation assez paradoxale : la plupart d'entre eux se défendent dans les procès pour pouvoir continuer à utiliser dans le développement de leurs IA du contenu sous copyright, sans avoir à payer pour son exploitation, tout en demandant que les résultats des ces vols de données sous copyright soient, eux, reconnus comme quelque chose de déposable en terme de copyright ! C'est pas l'hypocrisie qui manque chez ces gens là. dry

Par contre, cette phase "User Driven" est importante à garder en mémoire car il faut le rappeler aussi : personne n'est contre l'IA en tant qu'outil ! Et pour être franc, dans un paquet de milieu (que ce soit le dessin ou l'animation par exemple), on se sert déjà des IA depuis des années !... Mais on s'en sert pour toutes les tâches répétitives et rébarbative, comme l'IA qui traces tous les traits de contours sur les personnages des films d'animation Spider-verse, par exemple. Entraîner une IA à faire ces centaines de milliers de traits à la place d'un pauvre humain, permet à ce dernier de faire autre chose de plus créatif dans le processus de production du film. On gagne beaucoup de temps, de l'argent, et on a une personne qui ne devient pas cinglée à force de faire des traits partout, tout le temps, pendant des mois. tongue2

Or, actuellement on vous vend ces IA Génératives comme des outils qui remplacement quasiment, voir totalement les 100% du processus créatif. Et ça, personne n'en veut (sauf bien sur les gens qui veulent faire du pognon, et si possible sans en dépenser trop ou même pire : devoir faire des efforts. bad).

Bref, la situation actuelle ne permet absolument pas de défendre la position de la plupart de ces entreprises d'IA Génératives. Certaines d'entre-elles tentent de faire les choses "éthiquement", mais comme leurs progrès seront mécaniquement plus lents que ceux qui se torchent avec l'éthique et les lois actuelles, ce ne sont pas eux qui sont à l'origine des abus massifs qu'on constate en ce moment. rolleyes

Et donc les solutions, pour le moment : faire des procès (c'est en cours happy), légiférer (c'est aussi en cours tongue2), et pour les artistes... 

- Glaze : un logiciel qui met un degrés de "bruit" dans votre dessin qui empêche les IA d'identifier correctement son contenu et de le répliquer avec perfection. Cela entrainera des défauts dans l'oeuvre générée par l'IA et au cas ou un individu tente carrément de générer des oeuvres avec un style similaire au votre, ses efforts seront voués à l'echer. whistle

- Nighshade : à utiliser après Glaze pour ceux qui veulent lutter plus activement et pas seulement protéger leur travail. En effet, Nightshade est un "poison" pour les base de donnée car il introduit de fausse information sur le contenu du dessin qui a été absorbé par la base de donnée. En gros, si vous dessinez par exemple un parapluie, Nightshade va dire à l'IA que c'est en fait un chaton... Et si quelqu'un tente de générer un chaton, l'IA aura dans ses donnée des chaton et... Un petit paquet de parapluie qui vont garantir un résultat assez grotesque à l'arrivée (L'IA elle même ne sachant tout simplement pas réellement ce qu'est un chaton ou un parapluie). Par contre, si vous utilisez Nightshade, ne le précisez pas sur Internet : l'intérêt d'un poison devient nul si la personne en face arrive à savoir ce qui en contient ou pas. sneaky

Et maintenant, si vous avez d'autres question, ce Topic est là pour ça aussi. wink

BONUS : La liste des pièces de l'accusation dans le procès des artistes US contre plusieurs boîtes Tech d'IA Générative. Je vous conseille d'aller jeter un oeil sur les Exhibits I et J, respectivement un comparatif d'oeuvre originales avec celles qu'on peut ressortir de la base de donnée de Midjourney, et la fameuse liste des artistes à qui on a volé le travail pour constituer une partie de cette même base de donnée. wacko

10 avril 2024
15:18 pm
Avatar
Gribouille Sensei
Forum Posts: 10752
Member Since:
26 juin 2013
sp_UserOfflineSmall Offline

Allez, on continue avec les infos sur les IA Générative et pourquoi c'est un problème. Pour bien comprendre, autant le faire avec humour et commencer par 2 vidéos en anglais : une de Last Week Tonight with John Oliver et une autre de The Daily Show with Jon Stewart.

Last Week Tonight Special AI.

~

The Daily Show : The False Promises of AI

La première est intéressante car elle fait vraiment le tour du "phénomène" et explique au passage que les IA qu'on essaie de nous vendre sont en fait des "Narrow AI" (spécialisé dans une tâche précise, avec un algorithme logique qui les fait tourner) et non pas des "General AI" (en gros, Jarvis dans Iron Man... Ou dans la cuisine de Mark Zukerberg, comme il aimerait nous le faire croire alors que c'est faux. ouuuups Les IA Générales sont encore à ce stade de la pure Science-fiction). Il fait aussi le tour des réelles utilités potentielles du Machine Learning, et par comparaison, les problèmes qu'on va forcément rencontrer si on essaie de mettre en place trop vite des avancées dont les développeurs eux-mêmes reconnaissent ne pas toujours comprendre à 100% (le fonctionnement de l'algorithme devenant trop opaque pour être encore analysable, même pas les humains qui l'ont créé). confused

La 2ème vidéo est aussi très intéressante dans le sens ou elle se penche sur la question des "Promesses" de l'IA, ce qu'elle est sensée apporter au Genre Humain... Et J'ai été très content d'y voir apparaître une critique des fameux métiers d'avenirs que sont les "Spécialiste / Ingénieurs AI"... Qui sont en fait juste les gens qui tapent des Prompts dans la machine. Des gens qui font des phrases pour expliquer à l'IA Générative ce qu'elle doit faire. Et là, on ne parle pas de Code, ou autre truc obscur pour le commun des mortels... Non, juste comment bien demander en une paire de phrase ce qu'on veut obtenir de l'IA. C'est tout. mellow

Et ce n'est pas un métier... Ça ne peut tout simplement pas l'être. dry

La preuve avec une formation des Gobelins qui a pas mal fait un Bad Buzz sur Twitter récemment. whistle

Réfléchissez-y sérieusement 2 secondes... Une formation de 9 heures au TOTAL, sur 3 jours (pour la belle somme complètement aberrante de 950€ ! wacko) pour vous servir de Midjourney... Qui peut s'imaginer qu'il peut y avoir une tâche intéressante à apprendre, une "compétence" à acquérir au bout de ces 3x3 heures ?! Quel professionnel serait assez con pour se faire avoir ? (Oui, bon, suis sur qu'il vont avoir des clients pour ce truc... Triste mais sans doute vrai. rolleyes)

l'IA a réellement une place dans notre avenir, et comme le précise si bien la vidéo de John Oliver, elle est déjà présente dans notre vie sous une tonne de formes pratique auxquelles on ne pense déjà plus du tout comme étant de l'IA (après tout, ChatGPT n'est qu'un correcteur d'orthographe sous hormones). Mais ce qu'on tente de nous vendre à l'heure actuel n'a en réalité pas vraiment d'avenir, sauf chez les gens qui pensent pouvoir se débarrasser du "coût" qu'implique le fait de travailler avec d'autres humains... Ce qui peut effectivement paraître brutal "quand on pense comme un être humain"... sneaky

10 avril 2024
17:40 pm
Avatar
Gribouille
Members
Forum Posts: 56
Member Since:
17 novembre 2019
sp_UserOfflineSmall Offline

Ayant maintenant des connaissances de codeur, je pense être en mesure de dire que le plus gros désastre est l'appellation par le terme "IA" des choses qui n'en sont pas. Il y a d'une part les algorithmes, que l'on peut toujours remodeler à notre sauce mais qui font littéralement ce qu'on leur à ordonner dans le code qu'on leur à implanter, et d'autres part les "IA" qui correspondent à un algorithme très ouvert, dont les directives sont peu orientées et qu'on n'a pas restreint en terme de copyright et d'action éthique, ces dernières sont d'ailleurs uniquement basées sur du Machine Learning. Dans ce deuxième cas, il s'agit seulement d'une astuce peu honorable dont certains codeurs ont eu recours et l'idée à OpenAI afin de renvoyer toutes les responsabilités éthiques de leur produit sur le produit (=ici l'"IA") lui-même. Normalement, légalement parlant, OpenAI devrait payer une amande galactique sur tout les vols de leurs IA.

Mais là bien sûr, avec tous les lobbys et grands groupes à qui l'invention profite pour dépenser moins et voler plus, en faisant passer ça pour légal, personne ne viendra les arrêter.

L'anatomie est aux personnages ce que les racines sont aux arbres. Henri Tusseau

Se redresser après un échec et marcher fièrement vers son objectif, c'est ça, la véritable force ! Masashi Kishimoto

Connais ton ennemi et connais-toi toi-même, eussiez-vous cent guerres à soutenir, cent fois vous serez victorieux. Sun Tzu

10 avril 2024
17:42 pm
Avatar
Gribouille
Members
Forum Posts: 56
Member Since:
17 novembre 2019
sp_UserOfflineSmall Offline

En gros, jusqu'à preuve du contraire, aucune "IA" n'existe encore à ce jour, cette appellation n'est qu'une astuce, pour prendre le "public" pour plus con qu'il ne l'est déjà.

L'anatomie est aux personnages ce que les racines sont aux arbres. Henri Tusseau

Se redresser après un échec et marcher fièrement vers son objectif, c'est ça, la véritable force ! Masashi Kishimoto

Connais ton ennemi et connais-toi toi-même, eussiez-vous cent guerres à soutenir, cent fois vous serez victorieux. Sun Tzu

10 avril 2024
18:36 pm
Avatar
Gribouille
Members
Forum Posts: 56
Member Since:
17 novembre 2019
sp_UserOfflineSmall Offline

Vous êtes amenés à vous demandez alors : qu'est-ce qu'une IA ?

Du moins j'imagine. Eh bien nous savons très bien ce qu'est une IA alors même que nous savons pertinemment qu'il n'en existe encore aucune :

Une IA, c'est un dispositif, un système informatique, constitué d'un ensemble d'algorithmes et de morceaux de codes, le rendant conscient du sens précis des mots, images et sons auxquels il est confronté. Autrement dit, un dispositif qui sait que tel mots, signifie ceci ou cela selon le contexte, à partir de sa mémoire interne et de son code source, et dont le fonctionnement n'est pas basé sur du Machine Learning;

et non à partir d'une base de données ouverte et désorganisée, lui permettant non pas de savoir, mais seulement d'interpréter le sens des mots, images et sons auxquels il est confronté, comme le font Midjourney, Dalee, Chatgpt, etc. Quand on sait ce qu'est le Machine Learning, alors tout s'éclair, mais il faut quand même le savoir, et ce n'est pas le cas de tout le monde. Les bases de données sur lesquels tournent les processus de Machine Learning de chaque "IA" devraient normalement tous être soumis au lois et restrictions des droit d'auteur. C'est le problème.

Maintenant que vous savez cela, vous êtes en mesure de comprendre pourquoi une IA qui comprend chaque image qu'elle voit est très loin de voir le jours. Contrairement à une IA "littéraire". Pour de multiples raisons, la première étant qu'on peut tout voir sous différents angles de vue, évidemment.

 

Aujourd'hui, les dispositifs se rapprochant le plus de ce qui se définit par une véritable IA à l'heure actuelle, bien qu'ils n'en sont pas, sont :

Mistral et Llama, qui fonctionnent en local, coupé d'internet et que je vous invite chaleureusement à télécharger. Il font très bien leur job, et sont entrainés sur des sujets particuliers. Même si vous n'avez pas encore les ordis qui peuvent les faire tourner, télécharger les quand même. C'est presque davantage un ordre qu'un conseil si je peux me permettre, vous les installerez plus tard, sur la bonne machine, mais ayez au moins le fichier "d'installation" si on peut l'appeler ainsi.

Les IA qui nécessitent internet sont toutes devenues dangereuses sans exception depuis quelques mois. Les hacking sont devenus bien plus simple, même pour des personnes n'ayant aucune notion de code grâce au prompt dorénavant. Pour vous expliquer sans vous donnez trop de détails, des prompts en police couleur blanche sur une image en fond blanc peuvent être présent partout et ordonner à l'IA qui tomberait dessus lors de sa recherche de hacker vos ordis.

Rapide conseil si vous voulez vous mettre à jour rapidement au cas ou vous seriez largué : Bouffez les vidéos d'Underscore (=Micode). Vous ne comprendrez pas tout ce qu'il dit tout de suite, et il ne dit pas toujours des choses qui font plaisir, mais au moins vous serez au courant.

L'anatomie est aux personnages ce que les racines sont aux arbres. Henri Tusseau

Se redresser après un échec et marcher fièrement vers son objectif, c'est ça, la véritable force ! Masashi Kishimoto

Connais ton ennemi et connais-toi toi-même, eussiez-vous cent guerres à soutenir, cent fois vous serez victorieux. Sun Tzu

12 avril 2024
19:45 pm
Avatar
Gribouille
Members
Forum Posts: 56
Member Since:
17 novembre 2019
sp_UserOfflineSmall Offline

Si certains n'ont aucune base pour suivre un peu l'évolution des IA, voici quelques vidéos à voir dans l'ordre indiqué, puis vous serez plus ou moins à jour :

 

1 : C'est quoi le "Machine Learning" (en gros) ? - La Chambre Chinoise.

2 : Les nouvelles techniques d'apprentissage des IA

Comment les personnes du monde entier sont "exploitées" pour éduquer les IA :

Les "Arbres de Pensée":

3 : Les dangers des IA connectées à internet.

4 : Les meilleures alternatives :

L'anatomie est aux personnages ce que les racines sont aux arbres. Henri Tusseau

Se redresser après un échec et marcher fièrement vers son objectif, c'est ça, la véritable force ! Masashi Kishimoto

Connais ton ennemi et connais-toi toi-même, eussiez-vous cent guerres à soutenir, cent fois vous serez victorieux. Sun Tzu

12 avril 2024
21:08 pm
Avatar
Gribouille
Members
Forum Posts: 56
Member Since:
17 novembre 2019
sp_UserOfflineSmall Offline

La dernière est hyper intéressante, bien entendu je ne partage pas l'espoir de Micode, mais : "Connais ton ennemi et connais-toi toi-même, eussiez-vous cent guerres à soutenir, cent fois vous serez victorieux." Sun Tzu; c'est en connaissant au mieux les intentions de nos adversaires qu'on luttera au mieux pour préserver nos droits d'artistes :

 

NeRF & Gaussian Splatting

L'anatomie est aux personnages ce que les racines sont aux arbres. Henri Tusseau

Se redresser après un échec et marcher fièrement vers son objectif, c'est ça, la véritable force ! Masashi Kishimoto

Connais ton ennemi et connais-toi toi-même, eussiez-vous cent guerres à soutenir, cent fois vous serez victorieux. Sun Tzu

paperman Otaku Master Class Disney Animation Making of Dr Who Clip Studio Paint innovation Geekette RIP Comics Warner Cosplay blender Oscars Retrogaming Blue Sky Toei Animation Trailer Crowdfunding Aardman Bande dessinée SONY Pictures Creepy LAIKA 3D Corée Pixar Funny Talk Back WIP Stop-Motion Review Débat Cyber Punk Final Fantasy Animation Legend Manga Nostalgie Speed Drawing Dreamworks Simpsons's Couch Gag Teaser Mecha Article Césars WTF Conférence Twitter Ghibli ARTE Annecy Japon US 2D Court métrage FIBD Geek Concours Musique Analyse NSFW Goodies World Record Food Culture grease pencil jeu vidéo Netflix Ankama Halloween Star Wars Web serie Statistique Don Bluth Convention MCU Cannes News
Forum Timezone: Europe/Paris

Most Users Ever Online: 405

Currently Online:
17 Guest(s)

Currently Browsing this Page:
2 Guest(s)

Top Posters:

Fresh: 387

Charrys: 243

macromaster_42: 239

tsatse: 228

lololeboiteux: 160

FrozenOwl: 151

itaf: 142

Fenix in Paris: 139

hunterogue: 123

Poyjo: 62

Member Stats:

Guest Posters: 140

Members: 180

Moderators: 0

Admins: 1

Forum Stats:

Groups: 3

Forums: 8

Topics: 1495

Posts: 14285

Administrators: Marco Sensei: 10752