Prédiction 2023: les deepfakes détrônés par les generativeAI

💌 Bienvenue sur SYNTH, la newsletter d’info critique des médias synthétiques. Voilà un petit aperçu de ce que vous pouvez trouver une fois par mois sur SYNTH. Si le contenu vous intéresse, n’hésitez pas à vous abonner sur synth-media.fr.

DANS LE RETRO

Regarder devant, regarder plus loin que cet horizon synthétique qui se dessine devant nous. À bien des égards, cette fin d’année nous précipite dans un futur que nous n’avions pas forcément anticipé, mais qui ne nous est pas complètement étranger. Des IA, partout, avancent leurs nouvelles capacités et nous promettent de nouvelles orées créatives. 2022 marquera sans aucun doute un tournant dans la création numérique. Dall.E, Midjourney, Stable AI, ont en quelques mois captivé un public de connaisseurs, inquiété les professionnels, appelé à des modifications profondes de cadres juridiques établis depuis des décennies et rebattu les cartes d’une industrie déjà en proie à la précarité.

J’ai commencé à travailler sur le sujet des deepfakes comme auteur/journaliste dès janvier 2018. À l’époque, la manipulation d’images par intelligence artificielle semblait être encore l’exception, un sujet de prospective technique auquel personne ne prêtait guère attention tant il était loin de nos usages quotidiens. Presque 5 ans plus tard, chacun a désormais accès à une version plus ou moins allégée de ces algorithmes sur son smartphone. Tout le monde est en mesure de converser avec ChatGPT et ne s’en prive pas.

Quelques mois après leur introduction, ces IA agitent les consciences et questionnent les artistes du monde entier. Est-ce Dall.E, Midjourney, Stable Diffusion et leurs successeurs vont remplacer la créativité humaine ? La question parait légitime, mais beaucoup s’empressent de rassurer en affirmant le contraire. L’IA va aider les artistes à développer leur talent, comme un outil permet d’aller plus loin et plus haut.

Pour autant, la question est-elle bien posée ? Doit-on vraiment se demander si l’IA va remplacer la créativité ? Est-ce d’ailleurs son ambition ? Toute la créativité humaine ne peut pas être remplacée par un algorithme, aussi puissant soit-il. Ce qu’il me parait intéressant de questionner en revanche c’est le coût de la créativité en posant cette question : l’IA va-t-elle faire baisser le coût de la créativité ? À cette question, je pense qu’il est facile de répondre. OUI.

Voyons ça en détail.

CONTEXTE

L'adoption de Stable Diffusion parmi les développeurs a été la plus rapide de toutes les infrastructures open source

L’adoption de Stable Diffusion parmi les développeurs a été la plus rapide de toutes les infrastructures open source

Ce qui marque quand on observe les médias synthétiques c’est bien la rapidité avec laquelle les GenerativeAI se sont installés dans le paysage. L’open beta de Midjourney a fait ses débuts pas plus tard qu’en juillet dernier, quelques mois après son compétiteur direct Dall.E 2 dont Open AI avait ouvert la beta publique en avril. Stable Diffusion reste le petit dernier en faisant ses débuts au mois d’aout dernier.

En septembre dernier, Open AI annonçait que Dall.E 2 totalisait près de 1,5 M d’utilisateurs et produisait plus de 2M d’images par jour. Le serveur Discord de Midjourney quant à lui totalise près de 2,7 M d’utilisateurs et près de 275 000 images par jour. À peine après deux mois d’exploitation, Stable Diffusion comptabilisait déjà près de 10M d’utilisateurs et le nombre d’images produit est exponentiel.

D’ailleurs, Stable Diffusion fait office de colosse dans le paysage naissant des GenerativeAI. Avec 101million de dollars récolté en première levée de fond, une valorisation qui s’élève déjà à près d’un milliard et des investisseurs tout feu tout flamme, la locomotive du secteur semble faire un démarrage jamais vu. Pour rappel, Twitter a levé 100.000 $ dans son premier tour en 2007…
Coté tech, l’adoption par les développeurs de l’infrastructure open source du modèle a explosé tous les records avec un cumul de plus de 33 600 stars dans les 90 premiers jours de création du repo.

Les chiffres donnent le tournis.

DEEP TROUBLE

Avec toute cette actualité focalisée sur les GenerativeAI, on en oublierait presque ces bons vieux deepfakes. Et pour cause, pas de grosse entreprise bien scalable pour générer du growth et contenter les shareholders qui kiffent le web3. En gros, les deepfakes c’est bien, mais c’est petit joueur.

Comparée aux 101 millions de Stable Diffusion, la levée de fonds de Deep Voodoo de 20 millions de dollars en cette fin d’année semble chétive (même si pour un studio de production elle reste tout à fait honorable).
En 2023, c’est une autre histoire qui va se dérouler pour les deepfakes à mesure que la famille des médias synthétiques s’agrandira.

Arrivée de nouveaux acteurs, régulation renforcée, discussions éthiques passionnées sur les droits patrimoniaux des auteurs dont les images sont intégrées aux bases de données, l’année 2023 va probablement être riche de nouveaux rebondissements. Voyons ensemble ce qui nous attend.

GENERATIVEAI SEASON 2

À quoi s’attendre dans les mois qui viennent sur le front des médias synthétiques ? Au vu du rapide développement des GenerativeAI, entreprises et gouvernements devraient rapidement se positionner vis-à-vis de cette technologie qui va sérieusement rebattre les cartes dans les prochains mois, qu’on le veuille ou non. 

L’INDUSTRIE CRÉATIVE 
Les industries créatives (cinéma, musique, vidéo, médias, etc.) seraient bien inspirées d’ores et déjà  de penser aux effets concrets de l’arrivée de ces technologies et de leur popularité. Le bruit médiatique incessant depuis quelques mois autour des services text-to-image/sound/video/text a fait émerger une sorte de panique chez les créateurs. Le mouvement « No A.I Art » qui prend de l’ampleur sur les réseaux sociaux montre bien qu’il s’agit davantage d’un sentiment de menace existentielle que d’une inquiétude passagère. D’ailleurs, si certains étaient tentés de comparer cette mobilisation aux luddites anglais du début du 19e siècle, ils devraient se méfier de ne pas se retrouver à leur tour dans la ligne de mire.

Du développement informatique à la traduction en passant par la gestion administrative, le droit, l’enseignement les emplois peu qualifiés comme les plus qualifiés peuvent potentiellement être impacté par les effets directs ou secondaires de ces GenerativeAI. Anticiper ces effets, entamer les discussions nécessaires, évoquer même le sujet avec ses collaborateurs, ses clients, ses prestataires semble urgent. Vu les pronostics de performance de l’économie mondiale pour l’année à venir, beaucoup vont-être tenté de réduire la voilure, diminuer les coûts et optimiser des investissements. Les offres de Getty, Shutterstock ou d’autres banques d’images qui utilisent désormais des generativeAI pour alimenter leur catalogue risquent fort d’être alléchantes pour certaines plates-formes disposant de peu de moyens pour leur communication.

La situation économique des freelances de tous métiers risquent alors de se précariser davantage. Le rapport de force en faveur des commanditaires qui auront beau jeu – s’ils s’y trouvent forcé par un contexte économique difficile – de préférer les images de synthèse même imparfaites, aux images réalisées par des professionnels. À la fin, c’est bien le portefeuille qui fait la créativité, et la pression exercée par les GenerativeAI sur les industries créatives se fait principalement sur le volet social et économique que sur un plan purement créatif.

Soldats de la première guerre mondiale vu par l'IA de Midjourney

Soldats de la première guerre mondiale vu par l’IA de Midjourney

LA COMPÉTITION ENTRE GÉANTS
Sur un plan industriel, Stable AI va continuer sa progression vers les sommets. Emad Mostaque prévoit de développer les activités de Stable AI et d’écraser rapidement la concurrence en développant tout une série de produits différents qu’il espère populariser en utilisant la force de l’open source. Il en a les moyens, mais OpenAI (propriétaire de Dall.E2 et ChatGPT qui va lancer cette année GPT-4, 500 fois plus puissante que GPT-3 qui anime ses autres services) se trouve en embuscade. Sa levée de fonds en cours auprès d’un Microsoft discret, mais bien décidé à revenir dans la course face à Google, risque fort d’en faire un géant de l’IA. 

LE BESOIN DE RÉGULATION
À mesure que la situation va se développer, le législateur va être sommé de se prononcer sur un volet important de considérations légales touchant au droit du commerce, à la propriété intellectuelle, au droit contractuel, et probablement au pénal pour les pires aspects du problème.

On reprend donc, les questions de propriété intellectuelle des images utilisées dans les datasets seront certainement un sujet de controverse fort puisqu’il s’agira de déterminer si ces auteurs ont droit à compensation ou pas. Pour le moment, les utilisateurs d’IA se servent et refusent de considérer toute forme d’indemnisation (réécoutez mon intervention sur France Culture en mai dernier à ce sujet). Fort à parier que ce sera entériné par la jurisprudence ou par décision pour éviter aux entreprises de supporter le coût de réparations aux auteurs colossaux (surtout aux US).

Un compromis sera de permettre l’opt-out pour un artiste qui pourra refuser l’inclusion de son travail dans les datasets. Il est cependant peu probable que cet opt-out soit automatiquement mis en place pour éviter de vider les datasets de leur contenu. Par conséquent, la charge de la vérification reviendra aux auteurs/créateurs qui devront — s’ils/elles le souhaitent — entamer les démarches pour exclure leur travail de base de données directement ou indirectement impliquées dans le fonctionnement de ces GenerativeAI.

D’autres problématique de paternité vont surgir rapidement. Les litiges associés devraient certainement affluer en fin d’année 2023 si le mouvement de résistance anti-AI prospère. Autrement, ces actions légales resteront marginales et alimenteront simplement les chroniques judiciaires des journaux tech, qu’on espère encore tenues par de véritables journalistes. En Europe, la commission qui a déjà entamé un certain nombre de travaux sur la place de l’IA devrait prolonger sa réflexion après que la Chine ait – elle même – renforcé sa législation sur l’usage de deepfakes et apposé un contrôle plus strict sur la dissémination des médias synthétiques.

TECHNO SOLUTIONISME
Si la régulation est un levier d’action pour les autorités publiques des pays, les entreprises impliquées dans le développement des GenerativeAI activent également leurs petits muscles pour contrecarrer les effets négatifs que leurs créations pourraient causer à l’occasion. Cette année 2023, le Content Authenticity Initiative et le C2PA devrait séduire davantage de partenaires et constructeurs enclins à implémenter les spécifications techniques permettant une traçabilité des contenus améliorée dans leurs matériels et leurs logiciels. 

Pour lutter contre les deepfakes et les médias synthétiques, le mode d’action retenu consiste donc à complexifier les choses pour tout le monde au lieu de les complexifier pour les personnes malveillantes ciblées. Car oui, on aurait pu imaginer de restreindre l’accès au repo Github de DeepFaceLab, Faceswap, Face2face ou d’autres. Il suffisait de demander une pièce d’identité aux développeurs souhaitant utiliser le code pour les tenir légalement responsables de l’usage qu’ils feraient du code mis à disposition et le tour était joué. Une méthode qui aurait pour bénéfice de prémunir d’autres usages malveillants de Github comme celui-ci récemment mit à jour. Rien de ce dispositif ne permettra de lutter contre les deep-porns, en revanche il fournira un outil supplémentaire pour tracer, d’une façon ou d’une autre, nos contenus.

Donald Trump vu par l'IA de Midjourney

Donald Trump vu par l’IA de Midjourney

UN PARI DE MOYEN TERME POUR MICROSOFT
Dernier point d’importance, c’est le retour par le biais des GenerativeAI de Microsoft dans la compétition contre Google. Le soutien apporté à OpenAI à travers un investissement de 1 milliard de dollars en 2019, le lancement d’OpenAi Azure en 2021 et la récente intégration de Dall.E 2 dans les produits Microsoft a considérablement renforcé les liens entre les deux entreprises, assurant de facto une place dans la course à l’IA à la compagnie de Redmond face à Google.

En intégrant ChatGPT dans le moteur de recherche Bing, Microsoft pourrait même tenter le pari de court-circuiter son propre produit et — au passage — participer à la renaissance d’un moteur de recherche poussif. La nature conversationnelle de ChatGPT offre un rendu de résultat plus naturel. La combinaison de voix synthétiques et de la reconnaissance vocale, de ChatGPT branché sur GPT-4 dont les capacités sont égales à 500x GPT-3 sont suffisant à créer un produit compétitif et très différenciant.

Problème, la monétisation n’est pas au rendez-vous avec les interfaces vocales ou les recherches conversationnelles. Enfin, Google ne reste pas les bras croisés et développe ses propres solutions pour rester le leader incontesté du web pour le moment.

POUR LE MEILLEUR PEUT-ÊTRE, MAIS AUSSI POUR LE PIRE
Ce dont on peut être sur c’est que les discussions éthiques autour de l’adoption des GenerativeAI ont fait long feu et que pas un responsable tech n’est décidé à faire l’impasse sur ces innovations pour des raisons éthiques. Peu importe la question de l’exploitation des données sans autorisation des créateurs, peu importe les deep-porns et les sexfakes ou la pornodivulgation, peu importe l’objectification des corps et le transhumanisme libertaire débridé, les coups de pied à la fabrique commune de la réalité et la propagation massive de fake news, comme l’indique Mostaque dans une récente interview, « AI is here to stay ». Qu’on ait envie de dire non n’est plus désormais une option, la soustraction de la souveraineté des peuples à décider de leur destin par les corporations de la tech américaine coupe le sifflet. Cette année donc les créateurs de contenus seront les nouveaux luddites, critiqués, moqués et méprisés pour ne pas comprendre le sens de l’histoire qui — décidément — est écrit désormais par les ingénieurs de la Silicon Valley. Reste que l’actualité sera riche et passionnante à analyser. 

Je vous laisse sur ces mots, et avec un peu d’avance, je vous souhaite à toutes et tous de très belles fêtes de fin d’année en vous souhaitant également le meilleur pour l’année 2023. On se retrouve très vite à la rentrée avec une newsletter d’actualité.

Cheers

Author avatar
Gerald Holubowicz
http://geraldholubowi.cz
Ancien photojournaliste et web-documentariste primé, je travaille désormais comme chef de produit spécialisé en innovation éditoriale. J’ai notamment collaboré avec le journal Libération, les éditions Condé Nast, le pure player Spicee et le Groupe les Échos/le Parisien. À travers mon site journalism. design, j’écris sur le futur des médias et étudie l’impact des réalités synthétiques — notamment les deepfakes — sur la fabrique de l’information. Après 10 ans d’interventions régulières auprès des principales écoles de journalisme reconnues, j’interviens désormais à l’École de Journalisme et au Centre des Médias de Sciences Po à Paris.