[
0:01] Et si nous étions en train de vivre une nouvelle révolution de l'intelligence artificielle au service de la création d'images ? D'abord avec Grok,
[
0:11] l'IA de X, qui est désormais capable de retoucher des images, des photos. Il suffit d'envoyer un cliché, de cliquer sur le bouton « Edit image » et de lui demander, par exemple, de changer l'arrière-plan d'une photo, d'effacer des personnes ou des objets, ou encore, par exemple, de vous déguiser en cow-boy avec une guitare à la main. Le résultat est impressionnant. Il n'était pas possible jusqu'à présent de partir d'une image existante et de demander à l'IA d'en faire quelque chose. Mais c'est donc désormais possible et cela ouvre des perspectives immenses en
[
0:41] termes de création graphique. On peut aussi demander à Grok, par exemple, de transformer le style d'une photo.
[
0:48] Un portrait ou autre, par exemple dans un style cartoon, à la manière de Van Gogh, etc. Autrement dit, la fonction gomme magique de votre appli photo préférée en prend un coup. Et Photoshop a du souci à se faire, même si Adobe, c'est vrai, propose déjà des outils de retouche d'images par intelligence artificielle. Alors, ça pose quand même quelques petites questions, parce que, par exemple, le Grok peut tout faire, tout trafiquer, y compris retirer les filigranes qui protègent les photos des agences et des professionnels contre le piratage. Évidemment, on est chez Elon Musk, alors tous les coups sont permis.
[
1:24] Pour l'instant, ce nouveau Grok qui sait faire des photos, des dessins, est accessible gratuitement pour tout le monde, mais sans doute pas pour très longtemps.
[
1:33] Il n'est pas tout seul, Grok, en tout cas, puisque Google avait lancé une fonction similaire juste quelques jours avant avec son IA Gemini 2.0 Flash. Et puis, quelques jours après, la riposte n'a pas tardé à venir du côté de ChatGPT avec le lancement d'une nouvelle version du moteur de génération d'images. Jusqu'à présent, ChatGPT était un peu en retard, notamment face à Grok. Il produisait des images moins photoréalistes, assez approximatives, assez foutraques. Mais cette fois, on passe vraiment aux choses sérieuses. Alors, oublier Dali, qui était l'outil d'images intégrée à ChatGPT, et place désormais à GPT-4o, qui se charge du boulot, et franchement, ça décoiffe. GPT-4o est capable de générer des photos beaucoup plus réalistes qu'avant, et aussi de retoucher des images actuelles. Tout comme Grok. Le résultat est même, dans certains cas, un peu meilleur. Il y a plus de détails, moins d'hallucinations, en tout cas, moins d'hallucinations que Dali, par exemple, moins de mains avec six ou sept doigts. Et puis surtout, surtout, maintenant, GPT sait écrire dans les images. C'est-à-dire qu'avant, si on lui demandait un logo avec un nom de société ou une enseigne de magasin, eh bien, il mettait des lettres côte à côte, oui, mais c'était n'importe quoi, et la plupart du temps, ça ne voulait rien dire.
[
2:48] Désormais, vous pouvez lui demander d'écrire des mots, des phrases,
[
2:51] des slogans sur des pancartes, etc. Tout ce qui vous passe par la tête. On passe donc vraiment un cap en la matière. Et surtout, ce qui fait la particularité et un véritable phénomène actuellement, c'est la transformation d'images à la manière d'eux. Et avec notamment un engouement ces derniers jours pour la transformation de photos à la manière de Jibri. Ce studio d'animation japonais fondé par Hayao Miyazaki, connu pour son style artistique particulier avec des visages très ronds, des vêtements simples des images assez poétiques du coup vous avez peut-être vu passer sur les réseaux sociaux des dizaines d'images dans ce genre reprenant souvent des photos d'actualité ou des mèmes assez connus et puis on peut aussi demander à GPT-4o de suivre des consignes pour donner un style particulier à une photo par exemple si vous regardez ce podcast là actuellement en vidéo sur la chaîne YouTube de Monde Numérique.
[
3:45] Eh bien, voici une magnifique image de mon camarade Bruno Guglielminetti et moi-même, avec deux belles têtes de fous furieux échappés d'un asile. Car comme chacun sait, la tech, ça rend fou. Bref, on s'amuse comme des petits fous, c'est le cas de le dire, avec ces nouveaux outils, accessibles gratuitement
[
4:00] pour l'instant, mais on l'a dit, ça ne va certainement pas durer. Et puis surtout, malheureusement, il y a déjà une face cachée et des problèmes qui apparaissent, notamment de grosses questions liées aux droits d'auteur. Les détenteurs des droits de toutes les images qui ont servi à entraîner le modèle GPT-4o notamment, ont-ils été avertis ? Sont-ils rémunérés ? Les artistes sont-ils concernés ? On comprend pourquoi OpenAI prêche aujourd'hui pour une suppression du droit d'auteur, ou en tout cas pour une refonte de la notion de propriété intellectuelle. Alors pour l'instant, en attendant, il pille allègrement les images par milliers, ici et là. mais il serait quand même étonnant qu'Open & High ne se prenne pas un petit choc en retour assez rapidement.