[
0:01] La moitié de ce que vous voyez sur le web serait écrit par des intelligences artificielles. C'est ce que révèle une étude de la société Graphite, une agence californienne spécialisée dans le référencement des contenus en ligne. Un phénomène qui a commencé fin 2022 avec l'apparition de ChatGPT et qui n'aurait pas cessé d'augmenter. En novembre 2024, toujours selon Graphite, la quantité d'articles générés par IA aurait dépassé celle d'articles écrits par des humains. Un phénomène qui est corroboré par d'autres études, décrivant à peu près la même chose. En avril 2025, une étude de l'entreprise de marketing Arefs parlait à elle de 74,2% du contenu du web généré ou modifié par intelligence artificielle. Généré ou modifié, on va revenir dans un instant sur ce distinguo. Et puis d'autres estimations plus alarmistes prévoient que ça ne va pas s'arranger. Elles évoquent jusqu'à 90% de contenus en ligne qui seront générés avec l'aide de l'IA d'ici 2026. Des contenus aigris, mais aussi de plus en plus des images, des vidéos générées par l'intelligence artificielle, et on le voit tous les jours, qui envahissent les réseaux sociaux.
[
1:09] Bref, ouvrons les yeux, le monde qui nous entoure deviendrait fake et les robots auraient pris le pouvoir. Un constat qui vient corroborer ce qu'on appelle par ailleurs la théorie de
[
1:18] l'Internet mort, la Dead Internet Theory. Théorie évoquée notamment par Sam Altman, le patron d'OpenAi. De quoi s'agit-il ? Eh bien, Internet serait mort, entre guillemets, depuis 2016-2017. Ça veut dire que l'activité humaine organique aurait largement été remplacée par des bots, des robots, des agents conversationnels et des algorithmes de curation qui fonctionnent tout seuls, qui cliquent sur des liens, qui tournent à l'échelle planétaire. On en a déjà parlé dans le monde numérique il y a plusieurs mois. Aujourd'hui, il y aurait en plus tous les contenus générés par IA. Voilà donc de quoi alimenter les plus belles théories du complot.
[
1:55] Alors à ce phénomène, il y a tout d'abord des raisons économiques. L'IA permet de produire plus et donc de faire plus d'audience et de rapporter par voie de conséquence plus d'argent via la publicité. Alors toutefois, il faut relativiser. L'étude graphite, d'ailleurs, elle-même tempère l'ampleur du phénomène, en précisant que déjà, la proportion d'articles générés par IA, si elle a augmenté depuis 2022, eh bien, s'est mise à plafonner depuis mai 2024. Pour l'instant, ça ne bouge plus trop. Ensuite, ces articles sont généralement absents des moteurs de recherche Google ou même maintenant de Chagipiti, c'est-à-dire qu'ils seraient peu ou pas référencés. Enfin, on n'a aucune preuve que ces articles générés par IA soient vraiment lus par des humains, en tout cas de manière massive.
[
2:38] Graphite écrit « Nous soupçonnons que ce n'est pas le cas ».
[
2:41] Il faut dire que ces articles générés par IA sont de plus en plus repérables. Par exemple, si vous lisez un paragraphe qui se termine par une formule comme « cela illustre » ou « cela souligne », méfiez-vous car c'est peut-être de l'IA qui aime bien ces petites conclusions qui souvent ne sont plus du tout factuelles par rapport au reste d'un article. L'IA aime bien également les participes présents comme marquants, illustrants, protégeants, etc. Et elle émaille en général abondamment ces créations de ce genre de mots. Côté ponctuation aussi, c'est un signe qui peut être intéressant pour détecter des contenus générés par IA. Celle-ci utilise souvent ce qu'on appelle le tiré cadratin, ce long tiré qui ne correspond à aucune touche du clavier. On l'obtient avec une combinaison de caractères spéciaux et qui sert à marquer les changements de locuteur dans un dialogue. Enfin, si vous lisez beaucoup de « donc », de « puis », de « cependant », tous ces éléments de connexion dans les phrases, c'est possiblement aussi de l'IA qui adore tous ces petits mots de connexion dans les phrases. Enfin, ne parlons pas des hallucinations qui se traduisent carrément parfois par de fausses informations ou par des références à des sources qui n'existent pas. Mais toujours pour tempérer le phénomène, il faut aussi relativiser l'idée de
[
3:56] ce qu'on appelle des articles générés par IA. Qu'est-ce que ça veut dire exactement ? Est-ce que ça veut dire qu'ils sont entièrement générés par l'intelligence artificielle de la première à la dernière lettre ? Ou bien qu'ils ont été écrits par un humain avec l'aide de l'IA ?
[
4:10] Je vous avoue que cette chronique a été conçue en partie avec ChatGPT pour trouver des sources, des idées à développer, etc. Ou encore, d'ailleurs, parfois s'il s'agit de traduction par intelligence artificielle, car l'IA peut intervenir à différents niveaux. Et puis, il faut noter aussi que la proportion de contenus générés par l'IA varie selon la langue et selon le domaine. Par exemple, est-ce que ça va être sur des blogs, sur des sites d'actualité, sur des pages de descriptions de produits, des sites marchands ? Évidemment, on n'est plus dans le champ de l'information à proprement parler. Enfin, le fait que ce soit généré par de l'IA, ça ne veut pas dire automatiquement que c'est mauvais, ou en tout cas que c'est bon ou mauvais, même si ça pose,
[
4:51] c'est vrai, un certain nombre de questions. Ça pose des questions parce que si les contenus fabriqués par l'IA se mettent à envahir le web et que ces IA continuent, en plus de se nourrir elles-mêmes de ces contenus, eh bien, que va-t-il se passer ? On sait que quand l'IA bouffe ce qu'elle a elle-même produit, cela peut conduire à des boucles folles et à des hallucinations encore plus fréquentes.
[
5:13] Également, on peut craindre un appauvrissement progressif du web, forcément, sans compter l'aspect économique. S'il y a moins de lecteurs, il y aura moins de revenus publicitaires. Donc voilà, de l'IA partout, de plus en plus de contenus générés par l'IA, mais à ce stade, franchement, pas de panique. Apprenons surtout à titre individuel à reconnaître ces contenus, notamment les images ou les vidéos, pour ne pas se faire piéger. Apprenons aussi à distinguer les mauvais des bons contenus, des articles mal écrits, peu informatifs, de contenus plus pertinents et plus riches. Et au final, s'il y a produit des contenus qui ne sont plus lus par des IA sans humains, en fait, la casse amusée de son côté, ce n'est pas ça qui nous empêchera, nous, humains, de rester aussi entre nous. Donc en réalité, ce qu'on peut prédire, c'est qu'on va aller de plus en plus vers une espèce de web hybride qui sera moitié humain. moitié artificielle. La question est de savoir dans quelle proportion à l'arrivée.