Accueil

L’ère de l’Internet généré par l’IA est déjà là


Ce n’est pas un théorie du complot ou prophétie future. L’idée d’un Internet dominé par le contenu généré par l’IA existe déjà et elle ne semble pas bonne.

Depuis ChatGPT arrivé sur le marché, le contenu généré par l’IA s’infiltre progressivement sur Internet. L’intelligence artificielle existe depuis des décennies. Mais ChatGPT, destiné aux consommateurs, a poussé l’IA vers le grand public, créant une accessibilité sans précédent aux modèles d’IA avancés et à une demande sur laquelle les entreprises sont désireuses de capitaliser.

En conséquence, les entreprises et les utilisateurs tirent parti de l’IA générative pour produire de gros volumes de contenu. Alors que la préoccupation initiale est l’abondance de contenus contenant des inexactitudes, du charabia et de la désinformation, l’effet à long terme est une dégradation complète du contenu Web en déchets inutiles.

Les déchets entrent, les déchets sortent

Si tu réfléchis, Internet contient déjà un tas de déchets inutiles, c’est vrai, mais c’est différent. “Il y a beaucoup de déchets là-bas… mais ils sont incroyablement variés et diversifiés”, a déclaré Nader Henein, analyste vice-président du cabinet de conseil en gestion Gartner. À mesure que les LLM se nourrissent du contenu des autres, la qualité se détériore et devient plus vague, comme une photocopie d’une photocopie d’une image.

Pensez-y de cette façon : la première version de ChatGPT était le dernier modèle à être formé sur du contenu entièrement généré par l’homme. Depuis lors, chaque modèle contient des données d’entraînement dont le contenu généré par l’IA est difficile à vérifier, voire à suivre. Cela devient peu fiable, ou pour parler franchement, des données inutiles. Lorsque cela se produit, « ?nous perdons en qualité et en précision du contenu, et nous perdons de la diversité”, a déclaré Henein, chercheur en protection des données et en intelligence artificielle. “Tout commence à ressembler à la même chose.”

« Apprentissage incestueux », c’est ainsi que Henein l’appelle. “Les LLM ne sont qu’une grande famille, ils consomment simplement le contenu des autres et se pollinisent mutuellement, et à chaque génération vous avez… de plus en plus de déchets au point où les déchets dépassent le bon contenu et les choses commencent à se détériorer à partir de là.”

À mesure que de plus en plus de contenus générés par l’IA sont diffusés sur le Web, et que le contenu est généré par des LLM formés sur le contenu généré par l’IA, nous envisageons un futur Web totalement homogène et totalement peu fiable. En plus, c’est vraiment ennuyeux.

Effondrement du modèle, effondrement d’Internet

La plupart des gens je sens déjà quelque chose ne va pas.



Articles similaires

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Bouton retour en haut de la page