Accueil

Apple aurait formé ses services de renseignement à l’aide de vidéos YouTube


Plusieurs entreprises comme Apple, Nvidia, Anthropic et d’autres auraient utilisé les données fournies par les utilisateurs pour former leurs modèles d’IA. Il a été rapporté qu’Apple, par exemple, a utilisé des dizaines de milliers de vidéos YouTube contenant des sous-titres pour former Apple Intelligence, bien que cette pratique soit contraire à la politique de contenu de la plateforme.

A lire aussi : Honor Magic V3 « bientôt disponible » au Royaume-Uni : à quoi s’attendre

Sur la base de l’enquête, Apple et d’autres sociétés ont utilisé un ensemble de données appelé YouTube Subtitles, contenant des transcriptions de 173 536 vidéos YouTube sur 48 000 chaînes.

Les vidéos de cet ensemble de données vont du contenu éducatif de Khan Academy et du MIT à des sources d’information comme le Wall Street Journal, ainsi qu’à des créateurs populaires sur la plateforme tels que MrBeast et Marques Brownlee.

Marques Brownlee a déclaré qu’Apple est capable d’éviter tout « défaut » en obtenant son IA auprès d’entreprises qui ont utilisé des transcriptions de vidéos YouTube au lieu d’utiliser directement les données. Néanmoins, les données/transcriptions jouent toujours un rôle dans la conception des modèles d’IA, pour lesquels les créateurs ont consacré leurs ressources. Brownlee a conclu en soulignant que ce problème continuera d’évoluer dans un avenir proche.

Proof News a développé un outil qui permet aux créateurs de contenu de localiser facilement leur contenu dans l’ensemble de données. Bien que l’ensemble de données YouTube Subtitles ne contienne pas d’images de vidéos, il propose des sous-titres traduits dans différentes langues. Cet ensemble de données a été assemblé par Eleuther AI, un laboratoire de recherche à but non lucratif dédié à l’avancement des principes de la science ouverte.

Aucune des sociétés susmentionnées n’a fait de commentaires sur ce problème. Lors d’une interview, le PDG de YouTube, Neal Mohan, a explicitement déclaré que l’utilisation de vidéos YouTube pour la formation de modèles d’IA constituait une violation directe des politiques de la plateforme.

À lire aussi : Samsung dévoilera la série Galaxy Tab S10 avant la fin de 2024 ; voici à quoi s’attendre



Articles similaires

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Bouton retour en haut de la page