Elon Musk a annoncé samedi que Twitter allait restreindre temporairement la lecture de tweets pour contenir l’utilisation massive de données du réseau social par des tiers, notamment afin d’alimenter les modèles d’intelligence artificielle.
À voir aussi sur Konbini
Concrètement, la plateforme va limiter la lecture à 10 000 messages par jour pour les comptes vérifiés, à 1 000 pour les utilisateurs non vérifiés et à 500 pour les nouveaux comptes non vérifiés, a indiqué Elon Musk sur le réseau social après avoir annoncé plus tôt des seuils inférieurs.
Une décision prise “pour remédier aux niveaux extrêmes de recueil de données et de manipulation de système”, a expliqué Elon Musk dans un tweet. La veille, il avait déjà annoncé qu’il ne serait plus possible de lire des messages sur le réseau sans se connecter et donner ses identifiants.
“Des centaines d’organisations (peut-être plus) glanaient des données sur Twitter de façon très agressive, au point que cela perturbait l’utilisation ordinaire” par les internautes, selon l’actionnaire majoritaire du groupe de San Francisco (Californie).
En limitant le nombre de tweets qui peuvent être lus par compte, Elon Musk cherche à empêcher ces organisations de recueillir les quantités massives de données qui servent notamment à développer des modèles d’intelligence artificielle (IA) dite générative.
Pour mettre au point un modèle génératif capable de répondre de façon similaire à une personne à des demandes en langage courant, ces sociétés doivent “entraîner” l’interface en lui donnant des exemples de conversations. “Quasiment toutes les boîtes qui font de l’IA, des start-up aux plus grands groupes du monde, ramassaient de grandes quantités de données”, a insisté Elon Musk.
“C’est un peu frustrant de devoir ajouter, en urgence, un nombre important de serveurs pour le seul fait de justifier la valorisation indécente de certaines start-up de l’IA”, a-t-il dit. Ces serveurs supplémentaires étaient nécessaires à Twitter pour soutenir le trafic et l’utilisation intensive de la plateforme par des logiciels ou bots mais pas par les usagers ordinaires.
Twitter n’est pas seul à faire face aux conséquences de l’accélération de l’IA générative et au développement de services articulés autour de modèles de langage. Mi-juin, la plateforme de discussions Reddit a relevé les tarifs qu’elle demande aux développeurs tiers pour utiliser les données et conversations postées sur le réseau social.
La décision a suscité un tollé car ces plateformes donnaient jusqu’ici accès à des prix modérés ou gratuitement aux données publiques sur leur site pour favoriser le développement d’un écosystème.