Apple heeft AI-modellen zonder toestemming getraind op YouTube-inhoud

Een aantal gigantische technologiebedrijven, waaronder Apple, hebben kunstmatige-intelligentiemodellen op YouTube-video’s getraind zonder toestemming van de makers, volgens een nieuw rapport dat vandaag is vrijgegeven.

Ze deden dit met behulp van door derden gedownloade ondertitelbestanden van meer dan 170.000 video’s. Getroffen makers zijn onder meer tech-recensent Marquees Brownlee (MKBHD), MrBeast, PewDiePie, Stephen Colbert, John Oliver, Jimmy Kimmel…

Ondertitelbestanden zijn feitelijk getranscribeerde teksten uit video-inhoud.

Bedrade Rapporten.

Uit onderzoek van Proof News bleek dat enkele van de rijkste AI-bedrijven ter wereld materiaal uit duizenden YouTube-video’s gebruikten om AI te trainen. De bedrijven deden dit ondanks de regels van YouTube tegen het zonder toestemming verzamelen van materiaal van het platform.

Uit ons onderzoek bleek dat vertalingen van 173.536 YouTube-video’s, afkomstig van meer dan 48.000 kanalen, werden gebruikt door zwaargewichten uit Silicon Valley, waaronder Anthropic, Nvidia, Apple en Salesforce.

De downloads zijn naar verluidt gemaakt door een non-profitorganisatie genaamd EleutherAI, die zegt dat het ontwikkelaars helpt bij het trainen van AI-modellen. Hoewel het doel lijkt te zijn om trainingsmateriaal te bieden aan jonge ontwikkelaars en academici, wordt de dataset ook gebruikt door verschillende technologiegiganten, waaronder Apple.

Volgens een onderzoeksartikel gepubliceerd door EleutherAI maakt de dataset deel uit van een verzameling die is vrijgegeven door de non-profitorganisatie Pile […]

De meeste door Pile geleverde datasets zijn beschikbaar en toegankelijk voor iedereen op internet die over voldoende ruimte en rekenkracht beschikt om er toegang toe te hebben. Academici en andere ontwikkelaars buiten grote technologiebedrijven hebben geprofiteerd van de dataset, maar zij zijn niet de enigen.

Apple, Nvidia en Salesforce, ter waarde van honderden miljarden en biljoenen dollars, beschrijven in hun onderzoekspapers en publicaties hoe ze Pyle gebruikten om kunstmatige intelligentie te trainen. Uit de documenten blijkt ook dat Apple Pile gebruikte om OpenELM te trainen, een spraakmakend model dat in april werd uitgebracht, weken voordat het bedrijf onthulde dat het nieuwe AI-mogelijkheden zou toevoegen aan iPhones en MacBooks.

Bedrade Apple zegt dat het op het moment van schrijven nog niet heeft gereageerd op een verzoek om commentaar.

READ  Hoe Netflix-games op mobiel te spelen

Bekijk 9to5Mac

Het is belangrijk om hier te benadrukken dat Apple de gegevens niet zelf heeft gedownload, maar EleutherAI. Het lijkt erop dat deze organisatie degene is die de algemene voorwaarden van YouTube heeft geschonden.

Hoewel Apple en de andere genoemde bedrijven mogelijk te goeder trouw een openbaar beschikbare dataset hebben gebruikt, is dit een goed voorbeeld van het juridische mijnenveld dat is ontstaan ​​door webscraping om AI-systemen te trainen. Er zijn meerdere voorbeelden geweest van AI-systemen die hele tekstparagrafen plagieerden als er naar specifieke onderwerpen werd gevraagd, en de risico’s van het zonder toestemming gebruiken van materiaal nemen alleen maar toe als bedrijven datasets gebruiken die door derden zijn verzameld.

We hebben contact opgenomen met Apple voor commentaar en zullen bij elk antwoord een update geven.

Schermgreep: Mkbhd

FTC: We gebruiken affiliatielinks om automatisch inkomen te verdienen. meer.

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *