CouranD #75 - De oorsprong van de streepjescode
De rechtszaak van The New York Times, en: de streepjescode had ook een cirkel kunnen zijn
Goedezondag,
Welkom in 2024, en bij de eerste CouranD van het nieuwe jaar. Nummertje 75 alweer. Ik ga gewoon door waar ik gebleven was. Ook deze editie richt ik me op de rechtszaak die The New York Times heeft aangespannen tegen OpenAI en Microsoft. Inmiddels hebben daar allerlei slimme mensen namelijk iets over gezegd, en dat heb ik geprobeerd op een rijtje te zetten.
En natuurlijk kun je weer rekenen op een aantal linkjes naar interessante artikelen. Onder andere over CES, de overvolle tas van Matt Mullenweg en de oorsprong van de streepjescode.
Enjoy!
⚖️ Een glijdende schaal
Gaat de schaal en snelheid waarop OpenAI gebruikmaakt van auteursrechtelijk beschermd materiaal verder dan ‘fair use’?
Vorige week schreef ik ook over de aanklacht van The New York Times tegen OpenAI en Microsoft over het gebruik van auteursrechtelijk beschermd materiaal in taalmodellen. Inmiddels hebben er heel wat scherpe geesten slimme dingen over geschreven. Een overzicht:
Volgens Ben Thompson heeft de krant niet veel kans als het gaat om het gebruik van artikelen als trainingsmateriaal (de input dus). Hij vergelijkt het met een persoon die heel veel New York Times-artikelen heeft gelezen, en op basis daarvan in staat is iets te produceren dat beïnvloed is door dat materiaal. Dat is niet illegaal. Als de output echter te veel lijkt op het origineel, dan heeft de zaak grotere kans van slagen. En dat is precies wat de krant heeft laten zien, hoewel er vraagtekens te plaatsen zijn bij hoe ze dat voor elkaar hebben gekregen (daarover later meer).
In de aanklacht staat ook dat ChatGPT kan hallucineren en daardoor het materiaal van The New York Times verkeert presenteert, wat reputatieschade kan veroorzaken. Volgens Thompson is dat echter een argument dat juist andersom werkt. Als je ChatGPT niet volledig kan vertrouwen, wordt de waarde van gerenommeerde kranten zoals de New York Times juist groter.
OpenAI zelf beweert dat het gebruik van New York Times-content valt onder 'fair use'. Ze suggereren ook dat de krant opzettelijk ChatGPT zodanig heeft gemanipuleerd (via prompts) om specifieke artikelen exact te reproduceren, iets wat in de praktijk nauwelijks voorkomt, en ook tegen de gebruiksvoorwaarden van ChatGPT in gaat.
Benedict Evans benoemt nog dat de schaal waarop OpenAI (en andere bedrijven) opereren invloed zou kunnen hebben op hoe een zaak als deze benaderd wordt. Waar Ben Thompson zegt dat je het trainen van een taalmodel zou kunnen vergelijken met een mens die gewoon heel veel leest, benadrukt Evans dat de immense schaal waarop een computer dat kan doen reden zou kunnen zijn waarom ‘fair use’ niet meer van toepassing is.
Aan de andere kant is een taalmodel zoals ChatGPT geen ‘database’. Het heeft de informatie die het uit New York Times-artikelen haalt niet ‘opgeslagen’, en je kan het er dus ook niet direct uit halen. Deze informatie zit wel in de trainingsdata, maar niet in het model, zoals Evans het beschrijft.
En dan nog een artikel van Techdirt waarin de aanklacht van de New York Times met de grond gelijk wordt gemaakt. Sterker nog, als de New York Times zou winnen, zou het volgens dit artikel - dat overigens een nogal anti-NYT vibe heeft - wel eens kunnen betekenen dat de krant zelf ook illegaal bezig is (geweest).
Mijn conclusie? Ik weet het niet. Ik zie ook parallellen met hoe mensen al tijden inhoud tot zich nemen en op basis daarvan eigen materiaal maken (zoals bijvoorbeeld deze nieuwsbrief). Maar de schaal en de aard van de technologie maken dit wellicht een ander verhaal. En ik heb de (wellicht naïeve) hoop dat deze ontwikkelingen ertoe gaan leiden dat het belang van betrouwbare instituties/merken voor nieuws en journalistiek eigenlijk alleen maar groter wordt, juist omdat het steeds moeilijker wordt om echt van nep te onderscheiden. Wat dat betreft zou Ben Thompson wel eens gelijk kunnen hebben.
💡Bits & Bytes
Apple heeft steeds meer aandacht voor gaming. Eind jaren negentig / begin jaren ‘00 won Microsoft de strijd om de ‘PC-gamer’, maar de laatste jaren - onder andere door de introductie van de M-chip van Apple - is Apple bezig met een opmars.
Een beetje nerdy: de overvolle tas van Wordpress-oprichter Matt Mullenweg
De Apple Vision Pro wordt 2 februari gelanceerd in de Verenigde Staten
Afgelopen week vond de jaarlijkse CES (Consumer Electronics Show) plaats. Elk jaar worden weer de bizarste gadgets en toekomstvisies van bedrijven die niet willen achterblijven in vaak ongemakkelijke presentaties aan de wereld getoond. Maar naast lachwekkende uitvindingen en prototypes zit er soms ook wat nuttigs en interessants tussen. The Verge maakte een uitgebreid overzicht.
De GPT store van OpenAI is officieel gelanceerd, met allerlei unieke GPTs toegespitst op verschillende taken, van onderwijsassistenten tot schrijfcoaches.
Open source LLMs (taalmodellen) worden inmiddels ook gebruikt voor pornografische doeleinden. Zo zijn er allerlei bedrijven die ‘seksmaatjes’ aanbieden, en daarbij houden ze zich niet altijd aan de leeftijdsgrens.
Volkswagen gaat ChatGPT in hun auto’s integreren. Een typische CES-aankondiging. Zoals The Verge het omschrijft: “The company is clearly looking for some kind of boost, and jumping on the AI hype-train seems designed to give it some kind of sheen of tech inventiveness.”
Nog zo’n typisch CES-dingetje. De CEO van l’Oréal die een ‘fully personalized GenAI-powered solution’ presenteert. In andere woorden: een chatbot die l’Oréal producten aanprijst. Of zoals BCG - die hier blijkbaar bij heeft geholpen - het omschrijft: “This extraordinary feat of product design and AI engineering will help L’Oréal build a personalized, reliable, scalable service, answering their consumers’ beauty needs in a seamless experience.” 🤷🏻♂️
De streepjescode kennen we allemaal. Maar wist je dat het oorspronkelijke concept de vorm van een cirkel had?
Ik vind dit echt heel grappig (maar ook treurig). Blijkbaar staat (stond) Amazon vol met allerlei producten waarvan de omschrijving (en misschien ook wel de afbeelding) volledig door AI-gegenereerd zijn. En dat leidt tot heel veel producten met de naam ‘I’m sorry, but I cannot fulfill this request as it goes against OpenAI use policy’. We gaan echt een wereld vol met AI-bagger tegemoet.
📷 Beeld van de week
Een jaar geleden publiceerden we editie #50. Over, jawel, generatieve AI, en over medicijnen tegen obesitas.
Ben je hier via-via? Schrijf je in voor de nieuwbrief om elke twee weken een nieuwe editie van CouranD te ontvangen!
En, vond je dit leuk? Kan het beter? Heb je tips voor interessante onderwerpen? Laat me weten! Je kan gewoon mailen naar courand@substack.com, of op Substack direct onder deze editie te reageren. En vergeet ‘m niet te delen!
Ocky