CouranD #93 - Autonome Intelligentie
Over 'computer use' van Anthropic, een podcast over mijn masterscriptie uit 2015, en meer...
Goedezondag,
Negen jaar geleden schreef ik mijn masterscriptie over de relatie tussen filmrecensies en het commerciële succes van films in Nederland. Ik maakte daarbij onderscheid tussen ‘mainstream’ en ‘art house’ films en tussen recensies uit een meer ‘high-brow’ krant (de Volkskrant) en een meer mainstream krant (De Telegraaf). Urenlang heb ik op de redacties van beide kranten recensies van vierhonderd films doorgenomen, het aantal woorden van elke recensie geteld, IMDB data ingevoerd, en allerlei statistische modellen op de data losgelaten in SPSS. Uiteraard controleerde ik in mijn analyses voor zaken als productiebudget, ‘star power’ van de acteurs, etcetera. Mijn verwachting was dat recensies uit de Volkskrant sterker gerelateerd zouden zijn aan het succes van art house films dan mainstream films, en andersom voor recensies uit De Telegraaf. Het tegenovergestelde bleek waar. Recensies van de Volkskrant waren een grotere voorspeller van het succes van mainstream films; er was geen relatie met het succes van arthouse films. Achteraf logisch: mainstream films hebben doorgaans al een ‘basispubliek’. Als ook de ‘kritische kijker’ (lees: Volkskrant-lezer) zo’n film goed vindt, kan dat wellicht het verschil maken.
Waarom vertel ik dit? Dit weekend besloot ik mijn hele scriptie in NotebookLM te gooien en er een podcast van te laten genereren. En het resultaat is verbluffend. Omdat ik de inhoud van de scriptie goed ken, kan ik ook de accuraatheid van wat er in de podcast gezegd wordt goed beoordelen. En ik moet zeggen: het is echt indrukwekkend accuraat. En het werd ook nog eens op een levendige manier besproken. Je kunt de ‘aflevering’ hier luisteren.
Maar goed, daar gaat deze nieuwsbrief niet over. Deze editie: AI wordt steeds autonomer. En Bits & Bytes, over onder andere een MMO van Nintendo, de oorsprong van wifi, nieuwe appjes, en meer.
🤖 Autonome intelligentie
Anthropic - een concurrent van OpenAI - kondigde afgelopen week nieuwe taalmodellen (Claude 3.5 Haiku) en updates van bestaande taalmodellen (Claude 3.5 Sonnet) aan. Inmiddels vliegen de updates je om de oren; de ene benchmark na de andere wordt ‘verslagen’, en de modellen worden steeds slimmer en capabeler. Niet heel veel nieuws onder de zon, dus.
Maar Anthropic deed ook een andere, meer bijzondere, aankondiging: ‘computer use’. Anthropic is een model aan het leren om computers te navigeren. Niet voor specifieke taken, maar gewoon ‘algemeen’ computergebruik. AI kan straks voor jou allerlei opdrachten uitvoeren op je computer. Het model scoort nog niet super goed (”22%”), maar wel een stuk beter dan andere modellen. Het doet me denken aan de Rabbit R1, een AI-gadget die namens jou apps op een virtuele computer bedient, zodat je zonder tussenkomst van een scherm (lees: smartphone) bijvoorbeeld Spotify kunt bedienen. Tot dusver lijkt de gadget echter een flop.
Hoe dan ook, AI-modellen worden dus steeds autonomer. Eerst hadden ze alleen toegang tot het materiaal waar ze op getraind waren, en konden ze alleen ‘taal’ (re)produceren. Toen kregen ze toegang tot het internet en konden ze namens jou zoeken en hapklare antwoorden presenteren. En nu krijgen ze toegang tot je computer om alles te doen waar je zelf geen zin in hebt. Of, zoals Casey Newton het verwoordt:
What makes Anthropic’s agent stand out is that it takes the same technology that powers the AI chatbots we have been using for almost two years now and lets it out of the text box. Instead of being limited to offering you text- or voice-based responses, it can now complete small projects on your behalf.
Je hoeft ze alleen nog ‘op pad’ te sturen met een opdracht. De volgende stap is dat je ze überhaupt geen opdracht hoeft te geven, en volledig autonoom voor jou (of voor henzelf??) te werk kunnen gaan. Zoals een pro-actieve stagiair. Maar ook stagiairs kunnen afgeleid raken. Bij een specifieke opdracht besloot het ‘computer use’-model van Anthropic middenin diens werkzaamheden natuurfoto’s te bekijken. Zou TikTok ook verslavend kunnen zijn voor een taalmodel?
💡Bits & Bytes
Nintendo is een MMO (Massively Multiplayer Online game) aan het testen die gelijkenissen toont met games als Roblox en Minecraft
In de terugkerende rubriek bizarre AI-filmpjes:
De meme met de jongen-op-straat-die-omkijkt tot leven gewekt
Interessant interview met de oprichters van Semafor, een succesvolle online nieuwstitel die twee jaar geleden werd opgericht door de oud-baas van Buzzfeed News.
Een prachtig vormgegeven collectie van artikelen over ruimtetijd, zwarte gaten en de meest fundamentele vragen binnen de natuurkunde
Artikel van The New York Times over hoe de presidentsverkiezing in de VS zich manifesteert op TikTok
WorldCoin - het dystopische bedrijf van Sam Altman met de missie om met behulp van iris scans te kunnen garanderen wie echte mensen zijn in een wereld die straks door AI overspoeld wordt - heeft zichzelf hernoemd naar simpelweg ‘World’ en breidt uit naar meer landen.
Indrukwekkend promofilmpje van Act One - een nieuwe oplossing van Runway, het AI-video bedrijf
Google heeft een technologie ontwikkeld die het mogelijk maakt om AI-content te voorzien van een (onzichtbaar) watermerk, zodat deze content altijd herkenbaar is als door-AI gegenereerd. Het heet SynthID en Google heeft het sinds kort open source gemaakt
Innovation Origins over hoe wifi tot stand is gekomen, dankzij een Nederlandse uitvinder
In de categorie nieuwe appjes:
Smashing is een nieuwe lees-app gemaakt door de oprichter van Pocket, die andere populaire lees-app.
Daze is een nieuwe berichten-app gericht op Gen Z die moet concurreren met Whatsapp, iMessage en andere populaire berichten-apps.
Whisper, de audiotranscriptietool van OpenAI, wordt in ziekenhuizen gebruikt om gesprekken te transcriberen, maar verzint daarbij dingen die nooit gezegd zijn.
Een rondleiding door een cluster van 100,000 grafische kaarten van xAI, het AI-bedrijf van Elon Musk
De automatisch gegenereerde wachtwoorden van je iCloud-sleutelhanger hebben altijd een bepaald format. Deze ontwikkelaar bij Apple legt uit waarom
Voor vijftien- tot twintigduizend dollar kan deze originele iPhone uit 2007, nog helemaal in de verpakking, van jou zijn
📷 Beeld van de week
🕓 Een jaar geleden…
…publiceerde ik editie #70, over Twitter-alternatieven, ActivityPub, POSSE, etcetera.
Ben je hier via-via? Schrijf je in voor de nieuwbrief om elke twee weken een nieuwe editie van CouranD te ontvangen!
En, vond je dit leuk? Kan het beter? Heb je tips voor interessante onderwerpen? Laat me weten! Je kan gewoon mailen naar courand@substack.com, of op Substack direct onder deze editie te reageren. En vergeet ‘m niet te delen!
Ocky