• Tjarda Polderman

Podcast tracking en privacy, hoe zit het daarmee?

Updated: Oct 17

Een paar weken geleden belandde wij via Twitter in een dialoog over de Netflix documentaire The Social Dilemma. Iemand vroeg: "Is dit nu echt nieuwe informatie voor jullie?" Nee oprecht, we zijn er dagelijks mee bezig. Eén van onze vaste luisteraars reageerde ook op het draadje en vroeg zich af hoe het met de privacy van luisteraars zat. Uitstekende vraag, waar we het antwoord niet op wisten. Dus we zijn op onderzoek uitgegaan.

"Podcast listening is hard to track, but that doesn’t mean advertisers aren’t trying." Adrianne Jeffries - The Markup

Tracking en privacy is op dit moment hot topic, maar er is één gebied dat al 20 jaar grotendeels weg is gebleven van de commerciële wereld: het luisteren naar podcasts. Het podcast-ecosysteem is van oudsher tracking-resistent, mede omdat podcasters shows uitbrengen via RSS-feeds. Die waren nog hip toen Adam Curry het uitgevonden heeft.



Adverteerders en de jacht op podcasts

Naar verwachting zal er in 2020 meer dan 800 miljoen dollar uitgegeven worden aan podcasts. Misschien denk je: "Het is niet erg als bedrijven weten wat ik luister." Snappen we, onze podcast valt in de categorie wetenschap en daar is nog niet zoveel mee aan de hand. Je zult er ontzettend slim door lijken. Maar, er zijn ook podcasts over psychische aandoeningen, drugsgebruik en andere (gevoelige) onderwerpen. Dus wat weten podcast hosting-sites (zoals Buzzsprout) eigenlijk over jou?


De belangrijkste metric om het succes van een podcast te meten is vrijwel het enige wat de RSS-infrastructuur toelaat: hoeveel keer een episode wordt gedownload. Alleen de podcast industrie zit inmiddels op een kantelpunt, commerciële partijen hebben manieren gevonden om de beperkingen van RSS te omzeilen. Dit doen ze doormiddel van het gebruiken van redirects. Wanneer gegevens via het internet worden opgevraagd, wordt meestal extra informatie in de koptekst opgenomen. Dit kan helpen bij het cachen, identificeren en doorsturen. Een "responscode (redirect)" is een driecijferig getal dat overeenkomt met gedrag of een resultaat.


In 2014 startte het Zweedse bedrijf Acast met 'dynamic ad insertion'. Vanaf dat moment konden podcasters bestanden markeren met reclamebreuken. Hierdoor is een hostingbedrijf in staat om advertenties te plaatsen op basis van het tijdstip en locatie waarop de podcast is gedownload. Dit maakte direct de weg vrij voor advertenties die 'programmetic' werden verkocht. Google- en Microsoft Ads werken op eenzelfde manier. Voor programmatic advertising zijn consumentengegevens nodig. Een aantal bedrijven verzamelen basisgegevens, zoals Ip-adres, apparaattype en combineren deze met informatie van externe dataverzamelaars. Wij als creators kunnen niet zien wie nu wel of niet onze afleveringen heeft geluisterd, terwijl je het download van een door ons betaalde servers. Maar Spotify wel, gek idee toch?

Je luistert 20voor12 of de De Mannetjes podcast vast via Spotify, Apple, Google of Amazon. Zij zijn als geen ander in staat om jouw gegevens te verzamelen. De first party-gegevens die ze al in bezit hebben combineren ze met jouw luistergewoonten.


En Buzzsprout?

Uiteraard zijn wij als creators benieuwd welke episode goed scoort en welke niet. Onze podcasts worden gehost bij Buzzsprout. Eens zien wat Buzzsprout zegt over tracking:


"Vanwege de manier waarop podcasts werken, is het merendeel van de tijd dat je luisteraar het audiobestand downloadt en er lokaal naar luistert op zijn of haar apparaat. Dit betekent dat we de download zelf kunnen volgen, maar als deze eenmaal is gedownload kunnen we niet meer zien hoe lang de aflevering is beluisterd. We kunnen dus niet de minuten of de duur van een luisterbeurt bijhouden in je Buzzsprout-statistieken. Alle hoop is echter niet verloren! Je kunt deze informatie direct vinden in je Google-, Apple- en Spotify-accounts als je eenmaal in de lijst staat!"


Lees je mee: "Alle hoop is echter niet verloren."🤔 Oké, wat verder? Buzzsprout verzamelt alleen de minimale gegevens die nodig zijn om een download te valideren en vast te stellen welke app is gebruikt om de episode te downloaden (dus je player, bijvoorbeeld Spotify, of Apple Podcasts). Buzzsprout gebruikt de gegevens van de luisteraar NIET om:

  • Programmatic ads te faciliteren

  • Traceren en/of identificeren van personen

  • Profielen op basis van interesses aanmaken

  • Combineren datapools om de demografie van het publiek te achterhalen

  • Verkoop van luisteraargegevens aan wie dan ook, voor welk doel dan ook

Wanneer een podcastaflevering wordt gedownload via een distributiekanaal van een derde partij, worden deze gegevens van de luisteraar opgenomen voor analyse:

  • IP-adres

  • User Agent (je player, dus Spotify of bijvoorbeeld Apple Podcasts)

  • Verwijzende URL (in sommige gevallen)

De bovenstaande gegevens worden rechtstreeks uit de serverlogs gehaald. Buzzsprout maakt geen gebruik van trackingtechnologieën van derden voor het downloaden van media. Lees hier de privacy policy van Buzzsprout.


Als creators hebben we wel zicht op toekomstige downloads. Buzzsprout maakt met zijn 'Podcast Predictor' gebruik van een eigen algoritme. Deze gebruikt historische gegevens van eerdere episode en van jouw dagelijkse downloadgeschiedenis. Hoe meer episodes, hoe beter het algoritme wordt in het voorspellen. "Historische info is geweldig, maar het wordt echt spannend als je het gebruikt om de toekomst te voorspellen." Aldus Buzzsprout. Verder maakt Buzzsprout gebruik van het IP-adres, de referer en de user agent (zoals Spotify) van luisteraars om te bepalen hoe ze naar onze podcastaflevering luisteren. Weet Buzzsprout nog meer? Buzzsprout toont geen luisteraarsmetrics in onze dashboards, maar ze kunnen (wanneer we dit willen) wel een rapport geven dat voldoet aan de IAB v2-definitie. Wat dit is?

De IAB Podcast Measurement Technical Guidelines zijn het resultaat van de inspanningen van de Podcast Technical Working Group om duidelijkheid te scheppen in de markt door een gemeenschappelijke taal te ontwikkelen rond metingen. De focus van dit document ligt op metingen aan de hand van serverlogs. Naast het definiëren van standaard metrics voor zowel podcastinhoud als podcastadvertenties, biedt dit document ook richtlijnen voor een aantal technische details, zoals het filteren van verzoeken, om de verschillen die momenteel worden gezien tussen podcastuitgevers en technische leveranciers te verminderen.


RSS biedt dus niet zo heel veel mogelijkheden voor het verzamelen van luisterdata. Er is nog een andere manier: RAD. Remote Audio Data is een project van National Public Radio en zijn instructies voor hoe zowel podcasters als adverteerders kunnen meten of iemand de podcast ook daadwerkelijk heeft geluisterd en voor hoe lang. NPR heeft via zijn eigen app toegang tot meer gegevens over hoe mensen precies luisteren. In het project zijn deze gegevens gebruikt om adverteerders te laten weten dat hun advertenties ook daadwerkelijk gehoord zijn. Zo werkt het ook met adverteren via abri's. Iemand gaat met zijn fiets op pad (ja echt waar), maakt een paar foto's van jouw gekochte abri's en in plaats van dat je er 300 hebt ingekocht, zijn er maar 200 geplaatst (bijvoorbeeld).

NPR maakte tijdens het project gebruik van de advertentieserver AdsWizz, waardoor het de mogelijkheid kreeg om advertenties in en uit afleveringen te wisselen. Er is nog een maar, bij RAD moeten ook de podcast-platformen (zoals Spotify en Apple Podcasts) meedoen, zoals een Buzzsprout. Tot nu toe wordt dit nog niet gedaan, maar voor hoelang nog?

En we gaan verder

Voorlopig is podcast tracking nog niet zover als andere media, in die zin dat het niet veel gegevens oplevert. Via Buzzsprout hebben we toegang tot enkele statistieken, terwijl we via Spotify veel meer kunnen zien over onze luisteraars. Het zal niet heel erg lang meer duren voordat er meer workarounds rondom RSS worden bedacht.


44 views
Founded_in_Groningen-text.png

=

© 2020 door Joshua & Tjarda | Pics door Andy Zuidema