TikTok steht wegen des fesselnden UX-Designs sowie des kontrovers diskutierten Datenschutzes im Fokus. Diese Feasibility-Studie zeigt, wie Mobile Affective Computing Research die implizit-emotionale UX zuverlässig und objektiv messen kann. Die Ergebnisse implizieren, dass TikTok bereits im Onboarding positive Emotionen auslöst und die emotionale Bindung mit zunehmender Nutzung – vor allem aufgrund des Personalisierungsalgorithmus – verstärkt.
1. Warum TikTok auf einem Siegeszug ist
Die App TikTok der Firma ByteDance ist eine der am schnellsten wachsenden und für viele Zielgruppen relevantesten Apps weltweit: TikTok kam im Januar 2021 in Deutschland auf 330.000 Downloads im Google Play Store sowie auf 205.000 Downloads im Apple App Store und war somit in beiden Stores die führende App (Statista, 2021). TikTok steht vor allem aufgrund des fesselnden User-Experience-Designs sowie des kontrovers diskutierten Datenschutzes im Fokus.
Das Produktdesign von TikTok fokussiert auf hyper-personalisierte und emotional bewegende Video- und Audio-Inhalte. Diese werden auf der ForYou-Page für alle Nutzer:innen individuell ausgespielt. Dabei greift TikTok auf den User Generated Content der zahlreichen Content Creator im eigenen Ökosystem zurück. Ziel der Content Creator ist es, mit eigenen Inhalten auf möglichst vielen ForYou-Pages anderer Nutzer:innen zu erscheinen, um Reichweite und Engagement zu steigern. TikTok entscheidet auf Basis eines proprietären, nicht-öffentlichen Algorithmus, welche Nutzer:innen welchen Content ausgespielt bekommen. Zentral dabei ist das Engagement der Nutzer:innen: Sehen sie sich den Inhalt (genauer) an oder wischen sie zügig zum nächsten Beitrag? Der Content besteht überwiegend aus Kurzvideos, die oft aktuellen und kurzlebigen Trends folgen bzw. diese sogar mitbestimmen. TikTok analysiert und kodiert diese Videos, um eine gezielte Personalisierung durchführen zu können.
Die Personalisierung und Individualisierung basiert auf den vom Algorithmus gesteuerten Ansätzen des Collaborative Filtering und Content-based Filtering. Der Algorithmus sucht homogene Benutzerprofile mit ähnlichen Eigenschaften und heterogene Benutzerprofile zur Unterscheidung. Er vergleicht dabei sowohl Nutzer:innen mit ähnlichen Nutzer:innen als auch Content mit ähnlichem Content (TikTok, 2021). Zusätzlich zu vergangenem Nutzerverhalten, wie bisher angesehenen Inhalten, werden soziodemografische und psychografische Charakteristika der Nutzer:innen herangezogen, um personalisierten Content bereitzustellen (Klug & Strang, 2019). TikTok ist mit einem der weltweit treffsichersten Personalisierungsalgorithmen ausgestattet. Vor allem passt sich die Experience sehr schnell dem objektiven Nutzungsverhalten der Nutzer:innen an. Das geschieht bereits in der ersten Session, dem Onboarding.
Abbildung 1 zeigt exemplarisch den Onboarding User Flow in der TikTok-App. Nach der Registrierung geben die Nutzer:innen ihre persönlichen Interessengebiete an. Relevanter für TikTok ist jedoch das tatsächliche Nutzungsverhalten – insbesondere, welche Videos die Nutzer:innen bis zu Ende schauen, wiederholt ansehen, liken, teilen, etc. (TikTok, 2021). Daraufhin passt TikTok die individuelle ForYou-Page direkt und ohne expliziten (weiteren) Input der Nutzer:innen an deren Präferenzen an.
Angesichts dieses stark impliziten User-Experience-Designs sowie der emotionalen Ausrichtung der TikTok-Inhalte bietet sich die App als Forschungsobjekt für Affective Computing an. Ziel dieses Feasibility-Forschungsprojekts ist es, die emotionale UX des TikTok-Onboarding-Algorithmus zu untersuchen sowie Effekte auf das spätere, tatsächliche Nutzungsverhalten von TikTok-Nutzer:innen zu erforschen. Der Fokus liegt dabei auf dem First Moment of Truth, der ersten Nutzungserfahrung, was in zwei zentralen Fragen resultiert: Wie nehmen TikTok-Nutzer:innen das Produkt beim Onboarding wahr? Hat der Onboarding User Flow einen Einfluss auf die spätere Nutzung?
2. Warum die Nutzung von TikTok problematisch werden kann
Der immense Erfolg von TikTok und eine lange tägliche Nutzungsdauer insbesondere bei Jugendlichen werfen zunehmend Fragen hinsichtlich negativer Effekte der App auf. Berichte und Anekdoten zeigen, dass TikTok-Nutzer:innen sich nur schwer wieder von der App lösen können. Sie nutzen den fortwährenden Inhalts-Strom der App und sind nicht selten überrascht, wie viel Zeit schon vergangen ist, in der sie ständig neue und abwechselnde Inhalte angesehen haben. Der Personalisierungsalgorithmus von TikTok bietet – im Gegensatz zu anderen fortlaufenden News Feeds wie beispielsweise Instagram – nicht kontinuierlich mehr Inhalte der gleichen Art, sondern lernt auf Basis des Nutzungsverhaltens, ob und vor allem welchen variablen Content die Nutzer:innen bevorzugen. Die abwechslungsreichen Inhalte vermögen es, die Nutzer:innen regelrecht zu fesseln und die Zeit vergessen zu lassen. Es muss keinen Profilen anderer Nutzer:innen aktiv gefolgt werden, denn die personalisierte ForYou-Page wird automatisch individualisiert – der Aufwand für Nutzer:innen ist somit minimal und intuitiv.
Angesichts des beträchtlichen und kontinuierlich produzierten Contents kann TikTok nicht nur antizipieren, sondern auch überraschende Inhalte ausspielen. Wenn Nutzer:innen beispielsweise gerne witzige Fußballvideos ansehen, können sie nach einiger Zeit mit witzigen Rugbyvideos überrascht werden. Der TikTok-Algorithmus lernt schnell, ob und in welchem Ausmaß solche unerwarteten Inhalte für die Nutzer:innen relevant und interessant sind. Das übergeordnete Ziel des Algorithmus ist es stets, die Nutzungsdauer zu steigern.
Das Produktdesign von TikTok erreicht eine hohe Verweildauer der Nutzer:innen, indem gezielt eine Dopamin-Ausschüttung erzeugt wird, die der Antizipation einer unbekannten Belohnung gleicht. Dieser Effekt ist vergleichbar mit dem Warten auf überraschende Geschenke vor dem Weihnachtsfest. Man antizipiert, dass es ein Geschenk gibt, wird vom Inhalt jedoch überrascht. Nicht das tatsächliche Schenken, sondern die gespannte Erwartung und Vorfreude darauf regen die Ausschüttung von Dopamin an, das umgangssprachlich als „Glückshormon“ bezeichnet wird und auf das neuronale Belohnungssystem wirkt.
Vor dem Hintergrund der jungen Zielgruppe der TikTok-App, die anfangs vor allem Jugendliche ansprach, wirft dieses Produktdesign potenziell ethische und moralische Bedenken auf: kann es junge Nutzer:innen süchtig und abhängig machen? In diesem Kontext wird auch die Problematik offenkundig, dass mit rein auf Selbstauskunft basierenden Befragungsstudien solche impliziten Mechanismen nicht aufdeckbar sind und Affective Computing eine sinnvolle Ergänzung für die digitale UX-Forschung leisten kann (Picard, 1997). Affective Computing umfasst die automatisierte, echtzeitbasierte Messung und Erkennung von Emotionen der Nutzer:innen. So lassen sich beispielsweise über Facial Coding Stimmungen und Emotionen beim Betrachten der individuellen ForYou-Page erkennen. Affective Computing zeigt emotionale Zustände skalierbar und ohne Beeinflussung der Personen auf und ermöglicht es, implizite Reaktionen zu registrieren, ohne die Nutzer:innen direkt zu befragen, und minimiert somit bewusste oder unbewusste Verzerrungen.
3. Wie Affective Computing helfen kann, das emotionale UX-Design zu messen
Diese Feasibility-Studie nutzt einen kombinierten Ansatz aus Affective Computing, Befragungsdaten sowie Verhaltensdaten. Ziel ist es, ein möglichst valides Abbild von Nutzereindrücken zu erhalten sowie einen Labor-Bias – und somit eine geringere externe Validität der Ergebnisse – zu vermeiden. Des Weiteren sollen Aussagen von Nutzer:innen zu ihren subjektiven Verhaltens- und Emotionsdaten, objektiven Verhaltensdaten sowie den objektiven Affective-Computing-Daten gegenübergestellt werden (Hahn, Klug & Riedmüller, 2020). Dies ermöglicht eine Methodentriangulation und zeigt, inwieweit Mobile Affective Computing Research bei implizit-emotionalen Produkten mit angemessenem Aufwand umsetzbar ist.
An der Studie nahmen 13 Proband:innen teil, die vorher keine TikTok-Nutzer:innen waren. Für alle Teilnehmer:innen wurde ein neuer TikTok-Account eingerichtet, der für eine Woche mittels eines eigenen Smartphones nutzbar war. Den Onboarding User Flow dokumentierte eine Handykamera als Gesichtsvideo sowie ein Screen Capture Tool als Bildschirmvideo (= Zeitpunkt 1).
Als geeignetes Tool zur modularen Evaluation zentraler Aspekte der User Experience gilt der meCUE-Fragebogen (Thuering & Minge, 2014), den alle Proband:innen nach dem Onboarding User Flow zur subjektiven Einschätzung der User Experience ausfüllten. Nachdem die Proband:innen TikTok eine Woche lang individuell nutzen konnten, erfolgte die zweite Messung (= Zeitpunkt 2). Dafür wurde erneut eine TikTok-Session der Proband:innen per Handykamera und Screen Capture Tool aufgezeichnet, der Fragebogen meCUE nochmals durchgeführt sowie die tatsächliche Nutzungsdauer innerhalb der Woche auf Basis der Betriebssystemdokumentation des Handys erfasst. Die Gesichtsvideos wurden mithilfe der Software Tawny hinsichtlich Valenz und Arousal analysiert. Valenz misst dabei die Stimmung der Nutzer:innen und ist von -1 (= sehr negative Stimmung) bis zu +1 (= sehr positive Stimmung) skaliert. Arousal misst die Erregung der Nutzer:innen und ist analog skaliert von -1 (= geringe Erregung) bis zu +1 (= hohe Erregung).
Abbildung 2 zeigt das Analysetool sowie exemplarische Ergebnisse der Gesichtskodierung (Facial Coding, links) kombiniert mit den Screen-Capture-Videos (rechts). Es ist erkennbar, dass die direkte emotionale Reaktion auf den ausgespielten TikTok-Content sequenziell gemessen werden kann.
Der Versuchsaufbau ermöglicht es, Mobile-Affective-Computing-Forschungsansätze zu implementieren, um die sehr kontextabhängige und überwiegend auf mobilen Endgeräten genutzte UX der TikTok-Nutzer:innen realitätsnah zu erfassen. Die Proband:innen konnten das eigene, vertraute Endgerät in gewohnter, häuslicher Umgebung nutzen, was wiederum die externe Validität erhöht.
4. Welche Resultate die TikTok-Feasibility-Studie zu emotionalen Nutzerreaktionen zeigt
Abbildung 3 zeigt die durchschnittlichen Werte für Valenz (Stimmung) und Arousal (Erregung) der Proband:innen bei der Nutzung von TikTok zum Zeitpunkt 1 (= Onboarding User Flow) sowie zum Zeitpunkt 2 (= Session nach einer Woche). Bei der Interpretation des Valenzwertes ist zu beachten, dass ein Wert von -0,2 einer durchschnittlichen Valenz bei der Nutzung digitaler Geräte entspricht.
Die Ergebnisse verdeutlichen zudem, dass die Proband:innen durchschnittlich nach einer Woche TikTok-Nutzung emotional positiver gestimmt sind als während der erstmaligen Nutzung, d.h. während des Onboarding User Flow. Dies deutet darauf hin, dass der Personalisierungsalgorithmus innerhalb einer Woche eine erhöhte positive Emotion bei Nutzer:innen herbeiführen kann.
Abbildung 4 zeigt eine Analyse, die die Proband:innen zunächst gemäß ihrer Stimmung und Erregung zum Zeitpunkt 1 mithilfe eines Mediansplitts in zwei gleich große Gruppen einteilt. Aus Abbildung 4-1 (links) ist ersichtlich, dass Proband:innen, deren Stimmung (Valenz) während des ersten Onboarding User Flow besser war, in der Woche darauf eine deutlich höhere Nutzungsdauer der TikTok-App zeigten als Proband:innen mit einer schlechteren Stimmung, nämlich 103 Minuten vs. 38 Minuten.
Die Ergebnisse hinsichtlich Erregung (Arousal) in Abbildung 4-2 (rechts) sind analog: Proband:innen mit einer anregenderen Nutzungserfahrung im Onboarding User Flow zeigten 125 Minuten Nutzung der App in der ersten Woche, während die Nutzungsdauer der anderen Gruppe bei 46 Minuten lag.
Diese Ergebnisse deuten darauf hin, dass die objektiv emotionale Nutzungserfahrung des Onboarding User Flow die spätere App-Nutzung – gemessen über objektive Nutzungsdauer – maßgeblich beeinflusst.
Abbildung 5 verdeutlicht die subjektive Bewertung der TikTok-UX von allen Proband:innen sowohl zum Zeitpunkt 1 als auch zum Zeitpunkt 2. Die Daten basieren auf dem meCUE-Fragebogen, den die Proband:innen erstmals nach dem Onboarding User Flow und nochmals nach einer Woche ausfüllten. Diese subjektiven, auf Selbstauskunft beruhenden Daten zeigen, dass die Proband:innen nach einer Woche die TikTok-App auf allen UX-Dimensionen positiver bewerteten als zu Beginn der Nutzung. Dies lässt sich einerseits auf den erfolgreichen Personalisierungsalgorithmus zurückführen, der die Dopamin-Ausschüttung anregt, und andererseits mit alternativen Erklärungsansätzen, wie dem Mere-Exposure-Effekt, begründen; eine Art Gewöhnung, die aufgrund der bloßen mehrfachen Wiederholung aus einer anfangs neutralen eine positive Bewertung macht, da sich bei der Testperson Vertrautheit gegenüber den dargebotenen Inhalten einstellt.
Zusammenfassend deuten die Ergebnisse darauf hin, dass die Nutzungserfahrung von TikTok für die Proband:innen im Laufe der Nutzungsdauer sowohl objektiv als auch subjektiv positiver wurde. Dies lässt sich mit dem Personalisierungsalgorithmus erklären. Des Weiteren zeigt sich, dass die objektiv gemessene emotionale UX des Onboarding User Flow das tatsächliche Nutzungsverhalten, gemessen durch die Nutzungsdauer, maßgeblich beeinflusst. Somit scheint eine frühzeitige und implizite Personalisierung im Onboarding User Flow maßgeblich für die UX von TikTok zu sein. Jedoch ist zu bedenken, dass diese Längsschnittstudie lediglich auf den Daten von 13 Proband:innen basiert und somit nur erste Hinweise und Ansätze für weitere Forschungsarbeiten liefern kann.
5. Welche Erkenntnisse sich aus dieser ersten TikTok-Feasibility-Studie zur Messung der emotionalen Nutzerreaktionen ziehen lassen
Diese Feasibility-Studie verdeutlicht, dass Mobile Affective Computing Research eine bereichernde Forschungsmethode insbesondere für hochgradig implizites und emotional orientiertes Produktdesign darstellt. Die inhaltlichen Ergebnisse sind aufgrund der geringen Fallzahl als vorläufig und nicht repräsentativ anzusehen. Sie zeigen jedoch mögliche Ansätze für weitere Studien in Bezug auf die TikTok-App. Eine größere Stichprobe sowie die Erfassung weiterer (späterer) Messzeitpunkte könnten die Erkenntnisse dieser ersten Feasibility-Studie replizieren und validieren. Zudem könnten interkulturell angelegte Studien aufzeigen, inwieweit die emotionalen Reaktionen der Nutzer:innen sich länderspezifisch bei der TikTok-Nutzung unterscheiden.
Die Ergebnisse haben zudem ethische Implikationen: Angesichts der (ursprünglichen) TikTok-Zielgruppe der Jugendlichen, die in ihrer Pubertät in einer emotional instabilen und beeinflussbaren Phase sind, sollten ethische Rahmenbedingungen für potenziell suchtgefährdende Social Media Apps, wie TikTok, diskutiert werden. Als kurzfristige Alternative zu langwierigen gesetzlichen Verboten könnten beispielsweise Mechanismen der freiwilligen Selbstkontrolle einen ersten Stellhebel bieten, um Heranwachsende vor einer emotionalen Abhängigkeit oder einer Social-Media-induzierten Suchterkrankung zu schützen.
Einen weiteren möglichen Forschungsaspekt stellt das Versuchsdesign dar: Hier wurden die Nutzer:innen durch ihre Erklärung zur Teilnahmebereitschaft mittels eines externen Triggers zur Nutzung der App bewegt. Dabei werden Analogien zum sozialen Druck der Social-Media-Nutzung deutlich: Um mit ihrer Peer-Group in Kontakt bleiben sowie über relevante Trends und Content mitreden zu können, ist die Nutzung derselben Social Media Apps nötig.
Die Ergebnisse offenbaren weiter, dass auch Nutzer:innen, die TikTok zunächst weniger positiv beurteilten, die App nach einer gewissen Nutzungsdauer subjektiv positiver wahrnahmen. Dies lässt sich auf die starke Personalisierung der Inhalte zurückführen und erhöht gleichzeitig den Handlungsdruck für eine Regulierung der TikTok-App für junge Zielgruppen. Hier sind weitere Forschungsarbeiten erforderlich, um alternative Erklärungen sowie Langzeitauswirkungen mit höherer Fallzahl zu untersuchen.
Literatur
Hahn, A.; Klug, K.; Riedmüller, F. (2020): Digital Empathy: Kombinierte Erfassung über Affective Computing und Eye Tracking. In DIGITALE WELT Blog, https://digitaleweltmagazin.de/2020/05/01/digital-empathy-kombinierte-erfassung-ueber-affective-computing-und-eye-tracking/, abgerufen am 21.06.2021.
Klug, K.; Strang, C. (2019): The Filter Bubble in Social Media Communication: How Users Evaluate Personalized Information in the Facebook Newsfeed. In Osburg, T.; Heinecke, S. (Eds.): Media Trust in a Digital World: Communication at Crossroads, Springer: Heidelberg, 159-180.
Thuering, M.; Minge, M. (2014): Nutzererleben messen – geht das überhaupt? In Mittelstand-Digital, 47–55, https://www.researchgate.net/publication/263733263_Nutzererleben_messen_-_geht_das_uberhaupt, abgerufen am 21.06.2021.
Picard, R. (1997): Affective Computing, Cambridge MIT Press.
Statista (2021): Leading mobile social media apps in the Google Play Store in Germany in January 2021, by number of downloads (in 1,000s). https://www-statista-com.thn.idm.oclc.org/statistics/690718/leading-social-media-apps-in-google-play-in-germany-by-downloads/, abgerufen am 21.06.2021.
TAWNY Documentation (2021): Understanding Emotion Analytics. https://docs.tawny.ai/guide/understanding_emotion_analytics.html#measuring-emotions, abgerufen am 21.06.2021.
TikTok (2021): How TikTok recommends videos #ForYou. https://newsroom.tiktok.com/en-us/how-tiktok-recommends-videos-for-you, abgerufen am 21.06.2021.
Um einen Kommentar zu hinterlassen müssen sie Autor sein, oder mit Ihrem LinkedIn Account eingeloggt sein.