AI är en av de främsta sakerna som har gjort TikTok så populär bland användarna runt hela världen. Data är centralt i detta sammanhang. Om man beskriver rekommendationsmodellen så är det en funktion som anpassar användarens tillfredsställelse med det användargenererade innehållet (User Generated Content). För att tillhandahålla denna funktion krävs inmatning av data från tre dimensioner:
- Innehållsdata (Content Data)- TikTok är en plattform med massivt användargenererat innehåll. Varje typ av content har sina egenskaper, systemet bör kunna identifiera och särskilja dem för en tillförlitlig rekommendation.
- Användardata (User Data)- Dessa inkluderar intresse, karriär, ålder, kön, demografi etc. Det inkluderar även latenta funktioner från ML-baserad kundkluster.
- Scenariodata (Scenario Data)– Denna data spårar användarscenariot och användarens preferensförändringar baserat på olika scenarier. Till exempel vilken typ av video en användare gillar att titta på när de är på jobbet, reser eller pendlar.
När relativ data väl har samlats in, kommer fyra typer av kritiskt konstruerade funktioner härledas och matas in i rekommendationsmotorn:
- Korrelationsfunktioner: de representerar korrelationen mellan innehållsattribut och användartaggar, inklusive nyckelordsmatchning, klassificeringstagg, källmatchning, tematagg och latenta funktioner som vektoravstånd mellan användare och innehåll.
- Användarscenario-funktioner: konstruerade från scenariodata inklusive geografisk plats, tid på dagen, händelsetaggar, etc.
- Trendfunktioner: de baseras på användarinteraktioner och representerar en global trend, hett ämne, toppnyckelord, trendteman, etc.
- Samarbetsfunktioner: baserat på kollaborativ filtreringsteknik. Den balanserar den smala rekommendationen (bias) och samarbetsrekommendationen (generalisering). Närmare bestämt kommer den inte bara att ta hänsyn till en enskild användares historia utan analysera samarbetsbeteendet hos en liknande användargrupp (klick, intressen, nyckelord, teman).
Modellen kommer att förutsäga om innehållet är lämpligt för användaren i ett scenario genom att lära sig av ovanstående funktioner.