TikTok har kunnat sticka ut bland andra sociala medier med antalet nedladdningar och aktiva användare. Anledningen till detta är en kombination av datarelaterade komponenter. Idag tittar vi närmare på några av dem.
För att upprätthålla en sund gemenskap och ett hälsosamt ekosystem, strävar TikTok efter att undertrycka innehåll som involverar våld, bedrägeri, pornografi, flatulens och väger in fakta, högkvalitativt innehåll som nyheter. För detta mål måste en ram för gränskontroll definieras utöver kvantifierbara modellmål. (Content Audit system)
Rekommendationsmålen kan formuleras till ett klassiskt maskininlärningsproblem, vilket sedan kan lösas med hjälp av algoritmer inklusive kollaborativ filtreringsmodell, logistisk regressionsmodell, faktoriseringsmaskin, GBD och djupinlärning. Ett rekommendationssystem av industriell kvalitet kräver en flexibel och utbyggbar ML-plattform för att bygga upp experimentell pipeline för att snabbt träna olika modeller för att sedan stapla dem för att serva i realtid. (t.ex. kombinera LR och DNN, SVM med CNN).
Förutom huvudsakliga rekommendationsalgoritmen behöver TikTok också träna algoritmen för innehållsklassificering och användarprofilering. Nedan finns en hierarkiklassificeringsarkitektur för innehållsanalys
Borra ner från masterroten. Varje lager ner är huvudkategorin och underkategorin. Jämfört med en separat klassificerare kan en hierarkisk klassificeringsmekanism bättre lösa problemet med skevt data.