«Ми заново створили алгоритм TikTok на основі каналів 1100 користувачів. Дізнайтеся, які теми є у вашій стрічці, і подивіться, що алгоритм найменше покаже вам.», — пишуть на: www.washingtonpost.com

Користувачі TikTok давно задаються питанням, як алгоритм програми дізнається їхні точні смаки та ставить їх на певну «сторону» TikTok.
Наша карта, створена за спрощеною моделлю алгоритму «системи рекомендацій» TikTok, ілюструє можливості платформи показувати вам те, що ви можете захотіти, а також розкриває величезні океани контенту, який ви, можливо, ніколи не побачите — і, можливо, не підозрюєте про існування.
Наш аналіз показує, що стать відіграє велику роль у тому, які відео вам показують. Жартівливі відео про повсякденне життя подобаються майже всім — і вони згруповані разом на карті, навіть якщо вони не мають спільних ключових слів. Водночас телевізійні, музичні та спортивні відео з’являються в багатьох місцях на карті, показуючи, як смаки користувачів навчають алгоритм робити точні відмінності між різними командами, музичними стилями та телевізійними жанрами.
Ми створили для вас спосіб дослідити деякі з цих «сторон» для себе, щоб ви могли зрозуміти, в якому куточку всесвіту соціальних мереж ви живете — і які теми навряд чи коли-небудь з’являться на екрані вашого телефону.
Дізнайтеся, де в TikTok відображаються хештегиЧим більше ви бачите одних хештегів, тим менша ймовірність побачити інші.
кошеня
є
Торкніться хештегу, щоб дослідити
Власник TikTok, ByteDance, мало що розкриває про точну внутрішню роботу свого алгоритму. Але документ, опублікований у 2022 році, дає підказку: алгоритми, які використовує компанія, нагадують системи рекомендацій, які створюють багатовимірну карту відео, комбінуючи вибір перегляду багатьох користувачів. Ці типи алгоритмів рекомендацій стали галузевим стандартом після того, як більше десяти років тому були введені в Netflix.
Наша версія алгоритму створює карту на основі того, які користувачі бачили кожне відео, а які – ні. На відміну від TikTok, він не знає ні хештегів — ні нічого іншого про вміст відео, наприклад тексту чи зображень. Ми знаємо, що наш алгоритм спрацював, тому що, коли пізніше ми досліджували метадані з відео, відео з однаковою темою чи хештегом, як правило, групувалися разом.
Речник TikTok Махсау Куллінане сказав, що методологія The Post була неповною і не «відображає реальність того, як працює наша система рекомендацій». Вона також сказала, що компанія «прозора» щодо того, як працює корм. На веб-сайті компанії зазначено, що «бери[s] враховувати те, як інші взаємодіють із вмістом, щоб допомогти інформувати ваш досвід» і включає «неповний список … про різноманітність сигналів і взаємодій, які система використовує для надання персоналізованого вмісту».
У ньому також сказано, що він спрямований на «просування[e] різноманітний контент і теми». Карта The Post підтверджує це: канали користувачів зазвичай беруться з кількох місць на карті.
Наприклад, ось карта, що відображає шість місяців історії переглядів — близько 8800 відео — від користувача 462, жінки з Айдахо.
Відео, які користувач 462 переглянув у TikTok
Згідно з аналізом The Post, вона отримує величезну кількість контенту про психічне здоров’я — приблизно 9 відсотків її каналу.
Цей кластер відео про психічне здоров’я переплітається з кластерами відео про сімейні та любовні стосунки. Це означає, що користувачі, які бачать відео про психічне здоров’я, також часто бачать відео, присвячені стосункам — TikTok сприймає ці теми як пов’язані. Отже, якщо люди хочуть отримувати менше контенту про психічне здоров’я, їм також доведеться пропустити відео, присвячені стосункам.
Цей користувач також бачить багато інших тем. П’ять відсотків її корму – коти, а ще 9 відсотків – вміст Тейлор Свіфт.
Багато учасників проекту The Post були явними фанатами поп-зірки: десятки, як і цей користувач, бачили її згадку щонайменше у 5% відео на своїй стрічці влітку 2024 року, під час її туру Eras Tour.
Користувач 723: Ймовірний Swiftie
На карті видно, що серед вмісту Swift немає нічого. Якщо вам не подобається ця поп-зірка — навіть якщо ви дивитесь відео про інших поп-зірок або про «Канзас-Сіті Чіфс», чий тайт-енд Тревіс Келсі є нареченим Свіфт, — ви, ймовірно, отримаєте дуже мало інформації про неї. Якщо ви отримуєте багато, це здебільшого той самий вміст, що й усі інші Swifties.
Оскільки вміст Swift настільки поляризований, приблизно 1500 відео про неї відображаються на карті як острів. Інші теми з відданими фанатами з’являються на інших краях карти.
В іншому розслідуванні в рамках цього проекту The Post досліджував, як навіть найактивніші користувачі TikTok поступово витрачали в середньому все більше часу на додаток. Ті завзяті користувачі, швидше за все, побачать «сторітайм» контент — жанр смішних або розчаровуючих історій від першої особи.
Цей користувач, який дивився близько чотирьох днів TikTok щомісяця влітку 2024 року, бачить багато відео, розміщених на сюжетному півострові.
Користувач 113: програма для перегляду контенту «storytime».
У деяких більш дивних сюжетних прикладах робототехнічний голос читає анекдот, отриманий із таких сайтів, як Reddit, щоб зацікавити вуха користувача, накладений на непов’язані відеоігри, щоб зацікавити їхні очі.
Один із способів роботи алгоритму TikTok — показати користувачам, що сподобалося схожим користувачам. Це означає, що деякі, здавалося б, не пов’язані теми розташовані близько одна до одної на карті, оскільки багатьом користувачам сподобалися відео на обидві теми.
Цей користувач, чоловік, який сказав, що йому за 30, живе поблизу Бостона, отримує багато роликів про техніку, а також про комедійний серіал «Офіс».
Користувач 115
Подібним чином контент про «Бріджертон» і «Гру престолів» — престижні телешоу — часто бачать шанувальники #booktok, місця для обговорення книг у TikTok.
Користувач 168
Подібно до того, як деякі непов’язані теми в кінцевому підсумку розташовані поруч, деякі споріднені теми знаходяться далеко одна від одної – наприклад, музика, тому що не кожен шанувальник любить будь-яку музику.
Цьому користувачеві подобається реп-музика — йому показали 271 відео з тегом #notlikeus, відсиланням до минулорічної яловичини Кендріка Ламара та Дрейка.
Але цей користувач не отримав багато від кластеру поп-музики чи від регіону про Євробачення, щорічний співочий конкурс, що проводиться в Європі.
Регіон поп-музики розташований у верхній частині карти, поруч із регіоном відео про ЛГБТК+, тому що багато користувачів у нашій вибірці дивилися відео на обидві теми, включно з відео Чаппелла Роана, квір-співака з драг-персоною.
Ваша стать має великий вплив на ваш канал.
Ліворуч від карти є відео, які непропорційно дивляться жінки, зокрема книги та засоби догляду за шкірою. Відео справа непропорційно дивляться чоловіки, включно з відеоіграми та спортивними автомобілями. Фітнес, подорожі та робота опиняються посередині, тому що чоловіки та жінки бачать їх однаково.
Алгоритм карти, який використовував The Post, нічого не повідомляв про стать учасників, але він самостійно виявив, що стать є одним із найбільших показників того, що міститься у вашій стрічці. Користувачі, які вказали The Post свою стать, різко розділилися в тому, як їхні канали відображаються на карті.
Звичайно, канал для кожної людини персоналізований. Ніщо не завадить вам створювати стрічку, щоб порушити тенденції алгоритмів, переглядаючи контент на одну тему, а також її протилежність — як-от Dungeons and Dragons і Кім Кардашьян, або шлюб і «Губка Боб Квадратні Штани».
Репортаж Джеремі Б. Меррілла.
Дизайн і розробка Леслі Шапіро та Джо Фокса.
Монтаж Емілі М. Енг, Меган Хойер, Юн-Хі Кім та Акіла Джонсон. Редагування копії Кортні Рукан.
Додаткова підтримка від Кейтлін Гілберт, Клари Енс Морс, Олександри Панноні, Мішель Джаконі, Емми Гразадо, Клер Уоллес, Крейга Тімберга, Дейва Йоргенсона, Лорен Сакс, Кармелли Бойкін, Джозефа Фергюсона, Пейдж Муді, Джейка Кара, Скотта Дербеса, Аарона Брезела та Кеті Уертас.
Іконки з Noun Project: Comedy by Manda, Family by Fajar Studio, Music by Alina Belogolova, Cat by Indigo Diamond.
Методологія
Ми використали алгоритм альтернативних найменших квадратів, щоб створити багатовимірну карту відео та зменшили її до двох вимірів за допомогою PacMAP. Карта моделює, які відео TikTok показує користувачам; а не їхні рішення про залучення. Теми на карті були визначені індуктивно за допомогою ключових слів. Дані за період із середини березня до початку вересня 2024 року надали читачі Post.
«Найбільш схожі» та «найрізноманітніші» хештеги були обчислені з кореляційної матриці присутності загальних, недублюючих хештегів у стрічках користувачів.
Детальніше про нашу методологію ви можете прочитати тут.
