UA

YouTube демонетизирует видео со словами "Гей" и "Лесбиянка" в названии

Новое расследование, проведенное коалицией создателей и исследователей YouTube, обвиняет платформу в том, что она полагается на систему «фанатичных ботов», чтобы определить, нужно ли демонетизировать определенный контент, в частности видео ЛГБТ.

Суть расследования

Расследование проводило три человека: Силоу, генеральный директор исследовательской фирмы Ocelot AI, автор на YouTube Эндрю, управляющий каналом YouTube Analyzed и Энн, известный благодаря каналу Nerd City. Об этом сообщает Информатор Tech, ссылаясь на The Verge. Расследование было вызвано интересом посмотреть, какие слова были автоматически демонетизированы роботами машинного обучения YouTube, поскольку возросла обеспокоенность по поводу прозрачности между руководителями и пользователями YouTube в сообществе авторов. Эндрю вручную протестировал 15 300 слов в период с 2 июня по 5 июля 2019 года, используя самые распространенные термины в словаре Вебстера, UrbanDictionary и результатах поиска Google. Второй раунд эксперимента проходил с 6 по 21 июля и включал 14 000 слов, которые были автоматизированы с помощью API данных YouTube Sealow. Энн сотрудничал со своими собственными источниками и помогал в создании основного видео. Эндрю, Силоу и Энн выпустили свои индивидуальные видео о результатах, вместе с таблицей Excel, в которой перечислены все слова, которые они использовали, и анализ их результатов. Эти слова были использованы для проверки того, что боты YouTube считают автоматически неуместными для монетизации. Команда обнаружила, что если слова типа «гей» и «лесбиянка» меняются на случайные слова, например «счастливый», «статус видео меняется на дружественный для рекламодателя» каждый раз, говорит Энн в своем видео.

Реакция YouTube

Пресс-секретарь YouTube сообщил, что существует список слов ЛГБТ, которые вызывают демонетизацию, несмотря на результаты расследования. Представитель добавил, что компания «постоянно оценивает наши системы, чтобы убедиться, что они отражают нашу политику без несправедливой предвзятости. Мы гордимся присутствием ЛГБТ на нашей платформе и очень серьезно относимся к таким проблемам», - сказал представитель. «Мы используем машинное обучение для оценки содержания в соответствии с нашими рекомендациями рекламодателя. Иногда наши системы ошибаются, поэтому мы поощряем авторов подавать апелляции. Успешные обращения гарантируют, что наши системы будут обновляться, чтобы становиться все лучше и лучше».

Как это работает

Системы YouTube для автоматической демонетизации основаны на множестве сигналов, но, по словам компании, нет конкретного списка, который встроен в систему машинного обучения компании. Компания подтвердила, что тестирует образцы видео от авторов ЛГБТ всякий раз, когда вводятся новые классификаторы монетизации, чтобы гарантировать, что видео ЛГБТ с большей вероятностью будут демонетизированы. Но компания утверждает, что действующая система проверок, которая используется модераторами-людьми, которые контролируют апелляции, должным образом отражает политику компании в отношении условий ЛГБТ. Но выводы исследователей предполагают, что существует сильная предвзятость в работе ИИ, прежде чем люди-модераторы вмешиваются. Их исследования привели к выводу, что роботы машинного обучения YouTube, которые специально используются для проверки доступности видео для монетизации, используют «скрытый уровень достоверности от 0 до 1». Те, кто ближе к нулю, одобрены для монетизации, а другие ближе к одному демонетизированы. Фактически, если видео считается превышающим пороговое значение YouTube, оно немедленно демонтируется и должно быть проверено вручную. «Классификаторы Youtube были обучены, чтобы попытаться предсказать, какова вероятность того, что видео будет демонетизировано, на основе данных обучения (на основе предыдущих результатов ручного просмотра)», - сказал Силоу. «Таким образом, 1 балл уверен на 100%, что его нужно демонетизировать, а 0,5 - 50% и так далее. Youtube пришлось установить определенный приемлемый порог - скажем, «35-процентная достоверность», когда любое видео с показателем выше 0,35 будет демонетизировано и требует ручной проверки, прежде чем будет одобрено для монетизации». Анализируя свои выводы, Силоу утверждает, что «этот список лучше всего интерпретировать как список отрицательно заряженных ключевых слов, поскольку некоторые слова считаются более строгими, чем другие». Каждое видео, загруженное для тестирования, длилось от одной до двух секунд и «не содержало визуального или аудиоконтента, который мог бы вызвать демонетизацию», говорится в отчете. Период ожидания одобрения или отказа от монетизации составлял около двух часов. Слова, связанные с сообществом ЛГБТ или термины, используемые в комментариях, такие как «демократ» или «либерал», «вероятно, имеют отрицательный заряд из-за их использования в политических комментариях, которые часто считаются не дружественными рекламодателям», говорится в отчете. «Точно такие же видео монетизируются без терминологии ЛГБТ», - говорит Силоу в своем видео. «Речь идет не о демонетизации личностей ЛГБТ. Это терминология ЛГБТ, такая как «геи» и «лесбиянки», единственная причина, по которой видео демонетизируется, несмотря на контекст». Утверждения, сделанные в видео, не новы, но исследование является самым обширным. Руководители YouTube, в том числе генеральный директор Сьюзан Войчицки и директор по продуктам Нил Мохан, высказывают опасения, что определенные ключевые слова в метаданных и заголовках приводят к автоматической демонетизации. Это особенно распространенная проблема в сообществе ЛГБТ. YouTube категорически опроверг информацию о том, что существуют правила, «гласящие:« Если вы поместите определенные слова в заголовок, то его демонетизируют », - сказала Войчицки. Это не помешало создателям использовать секретный язык в своих видео и включать Google Documents в свои комментарии, чтобы общаться со зрителями. YouTuber Petty Paige высветит позорное изображение желтого знака доллара - знак, который знают как создатели, так и зрители, означает, что видео демонетизировано - это означает, что ее поклонники должны прочитать документ, указанный ниже, чтобы понять, почему она использует конкретные слова. Она предположила, как и многие другие представители ЛГБТ, что использование таких слов, как «лесбиянка» или «трансгендер», может привести к демонетизации.

Реакция ЛГБТ сообщества

Ранее этим летом ряд создателей ЛГБТ подали иск против YouTube за предполагаемую дискриминационную практику, в том числе за несправедливую демонетизацию контента, включающего условия, благоприятные для ЛГБТ. В иске также утверждается, что YouTube активно наносит ущерб количеству просмотров своих каналов, размещая видео в ограниченном режиме, за который компания ранее извинялась, и, следовательно, ограничивая их способность зарабатывать деньги. В иске утверждается, что «YouTube занимается дискриминационным, антиконкурентным и незаконным поведением, которое наносит вред защищаемому классу лиц согласно законодательству Калифорнии». «Мы устали от того, что нас успокаивают чистой ложью и пустыми обещаниями, что они либо исправили, либо собираются исправить», - сказал Крис Найт, который является одним из организаторов новостного шоу ЛГБТ на YouTube, GNews! «Это явно неисправно работает. Там явно предвзятость с их ИИ, их политикой. Мы действительно хотим, чтобы они изменились». Силоу и Энн заявляют, что они не верят, что YouTube или Воичицки являются гомофобами или намеренно используют предполагаемые гомофобные практики. Они специально добавляют, что это не из-за определенных политик YouTube или «отсутствия программ для смягчения алгоритмической дискриминации». «Это просто результат вероятностного характера классификаторов машинного обучения, используемых ботом демонетизации», - добавляет доклад Силоу. Раннее мы сообщали о том, что YouTube упростил для авторов видео поиск и фильтрацию комментариев. Также писали, что YouTube извинился перед пользователями за нововведения. Узнать еще больше актуальных новостей из мира технологий и игр можно в нашем Telegram-канале, а также на наших страничках в Facebook и Instagram.

Мы используем файлы cookie, чтобы обеспечить должную работу сайта, а контент и реклама отвечали Вашим интересам.