Гугл против РВБ: Новые поступления в список запрещенной литературы

Вступительные статьи и комментарии

Несколько замечаний

1. Список произведений, которые не нравятся “искусственному интеллекту” Гугла, растет довольно быстро и включает уже 124 позиции.

2. По какому принципу отбираются произведения для бана не очень понятно. ИИ — это принципиальным образом «черный ящик», принципы его работы засекречены; соответственно, никакая рациональная дискуссия по поводу его решений невозможна.

3. В списке много юмористических и сатирических произведений, из чего можно сделать вывод что ИИ не понимает юмора и рассматривает любые его проявления как «опасный и оскорбительный контент».

4. Впрочем, сфера его непонимания гораздо шире и, кажется, включает человеческую культуру как таковую. Возможно, инженеры из Гугла тренировали его на карточках товаров в электронных магазинах и ресторанных меню, забыв о существовании прозы и стихов, шуток и переносных смыслов.

5. Можно сделать некоторые предположения, как именно работает гугловский ИИ. Возьмем для примера басню Крылова «Госпожа и две Служанки, которую ИИ оценивает как порнографию. Вероятно, текст сначала переводится гугол-транслейтом на английский; затем этот текст, полученный машинным переводом, просматривается на ключевые слова из заранее составленного списка неприличных и оскорбительных слов и их сочетаний. Получаем: «петух» = cock, который ИИ прочитывает в значении ‘хуй’. Далее — «головка» = head, прочитываемый в значении glans penis. И ключевая фраза:

Свернули девушки головку петуху

— которая превращает басню не просто в порнографию, но и в оскорбительную и опасную. При том что в оригинальном тексте никакой «головки от хуя» нет. Ее вполне деконструктивистски вчитал туда ИИ без учета общего смысла, контекста и т.п., и на основе своей ложной интерпретации  подверг произведение цензуре.

6. Если попробовать взглянуть на литературу глазами ИИ — как на некий набор «данных», то становится очевидным, что эти данные ложные, вредные и опасные. Вся литература — это выдумка, fiction, она не описывает факты, а сообщает сплошные fake news.

7. Поскольку литература состоит из некачественных данных, их ценость крайне низка. В Адсенсе средняя цена за клик — $1 (для некоторых категорий данных, таких как недвижимость, цена клика может превышать $100). В РВБ стоимость клика — $0,04, т.е. в 25 раз меньше средней цены по системе.

8. «Мягкая цензура» Гугла, которую мы наблюдаем в РВБ и которая выражается в отключении показа рекламы на «страницах, нарушающих правила» — надежный и верный способ удушения электронных библиотек и победы искусственно умных Терминаторов над естественно глупыми людьми.

+ Обсуждение в фб

Оставьте комментарий

Добавить комментарий