В официальном блогпосте представители Facebook рассказали об искусственном интеллекте по имени Розетта, который с помощью машинного обучения научат идентифицировать текст, наложенный поверх картинок и видеороликов.
Такого рода программы существуют уже давно, но все существующие варианты не подходят Facebook в силу величины платформы и высокой вариативности контента, который системе нужно будет анализировать. Компания надеется, что Розетта научится отличать безобидные шутки-мемы от оскорбительных, которые содержат так называемую “речь ненависти” (“hate speech”).
Этот ИИ должен научиться идентифицировать текст в картинках и видео, и автоматически помечать как потенциально запрещённые те из них, что содержат “речь ненависти”, после чего модераторы должны будут проверить их вручную.
Чтобы научиться выполнять эту задачу Розетте нужно очень много данных, и сейчас она уже подключена к Facebook и Instagram, где она ежедневно извлекает и анализирует текст из 1 млн изображений и видеороликов.