Как рассказала представитель инициативы, посвятив несколько минут времени, каждый имеет возможность внести ценный вклад в то, чтобы современные технологии, такие как виртуальные помощники «Сири» и «Google Ассистент», и искусственные интеллект выучить латышский язык наилучшим образом.
Целью «Balsu talka» является сбор разнообразных образцов латышской речи и их транскрипций, создание открытого и свободно доступного набора данных латышской речи в объеме не менее 1000 часов. В свою очередь, в майские праздники инициаторы проекта надеются, что им удастся собрать не менее десятой части необходимого минимума.
Для участия в проекте заинтересованные лица должны зайти на сайт «balsutalka.lv», выбрать предложение и произнести его. Для декламации предлагаются различные тексты, но в честь 4 мая у участников будет возможность прорепетировать спектакль-сказку «Спридитис» писательницы Анны Бригадере.
«Большая часть речевых данных на латышском языке, используемых в настоящее время компаниями языковых технологий, не находится в свободном доступе. Это препятствует осуществлению более широких исследований и инноваций. Чтобы получить как можно больше и более разнообразные речевые данные, нам необходимо участие всего общества», — говорит ведущий научный сотрудник Института математики и информатики Латвийского университета (ЛУ) Илзе Аузиня.
Социальная инициатива «Balsu talka» будет продолжаться в течение всего 2023 года. Она направлена на воспроизведение различных голосов, включая интонации и акценты. Согласно инициативе, имена представителей, возраст, пол и национальность участников не имеют значения — чем разнообразнее голосовые образцы на латышском языке, тем ценнее. Вместе с тем, это также важная культурно-историческая инициатива, поскольку образцы голосов, на которых говорят в Латвии и в диаспоре, будут сохранены и переданы будущим поколениям, считают авторы проекта.