Український стартап навчає нейромережу кримськотатарської мови

Вікторія Андрєєва — 30 березня 2023, 16:27

Український стартап Respeecher тренує нейромережу для розпізнавання кримськотатарської мови.

Голосові помічники, як-от Siri чи Alexa, зможуть розпізнавати команди, перекладати текст, шукати інформацію, розповіли засновники проєкту для "Української правди. Життя".

На думку авторів проєкту, це сприятиме популяризації мови серед носіїв. Команда Respeecher створювала синтезовані голоси для Голлівуду, зокрема голос Дарта Вейдера та Люка Скайвокера для фільмів Star Wars. Але наразі розробники ставлять в пріоритеті популяризацію кримськотатарської мови.

"Процес збору та аналізу інформації є доволі часозатратний: може зайняти від кількох тижнів до кількох місяців, залежно від якості аудіо. Втім, наша команда хоче, щоб цей ресурс був безкоштовними і доступним у відкритих джерелах. Віримо, що це допоможе у популяризації використання, як української, так і кримськотатарської мови", – каже технічний директор та співзасновник Respeecher Дмитро Бєлєвцов.

Фото: tommaso1979/Depositphots

Для того, щоб навчити нейромережу, треба близько тисячі годин із записами цією мовою. Надіслати свій аудіозапис можна через форму.

У стартапі просять робити запис у тихій кімнаті з мінімально можливою кількістю фонових шумів.

"Чим більше відмінних акцентів і тональностей модель штучного інтелекту проаналізує, тим точнішим буде результат розпізнавання мови", – зазначають розробники.

Вони запевняють, що жодні дані конкретних осіб не будуть зберігатися, а за записами не синтезуватимуть чужі голоси. Їх використають виключно для навчання нейромережі цілому та кращого розпізнавання кримськотатарської.

Цим ресурсом можуть скористатись, як поодинокі розробники, щоб покращити аудіо сприйняття української мови у своєму продукті, так і великі корпорації, на кшталт, Facebook, Google чи помічники, на кшталт, Siri.

Читайте також: Мистецтво бути корисним: як штучний інтелект може навчити творчому сприйняттю світу

Реклама:

Головне сьогодні