У відкритому доступі запрацював електронний словник із 200 тис. слів

25
16 грудня 2015

Як пише AIN.ua, він не є академічним, але вже використовується для перевірки орфографії в hunspell і Libreoffice.org, а також перевірки граматики в програмі LanguageTool. У словнику 197 тис. слів, з яких генеруються 3,4 млн. словоформ з набором тегів для кожної (частина мови, морфологічні ознаки і додаткові позначки).

Творці словника виклали його на GitHub, де будь-який бажаючий може його використовувати і пропонувати удосконалення. Найпростіше залишити відгук або пропозицію на сторінці, на форумі або ж по електронній пошті.

Словник постійно поповнюють: додають нові інформативні теги, виправляють помилки, вводять формати виводу і т.д. Головна мета розробників - великий електронний словник, який допоможе створити програмні кошти, підтримують українську мову чи аналізують тексти українською: автоматична перевірка орфографії, граматики і стилю, класифікація текстів, виявлення іменованих сутностей, data mining і т.д.

Нагадаємо, раніше київський розробник створив словник львівської говірки для iOS.

powered by lun.ua