В рамках одного маленького проекта написал приложение для анализа частей речи казахского языка (POS).
Окно приложения выглядит так:
Указываем путь к папке, выбираем один из файлов (pdf, docx, txt).
Ниже можно указать, какие подстроки удалить (знаки переноса строки например, или даже целые слова).
И следующие 2 окна - предпросмотр “сырого” текста и результаты анализа в CSV-табличке.
Исходники тут - https://github.com/cnstntn-kndrtv/kazakh_pos.
в ./dist/
лежит архив собранного приложения для Windows (то еще удовольствие, кстати, собирать десктопные приложения для Python на Windows).
Анализатор частей речи казахского языка
This post is licensed under CC BY 4.0 by the author.