April 05, 13:10

Forwarded from NLP Master:

В Zalandoresearch сделали совершенно потрясающую NLP библиотеку для NER, POS, desambiguation, классификации, работы с embeddings (Glove, FastText, BERT и их собственные). Работает на базе Pytorch и очень-очень простая в использовании, так что даже лингвисты теперь могут тренировать свои модели, используя нейросети. Не нужно знать математику, Numpy и подробную теорию дип-ленинга. Достаточно знаний о параметрах, чем они отличаются и как найти наиболее подходящие. 

Другой вопрос, что пока что на моем корпусе нейросети уступают в точности и F-score простому Support vector machine. Надеюсь, мои преподаватели объяснят мне этот феномен. 

Собственно, библиотека: 

github.com/zalandoresearch/flair  

Понятный туториал как сделать классификационную модель: 

towardsdatascience.com/text-classification-with-state-of-the-art-nlp-library-flair-b541d7add21f  

И вообще весь этот блог очень хороший, я много полезного из него взяла для упражнений. 

zalandoresearch/flair

A very simple framework for state-of-the-art Natural Language Processing (NLP) - zalandoresearch/flair