September 19, 2017

Ладно. Кажется, ваше мнение понятно. Спасибо большое, это приятно слышать.

Тогда пришлю вам ссылки на 2 замечательных соревнования (точнее 4 соревнования на 2 площадках) по применению науки данных для решения задач естественных языков. Я совсем недавно ныла в своем канале про DS, что после вопросов Quora никаких хороших соревнований по NLP не было, один CV кругом, который мне неинтересен, и на прошлой неделе их запустили.

1. Соревнование от Сбербанка: определение релевантности вопроса и построение вопросно-ответной системы. Язык: русский. За ссылку спасибо @snakers4.

Денежные призы, но не в них дело, конечно. Отличный набор данных, которого до этого не было в свободном доступе, и очень интересная задача, по результатам решения которой появится много полезного и нужного.

contest.sdsj.ru/

2. Соревнование от Google на Kaggle: нормализация текста и перевод его в разговорную форму (например, вместо 12:45 писать / говорить "двенадцать сорок пять", распознавать и переводить в письменную форму даты, мерные выражения, суммы валют и т.д.). Языки: русский и английский.

Те же самые достоинства у этих соревнований.

www.kaggle.com/c/text-normalization-challenge-english-language

www.kaggle.com/c/text-normalization-challenge-russian-language

Я пока мал и зелен, а также у меня все плохо со свободным временем, поэтому сама в эти соревнования не полезу. Но данные загружу и покручу на досуге, конечно.