November 26, 2017

Сегодня такой спокойный день, ттт, никуда не надо бежать, никакой срочной работы, никаких семейных кризисов, можно полежать и посмотреть накопившиеся видео.

Решила, наконец, делать конспекты (но только самых интересных тем) и не могу с вами не поделиться. Это конспект рассказа про речевые коллокации из 8 недели «Введения в корпусную лингвистику» от ВШЭ на Открытом образовании в исполнении Анны Иосифовны Левинзон.

Я очень люблю все корпусное, как оказалось, и постоянно вам нудела про частотность; про речевые коллокации тоже писала, но совсем мало, потому что эта тема чуть-чуть статистически посложнее. Если пользоваться терминами nlp, то частотные словари — это про униграммы, а коллокации — это все, что больше одного, биграммы, триграммы и т.д. При этом тема эта очень важная, потому что язык меняется быстро, вслед за технологиями и самой цивилизацией, и даже вторые тысячи частотности в английском языке между 1930-ми гг. и 2010-ми отличаются кардинально. При этом коллокации, точнее, их изучение, позволяют нам ответить на вопрос, почему так происходит.

В изучении языка они тоже появляются моментально, на самых первых уровнях. Вы учите, как сказать, сколько вам лет: I am 30 years old vs. j’ai 30 ans, и по-другому сказать невозможно, хотя, если вы выразитесь калькой со своего языка, me 30 years, вас поймут. И вы не скажете Merry Birthday / Happy Christmas (если вы не играете языком, но это уже уровни, близкие к носителю).

В общем, очень интересная лекция получилась, сегодня последний день курса, надеюсь, мне позволят досмотреть оставшиеся видео.

telegra.ph/Kollokacii-konspekt-11-26

Коллокации (конспект)

https://t.me/linguistique_sur_un_genou

Коллокации — пары (тройки, четверки...) слов, которые встречаются вместе чаще, чем объясняется случайным распределением слов. 

Выделяются в корпусах на основании статистических методов (взаимная информация, частотность). Например, из слов шекспировского корпуса можно составить около 844 млн. биграмм, но представлены в нем только 300 тыс. или 0.04% от всех возможных. Преобладание таких словосочетаний отражают формирование определенных устойчивых нейронных связей в процессе длительного взаимодействия с языком. 

Основоположник теории коллокаций — Джон Синклер из проекта Collins COBUILD (совместный проект разработки словаря на основании большого корпуса в сотрудничестве Бирмингемского университета и издательства Collins). 

Считается, что автор текста свободен в выборе при его создании (выбор слов при переходе от одного к другому). Текст — результат потенциально бесконечного числа сложных выборов. На самом деле, это не совсем так.

Синклер и его последователи говорят о том, что в реальности все по-другому: при создании текста мы очень ограничены т.н. полуготовыми (preconstructed) конструкциями, определяемыми речевой сочетаемостью.

В английском языке нельзя сказать hardened smoker, но только heavy smoker (как и в русском — заядлый курильщик). В русском можно использовать другие прилагательные (активный, тяжелый), но они уже будут восприниматься как особый художественный прием или ошибка. 

Изменение значения и сочетаемости коллокаций отражает изменение культуры, технологий, цивилизационные сдвиги. Например, в корпусе 1990-1999 гг. «in the cloud» — 100% метеорологическое значение (или говоря про пыль, дым и подобное). В корпусе 2005-2009 гг. — 60% коллокаций входят со значением, относящимся к распределенным вычислениям и хранению информации.

Словари и учебники английского языка, основанные на коллокациях

  • Oxford Collocations Dictionary (мой любимый, есть в сети)
  • McMillian Collocations Dictionary
  • Collins COBUILD Idioms Dictionary
  • English Collocations in Use (учебник)

Направления изучения коллокаций. 

(1) Lexical bundles (лексические вязанки) — коллокации, изучаемые как единое целое (n-граммы). Самые частотные лексические последовательности в корпусе. Носители языка их обычно не осознают (в отличие от идиом), они, в принципе, не являются идиоматическими — смысл понятен из смыслов отдельных слов. Не имеют художественной яркости, эмоциональной окраски, экспрессии. И не являются законченной смысловой фразой, это отрезки речи, предложения. 

Лексические вязанки изучаются, как это часто принято в лингвистике, через ошибки в их употреблении, а также через иронические (шире — художественные) их модификации. He was missing something important... is there a tea in this spaceship? (с) Douglas Adams, Hitchhiker’s Guide to the Galaxy. Чего-то не хватало vs. скучал.

(2) Сочетаемость синонимов. Например, stop..., end..., finish... Stop + gerund (глагол, обозначающий что-то неприятное, smoking, whining), end + noun (негативный смысл или негативное слово, civilization — разрушить цивилизацию, end war), finish + gerund (бытовые действия, eating, knitting etc.). 

(3) Семантическая просодия. Элементы значения (в т.ч. оценка, положительная или отрицательная), появляющиеся у нейтральных слов в речевых сочетаниях. Commit a crime, provide assistance, impressive achievement. В этой теме изучаются также коллигации — сочетание слова с грамматическими признаками другого слова, семантические предпочтения — где употребляется то или иное слово, в каких семантических полях (исследования А. Пиперски слова «заядлый» и крайне ограниченное семантическое поле его использования — вредные привычки, вредные пристрастия). 

Как пример семантической просодии — выбор синонима при обозначении явления для придания ему резко отрицательной или, наоборот, более нейтральной окраски (см. пост про политическую корректность, люди с ограниченными возможностями vs. калеки). Распространенный речевой прием для манипуляции эмоциональной окраской текста, придания ему двойного смысла, иронии. 

В двуязычных словарях семантическая просодия очень важна, потому что в одном языке слово может нести положительную оценку, а в другом — отрицательную (propaganda в китайском и в английском), при этом смысл один и тот же. 

Интересное поднаправление — перевод выражения на язык неносителем с использованием коллокации из своего языка, или L2 vs. L1. Например, make a decision — фр. do a decision <- faire une decision, нем. meet a decision <- eine Entscheidung treffen и т.д. 

(4) Семантика словоформ. Как используются формы того или иного слова, с какими смыслами. Например, слово «план/ы» в русском языке — у меня есть план, план действий vs. какие у тебя планы на вечер?

Источник: лекции 8 недели курса «Введение в корпусную лингвистику», разработанного ВШЭ и А.И.Левинзон и представленного на сайте https://openedu.ru/

Автор конспекта: Ксения https://t.me/linguistique_sur_un_genou