Дистрибутивно-статистический анализ языка русской прозы 1850—1870-х гг.
книга

Дистрибутивно-статистический анализ языка русской прозы 1850—1870-х гг.

Том 2

Год: 2016

Место издания: Москва

ISBN: 978-5-9907947-7-1

Страниц: 849

Артикул: 44591

Электронная книга
300

Краткая аннотация книги "Дистрибутивно-статистический анализ языка русской прозы 1850—1870-х гг."

В соответствии с двояким характером исследования в целом настоящий том включает две части. В части 4 дистрибутивно-статистический анализ (ДСА) проводится на материале 15 миллионов слов, непосредственно примыкающих друг к другу в текстах русской прозы 1850—1870-х гг. Тот же формальный метод прилагается к английскому корпусу (4 миллиона слов романов Диккенса). И в том, и в другом случае ДСА приводит к открытию дистрибутивных классов и некоторых грамматических конструкций. Часть 5 представляет собой частотный словарь русского корпуса, показывающий распределение слов по основным жанрам, по микрожанрам и по текстам 25 писателей. В существенно расширенном виде том 2 представлен на компакт-диске.

Содержание книги "Дистрибутивно-статистический анализ языка русской прозы 1850—1870-х гг."


Часть 4. Дистрибутивно-статистический анализ в минимальном интервале
4.1. Работа ДСА в минимальном интервале на материале корпуса русской прозы
4.1.0. Систематизация морфологических данных
4.1.0.1. Адъективные парадигмы
4.1.0.2. Субстантивные парадигмы
4.1.0.3. Глагольные парадигмы
4.1.1. Минимальный интервал в русском корпусе
4.1.1.1. Частые слова в левой позиции и суффиксы правых слов
4.1.1.2. Частые слова в правой позиции и суффиксы левых слов
4.1.1.3. Поиск конструкций в зоне слов средней частоты
4.1.1.4. Поиск аномалий в конструкциях
4.2. Минимальный интервал в английском корпусе
4.2.1. Дистрибутивные классы частых слов
4.2.2. Комбинаторика дистрибутивных классов
4.2.3. Морфология и дистрибутивные классы
Часть 5. Дифференциация лексики русской прозы 1850—1870-х годов
5.1. Меры лексического сходства частотных словарей
5.2. Распределение лексики по основным жанрам прозы 1850—1870-х гг.
5.3. Распределение лексики по микрожанрам прозы 1850—1870-х гг.
5.4. Распределение лексики по текстам восьми авторов
5.5. Расширение круга сравниваемых авторов
5.6. Лексические маркеры авторов
5.7. Интерпретация авторских лексических маркеров
5.8. Авторские маркеры и дистрибутивно-статистическая морфология
5.9. Межавторские изоглоссы
5.10. Проблема взаимодействия факторов
Таблица 5-A. Распределение лексики по основным жанрам
Таблица 5-B. Распределение лексики по микрожанрам
Таблица 5-C. Распределение лексики по текстам важнейших авторов
Таблица 5-D. Распределение лексики по текстам восьми авторов, родившихся в 1812—1829 гг.
Таблица 5-E. Распределение лексики по текстам девяти авторов, родившихся в 1829—1840 гг.
Таблица 5-F. Основные параметры распределения лексики по 25 авторам
Таблица 5-G. Ранговый словарь 1500 самых частых лемм
Перечень больших таблиц в электронной версии тома 2
Литература

Все отзывы о книге Дистрибутивно-статистический анализ языка русской прозы 1850—1870-х гг.

Чтобы оставить отзыв, зарегистрируйтесь или войдите

Отрывок из книги Дистрибутивно-статистический анализ языка русской прозы 1850—1870-х гг.

28Часть 4возрастает доля форм с -0 без удвоенного -нн-. Вместе с тем сохраняются следы глагольных чередований вроде появления -л- после «губных», ср. влюбленный, оскорбленный, озлобленно, сгорбленный; купленный; утомленный, изумленно, устремленный; удивленно, оживленно, оставленный, объявлено, приготовленный, подавленный, по-ставленный, окровавленный, уставленный.От основы (1) образуется еще одна адъективная парадигма Ci при помощи суффикса -т- (109 основ). Суффикс -т- присоединяется к основам парадигмы Ac (35 основ, в т. ч. одетый, вздернутый, застегнутый, упомянуто, замкнутый, обманутый, обтянутый, покинутый, свернутый, сдвинутый, накинутый, тронуто, стиснуты, за-гнутый); к основам парадигмы Ai (11 основ: открыто, покрытый, вымытый, вырытый, зарыто и др.); к основам парадигмы Ak (31 основа: битый, развитый, нажитые, разлит, испитой, шитый) и к основам многих глаголов, чья принадлежность к парадигмам еще не определена: забытый, бритый, взятый, принято, начато, заклятый, заперто, измятый, обутый, отпетый, потертый, сжато.Парадигма Ck включает 56 основ с конечными суффиксами -ем- и -им- (производным от основ Ab). Оба суф-фикса присоединяются к основе (2). Набор суффиксов не отличается от Ca: называемый, обвиняемый, ожидае-мый, получаемый, предлагаемый, прерываемый, уважаемый; именуемый, преследуемый, требуемый; любимый, гонимый, одержимый, производимый. Любопытна концентрация подобных адъективов в основах с префиксом не-: неистощимый, непобедимый, непримиримый, непроходимый, неразрешимый, нескончаемый, несокрушимый. Отметим также удивительно высокую частоту форм с -о: невыносимо 289, независимо 148, нестерпимо 107, не-ведомо 143, неудержимо 91, невыразимо 86, непостижимо 71, неутомимо 61, невидимо 59, неизмеримо 58, не-возмутимо 52, немыслимо 43. С позиций семантической лингвистики можно отметить склонность к модальным значениям у видимо и мнимо.Подведем итог всему разделу 4.1.0. Консолидация основ вокруг наборов суффиксов привела к уточнению преж-них и ...

Книги серии