Языки южной Сибири в синхронии, диахронии и взаимодействии

2016-9-24 09:28

Одним из победителей пятого конкурса мегагрантов стала докторфилологических наук, главным научный сотрудник и заведующая отделом урало-алтайских языков Института языкознания РАН, член-корреспондент РАН, профессор Центра компаративистики Института восточных культур и античности РГГУ Анна Владимировна Дыбо.

Публикуем короткое интервью после объявления победителей. Вопросы задавала Наталия Демина.

См. также список победителей 2016 (NEW! пятого), 2013 (четвертого), 2012 (третьего), 2011 (второго), 2010 (первого) конкурса мегагрантов

Уважаемая Анна Владимировна, поздравляем с мегагрантом! Подскажите, как родилась идея проекта - идея сотрудничества с коллегами из Томска? Является ли проект общероссийским или международным?

Идея работы с Томском скорее почти случайная. Дело в том, что в позапрошлый розыгрыш мегагрантов грант с томскими этнологами получил Д. А. Функ - зав. кафедрой этнологии на истфаке МГУ, с которым мы постоянно сотрудничаем по тематике языков и фольклора тюркских народов Южной Сибири. И там сейчас получилась сильная этнологическая лаборатория.

С другой стороны, в Томске еще продолжает действовать школа описания сибирских языков А. П. Дульзона, с представителями которой я все время тоже работаю, там, в частности, гигантский архив материалов, еще не опубликованный, и, в частности, по уже вымершим языкам. Когда томские филологи ко мне обратились, я посоветовалась с Функом и да, мы решились. Я думаю, мы будем привлекать и специалистов не из России по мере надобности и если они будут заинтересованы.

Это первый проект по лингвистике, получивший мегагант? Были ли вы удивлены итогами конкурса?

Кажется, да. Да, я была очень удивлена; тем более, что я была отчасти знакома с еще парой проектов по лингвистике, и мне не казалось, что они хуже этого. Может быть, правда, он более актуален - из-за задач документации малых языков, которые в нем заявлены.

Расскажите, пожалуйста, о целях и задачах проекта. Будет ли в Томске создана новая лаборатория?

Цель - описать языки южной Сибири в синхронии, диахронии и взаимодействии, обращая внимание на максимальное количество важных параметров. Задачи, которые при этом встают:

а) выявить эти самые важные параметры, т. е систему существенных признаков, и добрать по ним материал Тут понадобится полевая и архивная работа. У меня большая часть этой работы уже придумана, но пока мы только подбирались к ней, вот я сейчас руковожу проектом РГНФ, в котором делаются диалектологические опросники нового типа - такие, чтобы вытащить все параметры, существенные для генеалогической классификации и для установления межидиомных расстояний. У нас заложено несколько корпусных проектов, проект этимологической базы данных и т. д. Это все надо будет сделать.

б) В процессе работы предполагается обработка больших массивов языковых данных. Для этого, кроме формы записи этих данных, необходима вообще разработка программной оболочки, сейчас эта деятельность начата с помощью, в частности, специалистов из Института системного программирования РАН. Они сделали сейчас оболочку для связных иерархических словарных баз данных, в которые можно легко добавлять фонетические файлы с реальным звучанием (нарезанные из экспедиционных материалов), а также сделанные по ним в программе Praat спектрограммы, это улучшает возможности фонетического анализа.

В рамках корпусного проекта Президиума РАН мы разработали морфологический парсер для языков алтайского типа - непарадигматических, его осуществил для одного из тюркских сибирских языков мой сын - Фил Крылов (в порядке родственной взаимопомощи), но, правда, никак не допишет к нему форму, в которой лингвист сможет сам вставлять модули для разных языков.

Сейчас программисты ИСП РАН разрабатывают удобное хранилище для звучащих текстовых корпусов с парсингом - на основе имеющейся оболочки ELAN, но такое, чтоб туда можно было удобно подгружать и править результаты нашего парсинга с помощью упомянутой программы. Разрабатываются также синтаксический и семантический модули разметки, в основном, ради создания автоматических фильтров на пути парсинга.

Нужно еще множество всяких инструментов, например, для измерения фонетических расстояний не по Левенштейну (буквенные замены), а, во-первых, на основании разложения фонем как пучков фонетических признаков; во-вторых, на основании акустических характеристик фонов, репрезентирующих эти фонемы. Получив эти инструменты, мы сможем, наконец, обосновать и исчислить механизмы фонетических изменений.

Чтобы всё это довести до ума, надо, чтоб лингвисты регулярно и в большом объеме использовали соответствующие программные средства и, находя недостатки, несли их программистам, а те бы их правили, лингвисты бы опять несли и т. д. Еще планируется исследование речи билингвов, для чего тоже надо будет составлять корпуса и ловить существенные параметры. И да, для решения всех этих задач в Томске будем делать лабораторию.

Какими вы видите итоги проекта, если всё будет получаться и финансирование не будет запаздывать?

Ну, написали мы вот что:

Ожидаемые результаты:

1. Будут собраны лингвистические данные, релевантные для лингвогеографической, этнокультурной и социолингвистической классификации языков и диалектов региона. Данные будут представлены в виде связанных баз данных, а также визуализованы на электронной карте региона с возможностью построения изоглосс различного типа.

2. Будут созданы психолингвистические базы данных, отражающие когнитивные аспекты этноязыковой специфики идиомов и результаты их взаимодействия между собой и русским языком ((не менее 150 000 реакций на каждый) язык: шорский, хакасский)

3. Будут созданы / расширены имеющиеся корпусы идиомов Южной Сибири ( в том числе звучащие корпуса), в частности, чулымского, телеутского, шорского, хакасского и иных тюркских языков региона - за счет работы с архивными материалами и полевых экспедиционных исследований, - доведя каждый из подкорпусов до 500 тыс. - 1 млн. словоупотреблений.

4. Для корпусного представления текстов будет разработана классификационная схема, позволяющая автоматическое/полуавтоматическое извлечение сопоставительного материала из корпусов.

5. Будет создан корпус образцов устной и письменной русской речи билингвов Южной Сибири с использованием разработанной методики, корпус русско-тюркского билингвизма объемом до 500 000 словоупотреблений (телеутский, шорский, хакасский).

6. Будут описаны механизмы взаимодействия языков в речи билингвов изучаемых идиомов (на семантическом, грамматическом, концептуальном уровнях) посредством серии психолингвистческих экспериментов (9 поведенческих экспериментов с использованием программного обеспечения E-Prime и устройства для записи движения глаз eye-tracker), выявляющих такое взаимодействие в ходе процессов порождения, восприятия речи, чтения, решения когнитивных задач с лингвистическим компонентом

7. Будут разработаны этимологические словари в форме реляционных баз данных, на основании которых будут построены генеалогические деревья языков и диалектов.

8. Будут выявлены корреляции между различными исследуемыми классификационными языковыми и психолингвистическими признаками и сделаны выводы о действии основных этногенетических тенденций в регионе

9. Будет разработана рабочая модель корпусного планирования во всех субъектах РФ в Южной Сибири для имплементации её в процессе ревитализации локальных этнических языков, находящихся под угрозой исчезновения.

Чтобы выявить корреляции, конечно, нужны не только деньги, но и корреляции, так что тут абсолютной уверенности быть не может.

Борис Штерн, описывая итоги первого конкурса мегагрантов 2010 года, написал: «Дурные деньги достались достойнейшим». Вы согласны с его оценкой, если проецировать её на конкурс этого года?

Да, очень на то похоже. Во всяком случае, доклады на конференции мегагарантников в Казани были в основном очень интересные.

Спасибо за интервью!

.

Аналог Ноткоин - TapSwap Получай Бесплатные Монеты

Подробнее читайте на

языков padding-left 30px данных сибири южной ран работы