Конференция «Диалог 2016»

2016-6-20 00:30

1 - 4 июня в Москве прошла 22-я международная конференция «Диалог 2016», посвященная компьютерной лингвистике и интеллектуальным технологиям. Доклады ее участников освещали различные проблемы описания естественного языка, компьютерного моделирования языковых процессов, создания практически применимых компьютерных лингвистических технологий.

Конференция организуется компаниями ABBYY и Yandeх, Институтом лингвистики РГГУ, Институтом проблем информатики РАН, Институтом проблем передачи информации РАН и Филологическим факультетом МГУ

Традиционно на конференции также подводятся итоги соревнований различных автоматических алгоритмов анализа русских текстов (Dialogue Evaluation). «Соревнования» компьютерных программ продолжаются в течение года, а на «Диалоге» специалисты оценивают их результаты. На этот раз в рамках Dialogue Evaluation прошло тестирование программ, анализирующих тональность текста, систем автоматического исправления опечаток и методов автоматического извлечения фактов.

На общих заседаниях конференции выступили трое специально приглашенных докладчиков. Доклад Алессандро Москитти (Alessandro Moschitti, Катарский вычислительный исследовательский институт, Университет Хамад бин Халифа) был посвящен применению искусственных нейронных сетей с глубинным обучением для решения задач автоматической обработки естественного языка. В последние годы в связи с большим прогрессом, достигнутым в области машинного обучения нейронные сети всё больше используются и в лингвистических приложениях, например, для распознавания речи, категоризации документов, машинного перевода. Но, как отметил Москитти, сложные задачи семантического анализа требуют новых решений в области нейронных сетей. По его оценке, успехи сетей в таких задачах, как извлечение из текста имплицитной информации, идентификация перефразированных предложений, создание вопросно-ответных автоматических систем, пока сравнительно невелики. В качестве примера современной системы автоматического анализа текстов Москитти привел алгоритм работы суперкомпьютера Watson компании IBM, оснащенного системой искусственного интеллекта, которая обучена понимать вопросы на английском языке и искать на них ответы. Часть доклада была посвящена применению ядерных методов распознавания (kernel methods) в лингвистических задачах.

Бонни Веббер (Bonnie Webber, Эдинбургский университет) рассказала о работе над Penn Discourse Treebank 2. 0 (PDTB2), созданным в 2008 году крупнейшим в мире аннотированным текстовым корпусом. Сейчас его разработчики создают новую версию корпуса (PDTB3), которая будет снабжена системой меток, указывающих на семантические отношения между предложениями (последовательность, условие, отрицание), в том числе такие отношения, которые связывают предложения из разных абзацев текста. В докладе Марка Стидмана (Mark Steedman, Эдинбургский университет) речь шла о моделировании семантики текстов системами автоматического анализа. Он отметил, что по сравнению с уже довольно хорошо разработанными формальными моделями служебных слов и логических операторов понимание компьютерными системами значений слов и предложений всё еще затруднено, хотя именно их значения составляют основное содержание текста.

Отдельная секция конференции «Диалог 2016» была посвящена проблемам лексической семантики русского языка. В докладе Валентины Апресян (Институт русского языка РАН, НИУ ВШЭ) рассматривались тонкие различия в семантике и сочетаемости синонимичных глаголов пропасть и исчезнуть. Анализировались также другие глаголы или выражения с общим значением ‘прекращение существования’ и выявлялись факторы, влияющие на их употребление, а также другие значения, которые могут регулярно возникать у подобных глаголов. Например, у многих таких глаголов имеются значения не только ‘перестать существовать’, но и ‘переместиться’, и ‘перестать быть видимым’. У некоторых глаголов значение ‘переместиться’ является исходным, а значение ‘прекращение существования’ - производным (например, у глаголов пройти и уйти). На выбор одного из близких по значению глаголов влияет ряд параметров. Один из них - тип исчезающего объекта: живой организм, ресурс, состояние и другие. При этом, например, в применении к живым организмам исчезнуть может обозначать только прекращение существования вида, а не отдельного организма и, соответственно, употребляется только с родовыми субъектами: Динозавры исчезли в конце мелового периода, возможно, под воздействием похолодания, но не *Наши лошади исчезли из-за болезни. Выражение Наши лошади исчезли, будет означать только кражу или побег лошадей, но не их гибель. По признаку причины прекращения существования глаголы делятся на следующие группы: те, для которых причина обязательна (кончиться, иссякнуть); те, у которых причины чаще нет (пропасть, улетучиться, испариться) и остальные, для которых причина в разной степени возможна, но не обязательна. Глагол исчезнуть часто указывает на внешнее воздействие или целенаправленное усилие как фактор, приводящий к прекращению существования объекта, хотя можно и таинственно/загадочно исчезнуть. Глагол пропасть часто указывает на беспричинное, с точки зрения говорящего, прекращение существования и на нарушение его ожиданий. Контролируемое целенаправленное усилие в качестве причины пропасть невозможно: *От многочисленных фонетических упражнений его акцент наконец пропал. Другими важными параметрами оказываются скорость и степень прекращения существование и наличие наблюдателя.

Вопросам мультимодальной лингвистики, которая учитывает взаимодействие всех способов передачи информации (речь, интонация, жесты, мимика, направление взгляда), был посвящен доклад Ольги Федоровой, Андрея Кибрика, Николая Коротаева, Аллы Литвиненко и Юлии Николаевой. Они изучили координацию между элементарными единицами речи и сопровождающими их спонтанными жестами рук. Ранее ряд авторов утверждал, что время начала жеста обычно опережает время начала речи. После исследования авторы установили, что в исследованном материале жесты опережают речь менее чем в половине случаев. По предположению ученых, временные характеристики жестов зависят от их классификации, в зависимости от речевого жанра и индивидуальных особенностей говорящих.

.

Аналог Ноткоин - TapSwap Получай Бесплатные Монеты

Подробнее читайте на

lsquo глаголов существования rsquo пропасть языка текста автоматического