Компьютерная лингвистика на сегодняшний день является одной из самых быстро развивающихся прикладных наук. Своим появлением ей обязаны электронные словари, машинные переводчики, решения, связанные с информационным поиском, извлечением знаний, распознаванием речи и другие. На «Диалоге» новейшие методы компьютерной лингвистики обсуждаются применительно именно к русскому языку, поэтому конференция позволяет оценить текущее состояние российской компьютерной лингвистики и определить векторы развития.
Основная тема «Диалога» этого года – «Вычислительные модели семантики». Семантика – это путь к компьютерному пониманию смысла текстов, поэтому не удивительно, что с каждым годом интерес разработчиков систем компьютерного анализа языка к использованию семантических моделей растет. Но сами применяемые модели существенно различаются: наряду с традиционными лингвистическими и формально-логическими подходами бурно развиваются дистрибуционные, операциональные, онтологически ориентированные методы.
Все эти вопросы участники смогут обсудить с крупнейшими зарубежными специалистами. В качестве приглашенных докладчиков на конференции выступят:
- Герних Шютце (Hinrich Schütze) из Мюнхенского университета (Германия), крупнейший специалист с области статистических методов анализа языка, автор своего рода «Библии» по этому предмету, по которой учились и учатся все современные компьютерные лингвисты.
- Марко Барони (Marco Baroni) из университета Тренто (Италия), один из основателей т.н. дистрибуционной семантики, в которой значения слов определяются автоматически на основании анализа их употребления в огромных корпусах текстов.
- Марджори MакШейн (Marjorie McShane) из Политехнический института Ренсселера (США), специалист в области онтологической семантики, основанной на идее включения в семантические описания знаний о мире.
В 2014 году организаторы «Диалога» планируют впервые провести практическую сессию под названием «День технологий». Компании и институты получат возможность продемонстрировать, как результаты их собственных научных исследований воплощаются в практические решения для бизнеса и управления. Планируется проведение Круглого стола на тему прикладного потенциала компьютерной лингвистики.
Ежегодно в рамках «Диалога» проходят мероприятия по сравнительной оценке различных систем лингвистического анализа текстов. Такие технологические соревнования дают возможность разработчикам объективно оценить свой уровень в сравнении с результатами коллег. В прошлые годы прошли тестирования систем автоматической оценки мнений (анализ тональности), синтаксического анализа, машинного перевода с русского языка. В этом году будут подведены итоги соревнования по автоматическому разрешению кореферентных связей. За этим названием скрывается важнейшая проблема связывания в тексте местоимений с теми объектами, на которые они ссылаются, что очень важно, например, для информационного поиска и машинного перевода.
Диалог традиционно использует очень строгие критерии отбора работ на конференцию. В отборе Редсовету каждый год помогают около 60 профессиональных российских и зарубежных экспертов. Благодаря строгой, но прозрачной системе рецензирования сборник «Диалога» с 2014 года входит в SCOPUS – крупнейшую в мире аналитическую базу данных, которая индексирует научные журналы, материалы конференций и серийные книжные издания. SCOPUS является наиболее авторитетным ресурсом в мире для поиска научной литературы.
Редактор раздела: Алена Журавлева (info@mskit.ru)