Большие проекты

Междисциплинарные научные исследования

Семинар "Цифровые методы исследования речевых практик"

21 июня состоялся семинар Большого проекта "Речевые практики" по применению цифровых методов исследования современных профессиональных и лингвокультурных речевых практик.

В понедельник, 21 июня, состоялся семинар проекта «Речевые практики» с представителями iFora И.В. Соченковым и И.Ф. Кузьминовым, во ходе которого руководители подпроектов обсудили техническое задание проекта и способы его реализации.

Для кейсов, входными данными которых являются интервью, было решено разработать минимальный набор тэгов-маркеров разговорной речи. В частности, для этого было предложено рассмотреть депозитарии открытого кода  Bitbucket и GitHub. Подобный набор тэгов поможет на этапе аннотации входных данных, поскольку устный модус коммуникации, характерный для интервью, накладывает свои ограничения. С одной стороны, для конкретных исследований многие особенности устной речи. С другой стороны, инструменты iFora нацелены на письменный модус и другие типы дискурсивных жанров. Помимо свойств разговорной речи релевантной может оказаться и разметка по социолингвистическим (социодемографическим) параметрам.

Для проекта Екатерины Деминцевой и Влады Барановой Топография "мигрантской" Москвы было принято решение о таргетируемых социальных сетях, среди которых будет производиться маркированный поиск с помощью парсинга iFora. Одной такой сетью является Telegram. В случае с другими соцсетями (Facebook* и ВКонтакте) будет необходима выгрузка массива публикаций.

В качестве входных данных проекта Лингвокультурная модель "Эпидемия" (под руководством Станислава Белецкого) послужат аннотированные интервью в формате Excel-таблиц. Неотъемлемым компонентом размеченных интервью станут метаданные.  Эту модель взаимодействия с iFora будет отработана на примере уже созданной  под руководством М.Б. Бергельсон  и Михаила Грабарника базы данных Нарративов о лингвистической адаптации, где уже существует система из трех видов тегов:  дискурсивных, нарративных (отражающих макростурктуру нарратива) и тематических.

В ходе проведения семинара были также представлены структуры разрабатываемых баз данных "Динамические процессы в русском речевом этикете" (под руководством Александра Пиперски) и «Экспертная оценка современных речевых практик: стандарт и субстандарт» (под руководством Валерия Шульгинова). Специалисты компании iFora провели экспертную оценку проектов и выдвинули ряд предложений по оптимизации сбора и обработки текстовых данных, а также рассказали о существующих на данный момент технических решениях для последующей разметки материала. Кроме того, на встрече обсуждалась возможность создания инструментов автоматического определения речевых конфликтов в социальных сетях на основе создаваемых исследователями ресурсов.


* Facebook - запрещённая в России соцсеть.