Семинар "Цифровые методы исследования речевых практик"
В понедельник, 21 июня, состоялся семинар проекта «Речевые практики» с представителями iFora И.В. Соченковым и И.Ф. Кузьминовым, во ходе которого руководители подпроектов обсудили техническое задание проекта и способы его реализации.
Для кейсов, входными данными которых являются интервью, было решено разработать минимальный набор тэгов-маркеров разговорной речи. В частности, для этого было предложено рассмотреть депозитарии открытого кода Bitbucket и GitHub. Подобный набор тэгов поможет на этапе аннотации входных данных, поскольку устный модус коммуникации, характерный для интервью, накладывает свои ограничения. С одной стороны, для конкретных исследований многие особенности устной речи. С другой стороны, инструменты iFora нацелены на письменный модус и другие типы дискурсивных жанров. Помимо свойств разговорной речи релевантной может оказаться и разметка по социолингвистическим (социодемографическим) параметрам.
Для проекта Екатерины Деминцевой и Влады Барановой Топография "мигрантской" Москвы было принято решение о таргетируемых социальных сетях, среди которых будет производиться маркированный поиск с помощью парсинга iFora. Одной такой сетью является Telegram. В случае с другими соцсетями (Facebook* и ВКонтакте) будет необходима выгрузка массива публикаций.
В качестве входных данных проекта Лингвокультурная модель "Эпидемия" (под руководством Станислава Белецкого) послужат аннотированные интервью в формате Excel-таблиц. Неотъемлемым компонентом размеченных интервью станут метаданные. Эту модель взаимодействия с iFora будет отработана на примере уже созданной под руководством М.Б. Бергельсон и Михаила Грабарника базы данных Нарративов о лингвистической адаптации, где уже существует система из трех видов тегов: дискурсивных, нарративных (отражающих макростурктуру нарратива) и тематических.
В ходе проведения семинара были также представлены структуры разрабатываемых баз данных "Динамические процессы в русском речевом этикете" (под руководством Александра Пиперски) и «Экспертная оценка современных речевых практик: стандарт и субстандарт» (под руководством Валерия Шульгинова). Специалисты компании iFora провели экспертную оценку проектов и выдвинули ряд предложений по оптимизации сбора и обработки текстовых данных, а также рассказали о существующих на данный момент технических решениях для последующей разметки материала. Кроме того, на встрече обсуждалась возможность создания инструментов автоматического определения речевых конфликтов в социальных сетях на основе создаваемых исследователями ресурсов.
* Facebook - запрещённая в России соцсеть.
Лаборатория комплексных междисциплинарных проектов: Менеджер
Все новости автора
Баранова Влада Вячеславовна
Департамент социологии: Доцент
Белецкий Станислав Борисович
Школа филологических наук: Приглашенный преподаватель
Бергельсон Мира Борисовна
Школа филологических наук: Профессор
Деминцева Екатерина Борисовна
Школа философии и культурологии: Доцент
Копотев Михаил Вячеславович
Департамент филологии: Профессор
Кузьминов Илья Филиппович
Центр стратегической аналитики и больших данных: Директор центра
Соченков Илья Владимирович
Шульгинов Валерий Александрович
Научно-учебная лаборатория лингвистической конфликтологии и современных коммуникативных практик: Ведущий научный сотрудник