Приложение для вербального анализа медийных текстов

Наука без границ - Приложение для вербального анализа медийных текстов

Авторы: Лобкина А. Т., Мымрин П. А., Громик Н. А., Лебедев Валентин Павлович (научный руководитель)

.

Рубрика: Технические науки

Страницы: 116-117

Объём: 0,1

Опубликовано в: «Наука без границ» № 6 (23), июнь 2018

Скачать электронную версию журнала

Библиографическое описание: Лобкина А. Т., Мымрин П. А., Громик Н. А., Лебедев В. П. Приложение для вербального анализа медийных текстов // Наука без границ. 2018. № 6 (23). С. 116-117.

Аннотация: Авторами было написано десктопное приложение присвоения возрастного рейтинга медийным текстам (в основном, сценарии мультфильмов). 

В Иркутском государственном университете профессиональными психологами был разработан «метод золотого сечения», который можно использовать для анализа влияния медийных текстов – сценариев фильмов и мультфильмов – на зрителей. Основная идея этого метода заключается в том, что креативность человека проявляется во всех структурных компонентах текста, но, благодаря особенностям подсознания человека, степень этой проявленности в разных позициях текста разная и наивысшая концентрация располагается в определенных зонах. Одну из таких зон называют «гармоническим центром» и найти его можно с помощью закона золотого сечения.

Основная практическая значимость метода заключается в том, что его можно использовать как один из этапов присвоения возрастного рейтинга.

Для диагностики профессионалам необходимо обработать текст, и эта обработка состоит из следующих этапов:

1. Очистка текста от предлогов, союзов, частиц и других «служебных слов».

2. Подсчет количества уникальных слов (неповторяющихся, с учетом склонения по падежам и других изменений) – это «объем словника».

3. Определение коэффициента «лексического богатства» - по формуле:

Коэффициент лексического богатства,          (1)

где: V – количество уникальных слов, N – количество словоупотреблений всего, без учета служебных слов.

4. Поиск «гармонических центров» - это два предложения, первое содержит слово, позиция которого вычисляется по формуле:

Поиск гармонических центров          (2)

считая от начала; второе содержит слово, которое вычисляется по такой же формуле, считая от конца текста.

Целью данной работы была автоматизация процесса обработки текста и определения данных параметров. Было разработано программное приложение с удобным интерфейсом, на вход которому подается вербальный текст (в форматах *.docx или *.txt), а на выходе выдаются искомые параметры. Есть возможность настройки списка «служебных слов» (в частности добавление и удаление), история проанализированных файлов, а также возможность предпросмотра выбранного документа.

Сейчас приложение полностью готово и реализовано на Python с помощью PyQt5 и библиотеки Hunspell. Дальнейшее развитие мы связываем с обработкой речи в видео- и аудиозаписях, поскольку анализируемые тексты – это в основном сценарии видеоматериалов.

Несмотря на то, что в настоящее время разработано достаточно много приложений для обработки и распознавания речи, с учетом специфики нашей задачи важна не только функция распознавания, но и целый комплекс сопутствующих признаков: паузы, ударение, динамика громкости, разделение диалогов по ролям и так далее, что приводит к необходимости серьезной адаптации и доработке существующих приложений и библиотек.

Список литературы

  1. Кыштымова И. М. Психосемиотическая методика диагностики вербальной креативности // Психологический журнал. 2008. Том 29. № 6. С. 56–65.

 

Материал поступил в редакцию 10.06.2018
© Лобкина А. Т., Мымрин П. А., Громик Н. А., Лебедев В. П., 2018