Приложение для вербального анализа медийных текстов
Авторы: Лобкина А. Т., Мымрин П. А., Громик Н. А., Лебедев Валентин Павлович (научный руководитель)
.Рубрика: Технические науки
Страницы: 116-117
Объём: 0,1
Опубликовано в: «Наука без границ» № 6 (23), июнь 2018
Библиографическое описание: Лобкина А. Т., Мымрин П. А., Громик Н. А., Лебедев В. П. Приложение для вербального анализа медийных текстов // Наука без границ. 2018. № 6 (23). С. 116-117.
Аннотация: Авторами было написано десктопное приложение присвоения возрастного рейтинга медийным текстам (в основном, сценарии мультфильмов).
В Иркутском государственном университете профессиональными психологами был разработан «метод золотого сечения», который можно использовать для анализа влияния медийных текстов – сценариев фильмов и мультфильмов – на зрителей. Основная идея этого метода заключается в том, что креативность человека проявляется во всех структурных компонентах текста, но, благодаря особенностям подсознания человека, степень этой проявленности в разных позициях текста разная и наивысшая концентрация располагается в определенных зонах. Одну из таких зон называют «гармоническим центром» и найти его можно с помощью закона золотого сечения.
Основная практическая значимость метода заключается в том, что его можно использовать как один из этапов присвоения возрастного рейтинга.
Для диагностики профессионалам необходимо обработать текст, и эта обработка состоит из следующих этапов:
1. Очистка текста от предлогов, союзов, частиц и других «служебных слов».
2. Подсчет количества уникальных слов (неповторяющихся, с учетом склонения по падежам и других изменений) – это «объем словника».
3. Определение коэффициента «лексического богатства» - по формуле:
, (1)
где: V – количество уникальных слов, N – количество словоупотреблений всего, без учета служебных слов.
4. Поиск «гармонических центров» - это два предложения, первое содержит слово, позиция которого вычисляется по формуле:
(2)
считая от начала; второе содержит слово, которое вычисляется по такой же формуле, считая от конца текста.
Целью данной работы была автоматизация процесса обработки текста и определения данных параметров. Было разработано программное приложение с удобным интерфейсом, на вход которому подается вербальный текст (в форматах *.docx или *.txt), а на выходе выдаются искомые параметры. Есть возможность настройки списка «служебных слов» (в частности добавление и удаление), история проанализированных файлов, а также возможность предпросмотра выбранного документа.
Сейчас приложение полностью готово и реализовано на Python с помощью PyQt5 и библиотеки Hunspell. Дальнейшее развитие мы связываем с обработкой речи в видео- и аудиозаписях, поскольку анализируемые тексты – это в основном сценарии видеоматериалов.
Несмотря на то, что в настоящее время разработано достаточно много приложений для обработки и распознавания речи, с учетом специфики нашей задачи важна не только функция распознавания, но и целый комплекс сопутствующих признаков: паузы, ударение, динамика громкости, разделение диалогов по ролям и так далее, что приводит к необходимости серьезной адаптации и доработке существующих приложений и библиотек.
Список литературы
- Кыштымова И. М. Психосемиотическая методика диагностики вербальной креативности // Психологический журнал. 2008. Том 29. № 6. С. 56–65.
Материал поступил в редакцию 10.06.2018
© Лобкина А. Т., Мымрин П. А., Громик Н. А., Лебедев В. П., 2018