Автоматизированный анализ лексического состава художественных текстов с использованием стилометрии::Журнал СА
www.samag.ru
     
Поиск   
              
 www.samag.ru    Web  0 товаров , сумма 0 руб.
E-mail
Пароль  
 Запомнить меня
Регистрация | Забыли пароль?
Журнал "Системный администратор"
Журнал «БИТ»
Наука и технологии
Подписка
Где купить
Авторам
Рекламодателям
Магазин
Архив номеров
Контакты
   

  Опросы
1001 и 1 книга  
19.03.2018г.
Просмотров: 8662
Комментарии: 0
Потоковая обработка данных

 Читать далее...

19.03.2018г.
Просмотров: 6926
Комментарии: 0
Релевантный поиск с использованием Elasticsearch и Solr

 Читать далее...

19.03.2018г.
Просмотров: 7055
Комментарии: 0
Конкурентное программирование на SCALA

 Читать далее...

19.03.2018г.
Просмотров: 4582
Комментарии: 0
Машинное обучение с использованием библиотеки Н2О

 Читать далее...

12.03.2018г.
Просмотров: 5261
Комментарии: 0
Особенности киберпреступлений в России: инструменты нападения и защита информации

 Читать далее...

Друзья сайта  

 Автоматизированный анализ лексического состава художественных текстов с использованием стилометрии

Архив номеров / 2022 / Выпуск №9 (238) / Автоматизированный анализ лексического состава художественных текстов с использованием стилометрии

Рубрика: Наука и технологии /  Раздел для научных публикаций

Ильичев В.Ю.,
к.т.н., Калужский филиал ФГОУ ВО «Московский государственный технический университет имени Н.Э. Баумана (национальный исследовательский университет)», patrol8@yandex.ru

 

Автоматизированный анализ
лексического состава художественных текстов с использованием стилометрии

Описаны методы автоматизированного анализа стиля текстов разных авторов, подробно рассмотрен алгоритм статистического анализа с использованием модуля NLTK для Python.

 

Введение

Стилометрией (от слов «стиль» и «измерять») называется описание стиля текста с помощью числовых величин (например, путём измерения частоты употребления тех или иных слов) [1]. Этот метод используется в филологии (в таком её разделе как текстология), криминалистике и в других областях фундаментальных и прикладных исследований для решения следующих задач:

  • определение истинного автора того или иного текста, – в частности, с помощью стилометрии удаётся обнаружить заимствования или приписывание произведений, написанных разными авторами, какому-либо одному автору;
  • осуществление возможности чёткого логико-математического доказательства авторства текста;
  • вычисление лексического разнообразия текстов [2], оценка широты словарного запаса [3] авторов произведений;
  • получение наглядной картины частоты употребления разных слов и речевых оборотов, что позволяет авторам улучшать тексты путём замены слишком часто встречающихся словесных конструкций синонимами.

 

<...>

Ключевые слова: стилометрия, статистический анализ, стиль текста, модуль NLTK, визуа-лизация результатов, язык Python


Полную версию статьи читайте в журнале
Подпишитесь на журнал
Купите в Интернет-магазине

Комментарии отсутствуют

Добавить комментарий

Комментарии могут оставлять только зарегистрированные пользователи

               Copyright © Системный администратор

Яндекс.Метрика
Tel.: (499) 277-12-41
Fax: (499) 277-12-45
E-mail: sa@samag.ru