Автоматизированный анализ лексического состава художественных текстов с использованием стилометрии::Журнал СА
www.samag.ru
Журнал «БИТ. Бизнес&Информационные технологии»      
Поиск   
              
 www.samag.ru    Web  0 товаров , сумма 0 руб.
E-mail
Пароль  
 Запомнить меня
Регистрация | Забыли пароль?
Журнал "Системный администратор"
Журнал «БИТ»
Подписка
Архив номеров
Где купить
Наука и технологии
Авторам
Рекламодателям
Контакты
   

  Опросы
1001 и 1 книга  
19.03.2018г.
Просмотров: 6777
Комментарии: 0
Машинное обучение с использованием библиотеки Н2О

 Читать далее...

12.03.2018г.
Просмотров: 7332
Комментарии: 0
Особенности киберпреступлений в России: инструменты нападения и защита информации

 Читать далее...

12.03.2018г.
Просмотров: 4574
Комментарии: 0
Глубокое обучение с точки зрения практика

 Читать далее...

12.03.2018г.
Просмотров: 3150
Комментарии: 0
Изучаем pandas

 Читать далее...

12.03.2018г.
Просмотров: 3950
Комментарии: 0
Программирование на языке Rust (Цветное издание)

 Читать далее...

19.12.2017г.
Просмотров: 3955
Комментарии: 0
Глубокое обучение

 Читать далее...

19.12.2017г.
Просмотров: 6453
Комментарии: 0
Анализ социальных медиа на Python

 Читать далее...

19.12.2017г.
Просмотров: 3302
Комментарии: 0
Основы блокчейна

 Читать далее...

19.12.2017г.
Просмотров: 3581
Комментарии: 0
Java 9. Полный обзор нововведений

 Читать далее...

16.02.2017г.
Просмотров: 7440
Комментарии: 0
Опоздавших не бывает, или книга о стеке

 Читать далее...

17.05.2016г.
Просмотров: 10796
Комментарии: 0
Теория вычислений для программистов

 Читать далее...

30.03.2015г.
Просмотров: 12512
Комментарии: 0
От математики к обобщенному программированию

 Читать далее...

18.02.2014г.
Просмотров: 14217
Комментарии: 0
Рецензия на книгу «Читаем Тьюринга»

 Читать далее...

13.02.2014г.
Просмотров: 9256
Комментарии: 0
Читайте, размышляйте, действуйте

 Читать далее...

12.02.2014г.
Просмотров: 7202
Комментарии: 0
Рисуем наши мысли

 Читать далее...

10.02.2014г.
Просмотров: 5504
Комментарии: 3
Страна в цифрах

 Читать далее...

18.12.2013г.
Просмотров: 4733
Комментарии: 0
Большие данные меняют нашу жизнь

 Читать далее...

18.12.2013г.
Просмотров: 3557
Комментарии: 0
Компьютерные технологии – корень зла для точки роста

 Читать далее...

04.12.2013г.
Просмотров: 3265
Комментарии: 0
Паутина в облаках

 Читать далее...

03.12.2013г.
Просмотров: 3495
Комментарии: 0
Рецензия на книгу «MongoDB в действии»

 Читать далее...

02.12.2013г.
Просмотров: 3152
Комментарии: 0
Не думай о минутах свысока

 Читать далее...

Друзья сайта  

 Автоматизированный анализ лексического состава художественных текстов с использованием стилометрии

Архив номеров / 2022 / Выпуск №9 (238) / Автоматизированный анализ лексического состава художественных текстов с использованием стилометрии

Рубрика: Наука и технологии /  Раздел для научных публикаций

Ильичев В.Ю.,
к.т.н., Калужский филиал ФГОУ ВО «Московский государственный технический университет имени Н.Э. Баумана (национальный исследовательский университет)», patrol8@yandex.ru

 

Автоматизированный анализ
лексического состава художественных текстов с использованием стилометрии

Описаны методы автоматизированного анализа стиля текстов разных авторов, подробно рассмотрен алгоритм статистического анализа с использованием модуля NLTK для Python.

 

Введение

Стилометрией (от слов «стиль» и «измерять») называется описание стиля текста с помощью числовых величин (например, путём измерения частоты употребления тех или иных слов) [1]. Этот метод используется в филологии (в таком её разделе как текстология), криминалистике и в других областях фундаментальных и прикладных исследований для решения следующих задач:

  • определение истинного автора того или иного текста, – в частности, с помощью стилометрии удаётся обнаружить заимствования или приписывание произведений, написанных разными авторами, какому-либо одному автору;
  • осуществление возможности чёткого логико-математического доказательства авторства текста;
  • вычисление лексического разнообразия текстов [2], оценка широты словарного запаса [3] авторов произведений;
  • получение наглядной картины частоты употребления разных слов и речевых оборотов, что позволяет авторам улучшать тексты путём замены слишком часто встречающихся словесных конструкций синонимами.

 

<...>

Ключевые слова: стилометрия, статистический анализ, стиль текста, модуль NLTK, визуа-лизация результатов, язык Python


Полную версию статьи читайте в журнале
Подпишитесь на журнал
Купите в Интернет-магазине

Комментарии отсутствуют

Добавить комментарий

Комментарии могут оставлять только зарегистрированные пользователи

               Copyright © Системный администратор

Яндекс.Метрика
Tel.: (499) 277-12-45
E-mail: sa@samag.ru