Рубрика:
Наука и технологии /
Раздел для научных публикаций
|
Facebook
Мой мир
Вконтакте
Одноклассники
Google+
|
Ильичев В.Ю., к.т.н., Калужский филиал ФГОУ ВО «Московский государственный технический университет имени Н.Э. Баумана (национальный исследовательский университет)», patrol8@yandex.ru
Формирование облаков слов с помощью языка Python для визуализации основных понятий текста
Рассматриваются современные технологии лингвистической обработки текстов и создания на их основе визуальных объектов для образовательных и интернет-проектов
Введение
С каждым днем возрастает объем доступной людям информации (при этом часто навязываемой и ложной). В данном необъятном потоке неподготовленному пользователю информационных ресурсов легко захлебнуться, пойти по ложному для него пути, а то и вовсе «не отыскать иголку в стоге сена». Для помощи в решении задачи поиска именно верных и значимых смысловых элементов созданы современные технологии лингвистической обработки и анализа текстовой информации, а также ее визуализации.
Более ранним, традиционным, способом формирования у читателя статьи или веб-сайта начального, наиболее общего, представления о смысле текста, являлось и до сих пор является использование ключевых слов. В интернет-технологиях такие ключевые слова (часто представляющие собой гиперссылки) именуются тегами – они помогают пользователям и поисковым системам осуществлять быстрый поиск необходимой информации. В последнее время очень популярным стало использование наряду с ключевыми словами так называемого «облака слов» (по-английски «word cloud»), представляющего собой тот же набор ключевых слов или фраз, оформленных в виде графического объекта [1]. Наиболее важные или часто употребляемые в тексте слова при этом выделяются более крупным и ярким шрифтом.
<...>
Полную версию статьи читайте в журнале Подпишитесь на журнал Купите в Интернет-магазине
Facebook
Мой мир
Вконтакте
Одноклассники
Google+
|