Применение FOSS-инструментов для анализа исходных текстов программ::Журнал СА 03.2019
www.samag.ru
     
Поиск   
              
 www.samag.ru    Web  0 товаров , сумма 0 руб.
E-mail
Пароль  
 Запомнить меня
Регистрация | Забыли пароль?
Журнал "Системный администратор"
Журнал «БИТ»
Наука и технологии
Подписка
Где купить
Авторам
Рекламодателям
Архив номеров
Контакты
   

  Опросы
  Статьи

Электронный документооборот  

5 способов повысить безопасность электронной подписи

Область применения технологий электронной подписи с каждым годом расширяется. Все больше задач

 Читать далее...

Рынок труда  

Системные администраторы по-прежнему востребованы и незаменимы

Системные администраторы, практически, есть везде. Порой их не видно и не слышно,

 Читать далее...

Учебные центры  

Карьерные мечты нужно воплощать! А мы поможем

Школа Bell Integrator открывает свои двери для всех, кто хочет освоить перспективную

 Читать далее...

Гость номера  

Дмитрий Галов: «Нельзя сказать, что люди становятся доверчивее, скорее эволюционирует ландшафт киберугроз»

Использование мобильных устройств растет. А вместе с ними быстро растет количество мобильных

 Читать далее...

Прошу слова  

Твердая рука в бархатной перчатке: принципы soft skills

Лауреат Нобелевской премии, специалист по рынку труда, профессор Лондонской школы экономики Кристофер

 Читать далее...

1001 и 1 книга  
19.03.2018г.
Просмотров: 9931
Комментарии: 0
Потоковая обработка данных

 Читать далее...

19.03.2018г.
Просмотров: 8141
Комментарии: 0
Релевантный поиск с использованием Elasticsearch и Solr

 Читать далее...

19.03.2018г.
Просмотров: 8247
Комментарии: 0
Конкурентное программирование на SCALA

 Читать далее...

19.03.2018г.
Просмотров: 5222
Комментарии: 0
Машинное обучение с использованием библиотеки Н2О

 Читать далее...

12.03.2018г.
Просмотров: 5906
Комментарии: 0
Особенности киберпреступлений в России: инструменты нападения и защита информации

 Читать далее...

Друзья сайта  

 Применение FOSS-инструментов для анализа исходных текстов программ

Архив номеров / 2019 / Выпуск №03 (196) / Применение FOSS-инструментов для анализа исходных текстов программ

Рубрика: Событие /  СПО в образовании

Алексей Пустыгин АЛЕКСЕЙ ПУСТЫГИН, к.т.н., доцент, ЧелГУ

Кирилл Кузьминых КИРИЛЛ КУЗЬМИНЫХ, студент-дипломник, ЧелГУ

Евгения Пустыгина ЕВГЕНИЯ ПУСТЫГИНА, студент-дипломник, ЧелГУ

Применение FOSS-инструментов
для анализа исходных текстов программ

Применение FOSS-инструментов для анализа исходных текстов программИспользование внутреннего представления исходного текста открывает путь для систематического изучения и преобразования исходного кода программ. Рассмотрены FOSS-утилиты, использующие внутреннее представление исходного кода

С целью актуализации выполняемых разработок были предприняты усилия для обзора открытых инструментов, пригодных в качестве базы сравнения с разрабатываемыми прототипами.

Были рассмотрены существующие открытые инструменты для анализа, использующие построение синтаксического дерева разбора (AST):

  • PyCharm – IDE с открытой версией (подписная free licence) [1].
  • Vulture – анализатор кода в программах Python [2], использует модуль ast стандартной библиотеки и создает абстрактные синтаксические деревья для всех файлов исходного кода в проекте.
  • ObjectWeb ASM (частью входит в Java Development Kit 6) [3] – API для представления кода JAVA в виде дерева.
  • Joern – анализатор исходного кода [4], способный построить:
    • абстрактное синтаксическое дерево,
    • граф управления,
    • граф вызовов,
    • граф структуры каталога исходного кода,
    • граф программных зависимостей для исходного текста на языке С++.

Инструмент Joern работает в связке с системой управления графовой NoSQL базой данных Neo4j [5] – графовая система управления базами данных c открытым исходным кодом, реализованная на Java. Считается самой распространенной графовой СУБД, формат данных собственный, специализированный.

Joern имеет собственный язык запросов Cypher, но запросы можно делать и другими способами, например, напрямую через Java API и на языке Gremlin, созданном в проекте с открытым исходным кодом TinkerPop.

Исследование прототипа сравнения показало ограничение его функциональности по глубине построения синтаксического дерева разбора

С целью ознакомления с возможностями базовых инструментов был выполнен проект по применению Joern как наиболее функционального для решения типовых анализа потока управления.

Для обработки информации, полученной с помощью инструмента Joern, применялась написанная программа постобработки на Python.

В функционал постобработки входят:

  • построение трассы исполнения программы по исходному тексту;
  • получение списка всех информационных объектов программы по исходному тексту;
  • проверка наличия заданных конструкций в исходном тексте программы;
  • формирование полного перечня маршрутов исполнения функциональных объектов по исходному тексту программы;
  • контроль связей функциональных объектов в исходном тексте программы по информации;
  • контроль связей функциональных объектов в исходном тексте программы по управлению.

Параметры запуска и результаты тестирования программы постобработки доступны всем желающим в открытом источнике [6].

Под функциональными объектами понимаются:

  • объекты классов,
  • локальные и глобальные переменные проекта, непосредственно участвующие в алгоритме.

Под маршрутом исполнения функционального объекта понимается его «линия жизни» от момента создания до указанного места в исходном коде.

Результатом исполнения скрипта постобработки будет перечень всех маршрутов исполнения, в которых, так или иначе, встречается использование указанного функционального объекта, либо сообщение о том, что такие маршруты отсутствуют.

Программа постобработки может контролировать связи функциональных объектов проекта по управлению и по информации.

Для этих задач необходимо выбрать два функциональных объекта:

  • исследуемый,
  • второстепенный.

Под связью функциональных объектов по управлению понимается любое воздействие исследуемого объекта на второстепенный, в том числе:

  • модификация (чтение, запись) данных второстепенного объекта,
  • вызов методов второстепенного объекта,
  • любое другое воздействие на данные второстепенного объекта.

Под связью функциональных объектов по информации подразумевается любое взаимодействие второстепенного объекта на данные исследуемого объекта.

Поиск и анализ такого рода связей между объектами является неотъемлемой частью анализа текста любого программного продукта. Он дает возможность убедиться в отсутствии недокументированных возможностей программы, отсутствии избыточности исходного кода.

Приведем пример использования пакета из Joern и инструмента постобработки. Анализируемый текст (Python):

ifstream file("graphFile");

unsigned int n = 0;
unsigned int oriented;
file >> n >> oriented;

G.resize(n);

while (!file.eof()) {
int a, b;
file >> a;
file >> b;

G[a].push_back(b);
if(oriented == 0) {
G[b].push_back(a);
}
}

file.close();

Рисунок 1. Граф трасс исполнения анализируемого текста

Рисунок 1. Граф трасс исполнения анализируемого текста

Исследование прототипа сравнения показало ограничение его функциональности по глубине построения синтаксического дерева разбора, а также недостаточный уровень документирования инструмента Joern.

  1. The Python IDE for Professional Developers – http://www.jetbrains.com/pycharm/index.html (просмотрено 09.01.2019).
  2. Vulture – pythondead-code-removal – http://github.com/jendrikseipp/vulture (просмотрено 09.01.2019).
  3. ASM – bytecode manipulation and analysis framework – http://asm.ow2.org/ (просмотрено 09.01.2019).
  4. A robust parser for C/C++ storing abstract syntax trees – http://github.com/octopus-platform/joern (просмотрено 09.01.2019).
  5. Graph Databases for Connected Data – http://neo4j.com (просмотрено 09.01.2019).
  6. https://github.com/Oskal174/staticProgramAnalysis/.

Ключевые слова: FOSS-инструменты, Joern, Python, анализ, исходный код.


Комментарии отсутствуют

Добавить комментарий

Комментарии могут оставлять только зарегистрированные пользователи

               Copyright © Системный администратор

Яндекс.Метрика
Tel.: (499) 277-12-41
Fax: (499) 277-12-45
E-mail: sa@samag.ru