Применение FOSS-инструментов для анализа исходных текстов программ::Журнал СА 03.2019
www.samag.ru
     
Поиск   
              
 www.samag.ru    Web  0 товаров , сумма 0 руб.
E-mail
Пароль  
 Запомнить меня
Регистрация | Забыли пароль?
О журнале
Журнал «БИТ»
Информация для ВАК
Звезды «СА»
Подписка
Где купить
Авторам
Рекламодателям
Магазин
Архив номеров
Вакансии
Игры
Контакты
   

  Опросы

Какие курсы вы бы выбрали для себя?  

Очные
Онлайновые
Платные
Бесплатные
Я и так все знаю

 Читать далее...

1001 и 1 книга  
27.03.2019г.
Просмотров: 540
Комментарии: 0
Arduino Uno и Raspberry Pi 3: от схемотехники к интернету вещей

 Читать далее...

27.03.2019г.
Просмотров: 450
Комментарии: 0
Автоматизация программируемых сетей

 Читать далее...

27.03.2019г.
Просмотров: 473
Комментарии: 0
Изучаем pandas. Второе издание

 Читать далее...

27.03.2019г.
Просмотров: 404
Комментарии: 0
Компьютерное зрение. Теория и алгоритмы

 Читать далее...

13.03.2019г.
Просмотров: 607
Комментарии: 0
DevOps для ИТ-менеджеров

 Читать далее...

Друзья сайта  

Форум системных администраторов  

sysadmins.ru

 Применение FOSS-инструментов для анализа исходных текстов программ

Архив номеров / 2019 / Выпуск №03 (196) / Применение FOSS-инструментов для анализа исходных текстов программ

Рубрика: Событие /  СПО в образовании

Алексей Пустыгин АЛЕКСЕЙ ПУСТЫГИН, к.т.н., доцент, ЧелГУ

Кирилл Кузьминых КИРИЛЛ КУЗЬМИНЫХ, студент-дипломник, ЧелГУ

Евгения Пустыгина ЕВГЕНИЯ ПУСТЫГИНА, студент-дипломник, ЧелГУ

Применение FOSS-инструментов
для анализа исходных текстов программ

Применение FOSS-инструментов для анализа исходных текстов программИспользование внутреннего представления исходного текста открывает путь для систематического изучения и преобразования исходного кода программ. Рассмотрены FOSS-утилиты, использующие внутреннее представление исходного кода

С целью актуализации выполняемых разработок были предприняты усилия для обзора открытых инструментов, пригодных в качестве базы сравнения с разрабатываемыми прототипами.

Были рассмотрены существующие открытые инструменты для анализа, использующие построение синтаксического дерева разбора (AST):

  • PyCharm – IDE с открытой версией (подписная free licence) [1].
  • Vulture – анализатор кода в программах Python [2], использует модуль ast стандартной библиотеки и создает абстрактные синтаксические деревья для всех файлов исходного кода в проекте.
  • ObjectWeb ASM (частью входит в Java Development Kit 6) [3] – API для представления кода JAVA в виде дерева.
  • Joern – анализатор исходного кода [4], способный построить:
    • абстрактное синтаксическое дерево,
    • граф управления,
    • граф вызовов,
    • граф структуры каталога исходного кода,
    • граф программных зависимостей для исходного текста на языке С++.

Инструмент Joern работает в связке с системой управления графовой NoSQL базой данных Neo4j [5] – графовая система управления базами данных c открытым исходным кодом, реализованная на Java. Считается самой распространенной графовой СУБД, формат данных собственный, специализированный.

Joern имеет собственный язык запросов Cypher, но запросы можно делать и другими способами, например, напрямую через Java API и на языке Gremlin, созданном в проекте с открытым исходным кодом TinkerPop.

Исследование прототипа сравнения показало ограничение его функциональности по глубине построения синтаксического дерева разбора

С целью ознакомления с возможностями базовых инструментов был выполнен проект по применению Joern как наиболее функционального для решения типовых анализа потока управления.

Для обработки информации, полученной с помощью инструмента Joern, применялась написанная программа постобработки на Python.

В функционал постобработки входят:

  • построение трассы исполнения программы по исходному тексту;
  • получение списка всех информационных объектов программы по исходному тексту;
  • проверка наличия заданных конструкций в исходном тексте программы;
  • формирование полного перечня маршрутов исполнения функциональных объектов по исходному тексту программы;
  • контроль связей функциональных объектов в исходном тексте программы по информации;
  • контроль связей функциональных объектов в исходном тексте программы по управлению.

Параметры запуска и результаты тестирования программы постобработки доступны всем желающим в открытом источнике [6].

Под функциональными объектами понимаются:

  • объекты классов,
  • локальные и глобальные переменные проекта, непосредственно участвующие в алгоритме.

Под маршрутом исполнения функционального объекта понимается его «линия жизни» от момента создания до указанного места в исходном коде.

Результатом исполнения скрипта постобработки будет перечень всех маршрутов исполнения, в которых, так или иначе, встречается использование указанного функционального объекта, либо сообщение о том, что такие маршруты отсутствуют.

Программа постобработки может контролировать связи функциональных объектов проекта по управлению и по информации.

Для этих задач необходимо выбрать два функциональных объекта:

  • исследуемый,
  • второстепенный.

Под связью функциональных объектов по управлению понимается любое воздействие исследуемого объекта на второстепенный, в том числе:

  • модификация (чтение, запись) данных второстепенного объекта,
  • вызов методов второстепенного объекта,
  • любое другое воздействие на данные второстепенного объекта.

Под связью функциональных объектов по информации подразумевается любое взаимодействие второстепенного объекта на данные исследуемого объекта.

Поиск и анализ такого рода связей между объектами является неотъемлемой частью анализа текста любого программного продукта. Он дает возможность убедиться в отсутствии недокументированных возможностей программы, отсутствии избыточности исходного кода.

Приведем пример использования пакета из Joern и инструмента постобработки. Анализируемый текст (Python):

ifstream file("graphFile");

unsigned int n = 0;
unsigned int oriented;
file >> n >> oriented;

G.resize(n);

while (!file.eof()) {
int a, b;
file >> a;
file >> b;

G[a].push_back(b);
if(oriented == 0) {
G[b].push_back(a);
}
}

file.close();

Рисунок 1. Граф трасс исполнения анализируемого текста

Рисунок 1. Граф трасс исполнения анализируемого текста

Исследование прототипа сравнения показало ограничение его функциональности по глубине построения синтаксического дерева разбора, а также недостаточный уровень документирования инструмента Joern.

  1. The Python IDE for Professional Developers – http://www.jetbrains.com/pycharm/index.html (просмотрено 09.01.2019).
  2. Vulture – pythondead-code-removal – http://github.com/jendrikseipp/vulture (просмотрено 09.01.2019).
  3. ASM – bytecode manipulation and analysis framework – http://asm.ow2.org/ (просмотрено 09.01.2019).
  4. A robust parser for C/C++ storing abstract syntax trees – http://github.com/octopus-platform/joern (просмотрено 09.01.2019).
  5. Graph Databases for Connected Data – http://neo4j.com (просмотрено 09.01.2019).
  6. https://github.com/Oskal174/staticProgramAnalysis/.

Ключевые слова: FOSS-инструменты, Joern, Python, анализ, исходный код.


Комментарии отсутствуют

Добавить комментарий

Комментарии могут оставлять только зарегистрированные пользователи

               Copyright © Системный администратор

Яндекс.Метрика
Tel.: (499) 277-12-41
Fax: (499) 277-12-45
E-mail: sa@samag.ru