www.samag.ru
     
Поиск   
              
 www.samag.ru    Web  0 товаров , сумма 0 руб.
E-mail
Пароль  
 Запомнить меня
Регистрация | Забыли пароль?
Журнал "Системный администратор"
Журнал «БИТ»
Подписка
Архив номеров
Где купить
Авторам
Рекламодателям
Контакты
   

  Опросы
1001 и 1 книга  
19.03.2018г.
Просмотров: 10808
Комментарии: 0
Машинное обучение с использованием библиотеки Н2О

 Читать далее...

12.03.2018г.
Просмотров: 10922
Комментарии: 0
Особенности киберпреступлений в России: инструменты нападения и защита информации

 Читать далее...

12.03.2018г.
Просмотров: 8391
Комментарии: 0
Глубокое обучение с точки зрения практика

 Читать далее...

12.03.2018г.
Просмотров: 5128
Комментарии: 0
Изучаем pandas

 Читать далее...

12.03.2018г.
Просмотров: 5979
Комментарии: 0
Программирование на языке Rust (Цветное издание)

 Читать далее...

19.12.2017г.
Просмотров: 5900
Комментарии: 0
Глубокое обучение

 Читать далее...

19.12.2017г.
Просмотров: 8719
Комментарии: 0
Анализ социальных медиа на Python

 Читать далее...

19.12.2017г.
Просмотров: 5303
Комментарии: 0
Основы блокчейна

 Читать далее...

19.12.2017г.
Просмотров: 5549
Комментарии: 0
Java 9. Полный обзор нововведений

 Читать далее...

16.02.2017г.
Просмотров: 9714
Комментарии: 0
Опоздавших не бывает, или книга о стеке

 Читать далее...

17.05.2016г.
Просмотров: 13116
Комментарии: 0
Теория вычислений для программистов

 Читать далее...

30.03.2015г.
Просмотров: 14587
Комментарии: 0
От математики к обобщенному программированию

 Читать далее...

18.02.2014г.
Просмотров: 16325
Комментарии: 0
Рецензия на книгу «Читаем Тьюринга»

 Читать далее...

13.02.2014г.
Просмотров: 11216
Комментарии: 0
Читайте, размышляйте, действуйте

 Читать далее...

12.02.2014г.
Просмотров: 9177
Комментарии: 0
Рисуем наши мысли

 Читать далее...

10.02.2014г.
Просмотров: 7443
Комментарии: 4
Страна в цифрах

 Читать далее...

18.12.2013г.
Просмотров: 6547
Комментарии: 0
Большие данные меняют нашу жизнь

 Читать далее...

18.12.2013г.
Просмотров: 5461
Комментарии: 0
Компьютерные технологии – корень зла для точки роста

 Читать далее...

04.12.2013г.
Просмотров: 5077
Комментарии: 0
Паутина в облаках

 Читать далее...

03.12.2013г.
Просмотров: 5357
Комментарии: 1
Рецензия на книгу «MongoDB в действии»

 Читать далее...

Друзья сайта  

 Оптимизация моделей глубокого обучения на основе GPU

Архив номеров / 2020 / Выпуск №12 (217) / Оптимизация моделей глубокого обучения на основе GPU

Рубрика: Наука и технологии /  Раздел для научных публикаций

Петрин Д.А.,
магистр кафедры «Программное обеспечение ЭВМ, информационные технологии», Калужский филиал федерального государственного бюджетного образовательного учреждения высшего образования «Московский государственный технический университет имени Н.Э. Баумана (национальный исследовательский университет)», Калуга, dapetrin98@yandex.ru

Белов Ю.С.,
кандидат физико-математических наук, доцент кафедры «Программное обеспечение ЭВМ, информационные технологии», Калужский филиал федерального государственного бюджетного образовательного учреждения высшего образования «Московский государственный технический университет имени Н.Э. Баумана (национальный исследовательский университет)», Калуга, iu4-kf@mail.rux

Козина А.В.,
аспирант кафедры «Программное обеспечение ЭВМ, информационные технологии», Калужский филиал федерального государственного бюджетного образовательного учреждения высшего образования «Московский государственный технический университет имени Н.Э. Баумана (национальный исследовательский университет)», Калуга, anastasiya_kozin@list.ru

 

Оптимизация
моделей глубокого обучения на основе GPU

В данной статье рассматриваются оптимизации логического вывода обученных моделей на GPU, а также сравнительные характеристики производительности без и с использованием TensorRT

 

Введение

В наши дни ускорение моделей глубокого обучения похоже на погоню за движущейся целью [1]. По мере того как модели становятся все более универсальными и точными, их требования к вычислительным ресурсам и памяти стремительно растут [2, 3] и, вполне возможно, опередят улучшения в ресурсах и производительности графических процессоров. Так, например, 100 эпох обучения ResNet50 на наборе данных ImageNet на одном графическом процессоре NVIDIA Tesla M40 занимают 14 дней. Чтобы сократить время обучения, исследователи используют кластеры с сотнями подобных графических процессоров [4, 5]. Точно так же во время логического вывода (inference) серьезной проблемой является достижение целевых значений задержки (особенно для приложений, работающих в реальном времени) при высокой степени повторного использования, пропускной способности и точности.

<...>


Полную версию статьи читайте в журнале
Подпишитесь на журнал
Купите в Интернет-магазине

Комментарии отсутствуют

Добавить комментарий

Комментарии могут оставлять только зарегистрированные пользователи

               Copyright © Системный администратор

Яндекс.Метрика
Tel.: (499) 277-12-45
E-mail: sa@samag.ru