www.samag.ru
     
Поиск   
              
 www.samag.ru    Web  0 товаров , сумма 0 руб.
E-mail
Пароль  
 Запомнить меня
Регистрация | Забыли пароль?
Журнал "Системный администратор"
Журнал «БИТ»
Подписка
Архив номеров
Где купить
Авторам
Рекламодателям
Контакты
   

  Опросы
1001 и 1 книга  
19.03.2018г.
Просмотров: 11108
Комментарии: 0
Машинное обучение с использованием библиотеки Н2О

 Читать далее...

12.03.2018г.
Просмотров: 11229
Комментарии: 0
Особенности киберпреступлений в России: инструменты нападения и защита информации

 Читать далее...

12.03.2018г.
Просмотров: 8703
Комментарии: 0
Глубокое обучение с точки зрения практика

 Читать далее...

12.03.2018г.
Просмотров: 5274
Комментарии: 0
Изучаем pandas

 Читать далее...

12.03.2018г.
Просмотров: 6134
Комментарии: 0
Программирование на языке Rust (Цветное издание)

 Читать далее...

19.12.2017г.
Просмотров: 6019
Комментарии: 0
Глубокое обучение

 Читать далее...

19.12.2017г.
Просмотров: 8873
Комментарии: 0
Анализ социальных медиа на Python

 Читать далее...

19.12.2017г.
Просмотров: 5466
Комментарии: 0
Основы блокчейна

 Читать далее...

19.12.2017г.
Просмотров: 5673
Комментарии: 0
Java 9. Полный обзор нововведений

 Читать далее...

16.02.2017г.
Просмотров: 9854
Комментарии: 0
Опоздавших не бывает, или книга о стеке

 Читать далее...

17.05.2016г.
Просмотров: 13256
Комментарии: 0
Теория вычислений для программистов

 Читать далее...

30.03.2015г.
Просмотров: 14734
Комментарии: 0
От математики к обобщенному программированию

 Читать далее...

18.02.2014г.
Просмотров: 16472
Комментарии: 0
Рецензия на книгу «Читаем Тьюринга»

 Читать далее...

13.02.2014г.
Просмотров: 11337
Комментарии: 0
Читайте, размышляйте, действуйте

 Читать далее...

12.02.2014г.
Просмотров: 9321
Комментарии: 0
Рисуем наши мысли

 Читать далее...

10.02.2014г.
Просмотров: 7579
Комментарии: 4
Страна в цифрах

 Читать далее...

18.12.2013г.
Просмотров: 6705
Комментарии: 0
Большие данные меняют нашу жизнь

 Читать далее...

18.12.2013г.
Просмотров: 5585
Комментарии: 0
Компьютерные технологии – корень зла для точки роста

 Читать далее...

04.12.2013г.
Просмотров: 5195
Комментарии: 0
Паутина в облаках

 Читать далее...

03.12.2013г.
Просмотров: 5527
Комментарии: 1
Рецензия на книгу «MongoDB в действии»

 Читать далее...

Друзья сайта  

 Оптимизация моделей глубокого обучения на основе GPU

Архив номеров / 2020 / Выпуск №12 (217) / Оптимизация моделей глубокого обучения на основе GPU

Рубрика: Наука и технологии /  Раздел для научных публикаций

Петрин Д.А.,
магистр кафедры «Программное обеспечение ЭВМ, информационные технологии», Калужский филиал федерального государственного бюджетного образовательного учреждения высшего образования «Московский государственный технический университет имени Н.Э. Баумана (национальный исследовательский университет)», Калуга, dapetrin98@yandex.ru

Белов Ю.С.,
кандидат физико-математических наук, доцент кафедры «Программное обеспечение ЭВМ, информационные технологии», Калужский филиал федерального государственного бюджетного образовательного учреждения высшего образования «Московский государственный технический университет имени Н.Э. Баумана (национальный исследовательский университет)», Калуга, iu4-kf@mail.rux

Козина А.В.,
аспирант кафедры «Программное обеспечение ЭВМ, информационные технологии», Калужский филиал федерального государственного бюджетного образовательного учреждения высшего образования «Московский государственный технический университет имени Н.Э. Баумана (национальный исследовательский университет)», Калуга, anastasiya_kozin@list.ru

 

Оптимизация
моделей глубокого обучения на основе GPU

В данной статье рассматриваются оптимизации логического вывода обученных моделей на GPU, а также сравнительные характеристики производительности без и с использованием TensorRT

 

Введение

В наши дни ускорение моделей глубокого обучения похоже на погоню за движущейся целью [1]. По мере того как модели становятся все более универсальными и точными, их требования к вычислительным ресурсам и памяти стремительно растут [2, 3] и, вполне возможно, опередят улучшения в ресурсах и производительности графических процессоров. Так, например, 100 эпох обучения ResNet50 на наборе данных ImageNet на одном графическом процессоре NVIDIA Tesla M40 занимают 14 дней. Чтобы сократить время обучения, исследователи используют кластеры с сотнями подобных графических процессоров [4, 5]. Точно так же во время логического вывода (inference) серьезной проблемой является достижение целевых значений задержки (особенно для приложений, работающих в реальном времени) при высокой степени повторного использования, пропускной способности и точности.

<...>


Полную версию статьи читайте в журнале
Подпишитесь на журнал
Купите в Интернет-магазине

Комментарии отсутствуют

Добавить комментарий

Комментарии могут оставлять только зарегистрированные пользователи

               Copyright © Системный администратор

Яндекс.Метрика
Tel.: (499) 277-12-45
E-mail: sa@samag.ru