www.samag.ru
     
Поиск   
              
 www.samag.ru    Web  0 товаров , сумма 0 руб.
E-mail
Пароль  
 Запомнить меня
Регистрация | Забыли пароль?
Журнал "Системный администратор"
Журнал «БИТ»
Подписка
Архив номеров
Где купить
Авторам
Рекламодателям
Контакты
   

  Опросы
1001 и 1 книга  
19.03.2018г.
Просмотров: 10493
Комментарии: 0
Машинное обучение с использованием библиотеки Н2О

 Читать далее...

12.03.2018г.
Просмотров: 10597
Комментарии: 0
Особенности киберпреступлений в России: инструменты нападения и защита информации

 Читать далее...

12.03.2018г.
Просмотров: 8062
Комментарии: 0
Глубокое обучение с точки зрения практика

 Читать далее...

12.03.2018г.
Просмотров: 4959
Комментарии: 0
Изучаем pandas

 Читать далее...

12.03.2018г.
Просмотров: 5803
Комментарии: 0
Программирование на языке Rust (Цветное издание)

 Читать далее...

19.12.2017г.
Просмотров: 5760
Комментарии: 0
Глубокое обучение

 Читать далее...

19.12.2017г.
Просмотров: 8569
Комментарии: 0
Анализ социальных медиа на Python

 Читать далее...

19.12.2017г.
Просмотров: 5144
Комментарии: 0
Основы блокчейна

 Читать далее...

19.12.2017г.
Просмотров: 5400
Комментарии: 0
Java 9. Полный обзор нововведений

 Читать далее...

16.02.2017г.
Просмотров: 9538
Комментарии: 0
Опоздавших не бывает, или книга о стеке

 Читать далее...

17.05.2016г.
Просмотров: 12957
Комментарии: 0
Теория вычислений для программистов

 Читать далее...

30.03.2015г.
Просмотров: 14436
Комментарии: 0
От математики к обобщенному программированию

 Читать далее...

18.02.2014г.
Просмотров: 16163
Комментарии: 0
Рецензия на книгу «Читаем Тьюринга»

 Читать далее...

13.02.2014г.
Просмотров: 11076
Комментарии: 0
Читайте, размышляйте, действуйте

 Читать далее...

12.02.2014г.
Просмотров: 9028
Комментарии: 0
Рисуем наши мысли

 Читать далее...

10.02.2014г.
Просмотров: 7305
Комментарии: 4
Страна в цифрах

 Читать далее...

18.12.2013г.
Просмотров: 6390
Комментарии: 0
Большие данные меняют нашу жизнь

 Читать далее...

18.12.2013г.
Просмотров: 5325
Комментарии: 0
Компьютерные технологии – корень зла для точки роста

 Читать далее...

04.12.2013г.
Просмотров: 4953
Комментарии: 0
Паутина в облаках

 Читать далее...

03.12.2013г.
Просмотров: 5203
Комментарии: 1
Рецензия на книгу «MongoDB в действии»

 Читать далее...

Друзья сайта  

 Оптимизация моделей глубокого обучения на основе GPU

Архив номеров / 2020 / Выпуск №12 (217) / Оптимизация моделей глубокого обучения на основе GPU

Рубрика: Наука и технологии /  Раздел для научных публикаций

Петрин Д.А.,
магистр кафедры «Программное обеспечение ЭВМ, информационные технологии», Калужский филиал федерального государственного бюджетного образовательного учреждения высшего образования «Московский государственный технический университет имени Н.Э. Баумана (национальный исследовательский университет)», Калуга, dapetrin98@yandex.ru

Белов Ю.С.,
кандидат физико-математических наук, доцент кафедры «Программное обеспечение ЭВМ, информационные технологии», Калужский филиал федерального государственного бюджетного образовательного учреждения высшего образования «Московский государственный технический университет имени Н.Э. Баумана (национальный исследовательский университет)», Калуга, iu4-kf@mail.rux

Козина А.В.,
аспирант кафедры «Программное обеспечение ЭВМ, информационные технологии», Калужский филиал федерального государственного бюджетного образовательного учреждения высшего образования «Московский государственный технический университет имени Н.Э. Баумана (национальный исследовательский университет)», Калуга, anastasiya_kozin@list.ru

 

Оптимизация
моделей глубокого обучения на основе GPU

В данной статье рассматриваются оптимизации логического вывода обученных моделей на GPU, а также сравнительные характеристики производительности без и с использованием TensorRT

 

Введение

В наши дни ускорение моделей глубокого обучения похоже на погоню за движущейся целью [1]. По мере того как модели становятся все более универсальными и точными, их требования к вычислительным ресурсам и памяти стремительно растут [2, 3] и, вполне возможно, опередят улучшения в ресурсах и производительности графических процессоров. Так, например, 100 эпох обучения ResNet50 на наборе данных ImageNet на одном графическом процессоре NVIDIA Tesla M40 занимают 14 дней. Чтобы сократить время обучения, исследователи используют кластеры с сотнями подобных графических процессоров [4, 5]. Точно так же во время логического вывода (inference) серьезной проблемой является достижение целевых значений задержки (особенно для приложений, работающих в реальном времени) при высокой степени повторного использования, пропускной способности и точности.

<...>


Полную версию статьи читайте в журнале
Подпишитесь на журнал
Купите в Интернет-магазине

Комментарии отсутствуют

Добавить комментарий

Комментарии могут оставлять только зарегистрированные пользователи

               Copyright © Системный администратор

Яндекс.Метрика
Tel.: (499) 277-12-45
E-mail: sa@samag.ru