|
Рубрика:
Наука и технологии /
Раздел для научных публикаций
|
Facebook
Мой мир
Вконтакте
Одноклассники
Google+
|
Сачко А.А., студент, ФГБОУ ВО «Сочинский государственный университет»
Адаптивная конфигурация банков памяти GPU на основе предсказания фазы рабочей нагрузки искусственного интеллекта
В данной статье предлагается концепция аппаратно-реализованной адаптивной конфигурации банков памяти GPU, способной динамически изменять свою логическую структуру на основе предсказания текущей фазы рабочей нагрузки. Рассматривается архитектурное решение, включающее блок предсказания фазы, гибкий коммутатор и набор конфигурационных карт. Проводится анализ методов предсказания (статические, динамические, гибридные), оценивается потенциальный выигрыш в производительности и энергоэффективности, а также технологические вызовы, связанные с внедрением данной технологии.
1. Введение
1.1. Актуальность проблемы
Современные графические процессоры перешли из чисто рендеринговых устройств в универсальные вычислительные платформы, став основой революции глубокого обучения. Закон Мура в его классическом виде замедляется, и основной прирост производительности теперь обеспечивается за счет архитектурных инноваций: тензорных ядер, специализированных форматов данных и усложнённых иерархий памяти. Однако, несмотря на эти достижения, разрыв между скоростью вычислений и скоростью доступа к данным продолжает расти. Этот феномен, известный как «стена памяти», является главным ограничивающим фактором для дальнейшего масштабирования систем ИИ.
На рисунке 1 продемонстрирован закон Мура, который к сегодняшнему дню замедляется.
<...>
Ключевые слова: GPU, память, банки памяти, конфликты банков, глубокое обучение, фазовая рабочая нагрузка, адаптивная архитектура, предсказание, энергоэффективность
Полную версию статьи читайте в журнале Подпишитесь на журнал
Facebook
Мой мир
Вконтакте
Одноклассники
Google+
|