Стань лучшим!::Журнал СА 9.2018
www.samag.ru
     
Поиск   
              
 www.samag.ru    Web  0 товаров , сумма 0 руб.
E-mail
Пароль  
 Запомнить меня
Регистрация | Забыли пароль?
Журнал "Системный администратор"
Журнал «БИТ»
Подписка
Архив номеров
Где купить
Наука и технологии
Авторам
Рекламодателям
Контакты
   

  Опросы
  Статьи

Дата-центры  

Дата-центры: есть ли опасность утечки данных?

Российские компании уже несколько лет испытывают дефицит вычислительных мощностей. Рост числа проектов,

 Читать далее...

Событие  

В банке рассола ждет сисадмина с полей фрактал-кукумбер

Читайте впечатления о слете ДСА 2024, рассказанные волонтером и участником слета

 Читать далее...

Организация бесперебойной работы  

Бесперебойная работа ИТ-инфраструктуры в режиме 24/7 Как обеспечить ее в нынешних условиях?

Год назад ИТ-компания «Крок» провела исследование «Ключевые тренды сервисного рынка 2023». Результаты

 Читать далее...

Книжная полка  

Читайте и познавайте мир технологий!

Издательство «БХВ» продолжает радовать выпуском интересных и полезных, к тому же прекрасно

 Читать далее...

СУБД PostgreSQL  

СУБД Postgres Pro

Сертификация по новым требованиям ФСТЭК и роль администратора без доступа к данным

 Читать далее...

Критическая инфраструктура  

КИИ для оператора связи. Готовы ли компании к повышению уровня кибербезопасности?

Похоже, что провайдеры и операторы связи начали забывать о требованиях законодательства

 Читать далее...

Архитектура ПО  

Архитектурные метрики. Качество архитектуры и способность системы к эволюционированию

Обычно соответствие программного продукта требованиям мы проверяем через скоуп вполне себе понятных

 Читать далее...

Как хорошо вы это знаете  

Что вам известно о разработках компании ARinteg?

Компания ARinteg (ООО «АРинтег») – системный интегратор на российском рынке ИБ –

 Читать далее...

Графические редакторы  

Рисование абстрактных гор в стиле Paper Cut

Векторный графический редактор Inkscape – яркий представитель той прослойки open source, с

 Читать далее...

День сисадмина  

Учите матчасть! Или как стать системным администратором

Лето – время не только отпусков, но и хорошая возможность определиться с профессией

 Читать далее...

День сисадмина  

Живой айтишник – это всегда движение. Остановка смерти подобна

Наши авторы рассказывают о своем опыте и дают советы начинающим системным администраторам.

 Читать далее...

Виртуализация  

Рынок решений для виртуализации

По данным «Обзора российского рынка инфраструктурного ПО и перспектив его развития», сделанного

 Читать далее...

Книжная полка  

Как стать креативным и востребованным

Издательский дом «Питер» предлагает новинки компьютерной литературы, а также книги по бизнесу

 Читать далее...

Книжная полка  

От создания сайтов до разработки и реализации API

В издательстве «БХВ» недавно вышли книги, которые будут интересны системным администраторам, создателям

 Читать далее...

1001 и 1 книга  
19.03.2018г.
Просмотров: 6229
Комментарии: 0
Машинное обучение с использованием библиотеки Н2О

 Читать далее...

12.03.2018г.
Просмотров: 6935
Комментарии: 0
Особенности киберпреступлений в России: инструменты нападения и защита информации

 Читать далее...

12.03.2018г.
Просмотров: 4221
Комментарии: 0
Глубокое обучение с точки зрения практика

 Читать далее...

12.03.2018г.
Просмотров: 3010
Комментарии: 0
Изучаем pandas

 Читать далее...

12.03.2018г.
Просмотров: 3808
Комментарии: 0
Программирование на языке Rust (Цветное издание)

 Читать далее...

19.12.2017г.
Просмотров: 3825
Комментарии: 0
Глубокое обучение

 Читать далее...

19.12.2017г.
Просмотров: 6319
Комментарии: 0
Анализ социальных медиа на Python

 Читать далее...

19.12.2017г.
Просмотров: 3172
Комментарии: 0
Основы блокчейна

 Читать далее...

19.12.2017г.
Просмотров: 3462
Комментарии: 0
Java 9. Полный обзор нововведений

 Читать далее...

16.02.2017г.
Просмотров: 7279
Комментарии: 0
Опоздавших не бывает, или книга о стеке

 Читать далее...

17.05.2016г.
Просмотров: 10647
Комментарии: 0
Теория вычислений для программистов

 Читать далее...

30.03.2015г.
Просмотров: 12368
Комментарии: 0
От математики к обобщенному программированию

 Читать далее...

18.02.2014г.
Просмотров: 14000
Комментарии: 0
Рецензия на книгу «Читаем Тьюринга»

 Читать далее...

13.02.2014г.
Просмотров: 9126
Комментарии: 0
Читайте, размышляйте, действуйте

 Читать далее...

12.02.2014г.
Просмотров: 7079
Комментарии: 0
Рисуем наши мысли

 Читать далее...

10.02.2014г.
Просмотров: 5389
Комментарии: 3
Страна в цифрах

 Читать далее...

18.12.2013г.
Просмотров: 4617
Комментарии: 0
Большие данные меняют нашу жизнь

 Читать далее...

18.12.2013г.
Просмотров: 3428
Комментарии: 0
Компьютерные технологии – корень зла для точки роста

 Читать далее...

04.12.2013г.
Просмотров: 3158
Комментарии: 0
Паутина в облаках

 Читать далее...

03.12.2013г.
Просмотров: 3402
Комментарии: 0
Рецензия на книгу «MongoDB в действии»

 Читать далее...

02.12.2013г.
Просмотров: 3027
Комментарии: 0
Не думай о минутах свысока

 Читать далее...

Друзья сайта  

 Стань лучшим!

Архив номеров / 2018 / Выпуск №9 (190) / Стань лучшим!

Рубрика: Карьера/Образование /  Вектор роста

Оксана Селендеева ОКСАНА СЕЛЕНДЕЕВА, основатель Международной школы программирования для детей CODDY

Стань лучшим!

Олимпиады и другие соревнования по анализу данных и машинному обучению. Почему участие в них не только престижно, но и всячески выгодно?

Анализ данных (data science) – дисциплина на стыке математики, информатики и статистики, набор методов обработки и анализа информации и применение результатов на практике. Данные не обязательно должны быть большими (big data)– они могут быть любыми, главное – правильно их подготовить и привести к подходящему формату. Машинное обучение – метод обработки данных. С его помощью находят закономерности в массиве информации, чтобы предсказывать будущие показатели.

Специалист по анализу данных имеет фундаментальные знания в математике и информатике, знает алгоритмы, теорию вероятности, математическую статистику и умеет программировать на языках Python или R. Чтобы стать data scientist,желательно получить высшее образование, связанное с математикой или статистикой, и пройти специализированные курсы, а для практики регулярно участвовать в олимпиадах и чемпионатах.

Всероссийская инженерная олимпиада

Олимпиада НТИ [1] организована в рамках программы глобального технологического лидерства России «Национальная технологическая инициатива». Всего у олимпиады 17 профилей, в том числе большие данные и машинное обучение[2]. Олимпиада входит в перечень олимпиад, утвержденных Минобрнауки РФ (проект на 2018-2019 годы) [3]как мероприятие третьего уровня и дает льготы для поступления в ведущие вузы.

Олимпиада НТИ организована в рамках программы глобального технологического лидерства России «Национальная технологическая инициатива»

Победители и призеры олимпиады НТИ по профилю «большие данные и машинное обучение» поступают [4]без экзаменов в Московский политехнический университет, МАИ, Университет ИТМО, МИФИ, Томский политехнический университет, НГУ и другие. Для этого необходимо иметь 75 баллов на ЕГЭ по профильному предмету.

Соревнование проводится в три этапа: индивидуальный отборочный, отборочный командный и финал.

  • В первом отборочном этапе разрабатывают программу и алгоритм по обработке данных.
  • В следующем этапе проходят онлайн-курсы, смотрят видеолекции и участвуют в хакатоне очно или удаленно. В прошлом году хакатон НТИ [5] был в МФТИ.
  • В финале участники объединяются в команды и работают с настоящим инженерным оборудованием.

Обычно первый отборочный тур проходит с середины сентября до конца октября, второй – в ноябре-декабре, заключительный – в феврале-марте. Финал прошлой олимпиады проводился в Сочи, в лагере «Сириус».

В этом году отборочный первый тур олимпиады стартует 15 сентября.

Олимпиада рассчитана на учеников 9-х-11-х классов. Для участия необходимо зарегистрироваться на сайте и решить задачи первого этапа. Организаторы ожидают, что ребята будут знать математическую статистику, теорию графов и промышленные языки программирования. Задания не простые. Например, в соревновании 2016-2017 учебного года олимпиадники учили программу анализировать большие объемы текста и определять их связь между собой по стилю письма. Исходными данными были рукописные дневники начала XX века.

Организаторы рекомендуют готовиться на портале Stepik.org, на котором размещен бесплатный онлайн-курс подготовки к олимпиаде НТИ [6] на основе заданий прошлых лет.

Дополнительно советуют пройти программы [7] по теории вероятности, алгоритмам, теории статистики, дискретным структурам и другим.

International Data Analysis Olympiad

IDAO – Международная олимпиада по анализу данных [8], которая организована год назад Высшей школой экономики (ВШЭ). Первая олимпиада проходила совместно с компанией «Яндекс» и испанским Университетом Harbour.Space.

IDAO – Международная олимпиада по анализу данных, которая организована год назад Высшей школой экономики

Олимпиада проводится в два этапа: предварительный и заключительный.

В первом этапе может принять участие любой желающий, на второй этап приглашают 30 лучших команд. В каждой – от одного до трех человек.

Регистрация на олимпиаду ожидается в сентябре 2018 года. Организаторы планируют провести предварительный этап в январе 2019 года, заключительный – в апреле.

Соревнование ориентировано на студентов и недавних выпускников вузов. Перед олимпиадой желательно пройти базовый курс по машинному обучению. Организаторы рекомендуют для подготовки курс на платформе Coursera.org «Каквыиграть соревнования по анализу данных» [9], который подготовили преподаватели ВШЭ и члены жюри IDAO. Он рассчитан на пять недель и входит в программу Advanced Machine Learning [10].

Russian ML Cup

С конца 2015 года работает Russian ML Cup (ML Boot Camp) [11] – чемпионат по машинному обучению от компании Mail.Ru Group. Это онлайн-площадка, на которой два-три раза в год размещаются задачи-контесты. Соревнование рассчитано на опытных специалистов – организаторы ждут участников уровня Middle и Senior. Возрастное ограничение – от 18 лет.

С конца 2015 года работает Russian ML Cup (ML Boot Camp) – чемпионат по машинному обучению от компании Mail.Ru Group

Russian ML Cup проходит удаленно в один этап. После регистрации открывается доступ к условиям задачи, на решение которой отводится месяц. Все задачи практические, например летом участники прогнозировали отклик аудитории на интернет-опрос.

Победители, как правило, получают ценные призы в виде техники Apple, NVIDIA, My Cloud. Организаторы не скрывают, что в первую очередь нацелены на поиск квалифицированных сотрудников. Авторов нестандартных решений приглашают на собеседование в компанию Mail.Ru. За три года деятельности состоялось 15 собеседований.

Организаторы планируют этой осенью запустить собственный курс по обучению на специалиста Data Science. Они также рекомендуют смотреть видеолекции Технострима [12], или, если вы учитесь в МГУ, поступить в Техносферу [13] на двухгодичную программу «Анализ больших объемов данных».

Яндекс.Алгоритм

Компания «Яндекс» ежегодно проводит Международный чемпионат по спортивному программированию [14].

Компания «Яндекс» ежегодно проводит Международный чемпионат по спортивному программированию

С этого года в чемпионат добавился отдельный трек по машинному обучению. Трек проходил в течение месяца и состоял всего из одной большой задачи, которую придумали и подготовили разработчики голосового помощника «Алиса».

В чемпионате могут участвовать ребята от шести лет, в финале – только совершеннолетние. Регистрация открыта все время до завершения трека по машинному обучению. В 2018 году призовой фонд трека составил 220 000 рублей.

У компании нет специального курса для подготовки к чемпионату, но «Яндекс» учит перспективному направлению в собственной Школе анализа данных (ШАД) [15]. Филиалы ШАД открыты в четырех городах: Москве, Минске, Нижнем Новгороде и Екатеринбурге. Обучение идет два года. Для поступления необходимо пройти три этапа [16]: пятичасовой онлайн-тест, очный экзамен и собеседование. Набор ограничен и проводится раз в год.

В качестве альтернативы можно пройти на платформе Coursera онлайн-программу [17], разработанную «Яндексом» совместно с МФТИ.

Соревновательная площадка Kaggle

Kaggle [18] – платформа корпорации Google для проведения соревнований по машинному обучению и анализу данных. Организаторами выступают Google, Intel, Mercedes-Benz, Allstate и другие компании. Каждый организатор самостоятельно определяет критерии оценки, сроки и призы. Обычно на платформе проводится до 20 соревнований одновременно.

Kaggle – платформа корпорации Google для проведения соревнований по машинному обучению и анализу данных

Чтобы принять участие, необходимо зарегистрироваться на платформе и выбрать соревнование из перечня. Отборочного этапа нет, поэтому участники сразу получают основное задание. Как правило, каждое соревнование идет два-три месяца. Победители получают денежные призы в размере от 15 000 до 100 000 долларов.

Для подготовки на платформе есть обучающий раздел [19] с бесплатными материалами по направлениям: Python, Pandas, SQL, язык R, глубокое обучение, анализ данных и представление данных. Дополнительно можно пройти бесплатный интенсив от Google по машинному обучению [20], состоящий из 25 уроков.

Чемпионат KDD CUP

KDD CUP [21] – Международное соревнование по машинному обучению и анализу данных, которое проводится под эгидой Ассоциации вычислительной техники (ACM). В Кубке KDD участвуют команды до 10 человек. После регистрации на сайте необходимо присоединиться к одной из команд.

KDD CUP – Международное соревнование по машинному обучению и анализу данных, которое проводится под эгидой Ассоциации вычислительной техники

В качестве основного задания организаторы выбирают общественно значимую проблему. Так, в 2018 году Кубок проходил совместно с Colorful Clouds Tech – компанией по прогнозированию погоды. Участники предсказывали уровень концентрации загрязнений в Пекине и Лондоне. Им предоставили данные о количестве вредных веществ в прошлом, на основании которых они должны были спрогнозировать, какой будет воздух в течение следующих 48 часов.

Соревнование [22] проходило почти три месяца и закончилось в начале июня. Призовой фонд составил 36 000 долларов. Победители очно презентуют решения на KDD CUP workshop в Лондоне.

Стать Data Science-специалистом может любой желающий. Открытые образовательные платформы Coursera, Stepic и ИТ-гиганты Google, «Яндекс», Mail.Ru бесплатно обучают по программе «Анализ данных и машинное обучение». Для тренировки на практике рекомендуем участвовать в олимпиадах и соревнованиях. Это даст практический опыт, а в случае победы еще и принесет солидное материальное вознаграждение.


Андрей ЛозицкийАндрей Лозицкий, преподаватель курса «Олимпиадное программирование» Международной школы программирования для детей CODDY

Я уже участвовал во многих олимпиадах и соревнованиях: Яндекс.Алгоритм, VK CUP, ACM ICPC, муниципальный и региональный этапы Всероссийской олимпиады школьников по программированию. Это классические олимпиады, которые не связаны с анализом данных и машинным обучением. Теперь хочу попробовать свои силы на платформе Kaggle и KDD CUP, на которых обычно ставятся задачи по прогнозированию на основе эмпирических данных. Такие соревнования дают интересный реальный опыт, а победа в KDD CUP открывает дорогу для научной карьеры.


  1. http://nti-contest.ru/
  2. http://nti-contest.ru/profiles/data/
  3. https://olimpiada.ru/upload/files/project_perechen_2018_2019.pdf
  4. http://nti-contest.ru/abitur
  5. http://nti-contest.ru/hackatons2017/
  6. https://stepik.org/course/1296/
  7. http://nti-contest.ru/profiles/data/
  8. http://idao.world/
  9. https://www.coursera.org/learn/competitive-data-science
  10. https://www.coursera.org/specializations/aml
  11. https://mlbootcamp.ru
  12. https://www.youtube.com/user/TPMGTU/playlists
  13. https://sphere.mail.ru/pages/index/
  14. https://yandex.ru/promo/academy/algorithm2018
  15. https://yandexdataschool.ru
  16. https://yandexdataschool.ru/admission
  17. https://www.coursera.org/specializations/machine-learning-data-analysis?utm_medium=institutions&utm_source=yandex&utm_campaign=yalanding#creators
  18. https://www.kaggle.com
  19. https://www.kaggle.com/learn/overview
  20. https://developers.google.com/machine-learning/crash-course/
  21. http://www.kdd.org/kdd2018/kdd-cup
  22. https://biendata.com/competition/kdd_2018/

Комментарии отсутствуют

Добавить комментарий

Комментарии могут оставлять только зарегистрированные пользователи

               Copyright © Системный администратор

Яндекс.Метрика
Tel.: (499) 277-12-45
E-mail: sa@samag.ru