Computer Vision

Технологии компьютерного зрения повсюду: от Face ID до обработки КТ-снимков. На курсе ты познакомишься с современными способами обработки изображений и видео, узнаешь о современных методах глубокого обучения и научишься решать самые разные практические задачи
C 9 ноября по 31 марта

Результат курса

Ты сможешь самостоятельно формулировать и решать задачи обработки изображений и видео с помощью state-of-the-art-подходов. В том числе выстраивать многошаговые решения для сложных задач (например, распознавания лиц), которые возникают в работе CV-инженера

Фича курса

Курс ведут практикующие эксперты, которые много лет создают продукты на основе компьютерного зрения

Преподаватели

  • Head of research projects в VisionLabs
  • Автор курса Computer Vision в karpov. courses
  • Экс-лектор курса Computer Vision на ФКН НИУ ВШЭ
  • Экс-семинаристка по DL в Ozon Masters

Анастасия Белозёрова

  • Победитель Rosneft Challenge 2021
  • Победитель Machines Can See 2022

Дмитрий Гаус

  • Выпускник МФТИ и Сколтеха
  • CV engineer в команде Облака Mail.ru

Владимир Черный

Программа

В первой части курса ты будешь исследовать базовые задачи компьютерного зрения:

  • углубишь свои знания по темам классификации, сегментации и детекции;
  • познакомишься с классической обработкой изображений, техниками эффективного обучения, трансформерными моделями и задачей key-point estimation

Блок 1

Вторая часть курса будет посвящена более высокоуровневым задачам, которые не решить какой-то одной моделью, и более продвинутым подходам в CV. В этом блоке мы разберем:

  • как устроены алгоритмы распознавания лиц, текста и действий;
  • как сделать трекинг объектов на видео;
  • из чего состоят мультимодальные сети;
  • как подготовить сеть для эффективного инференса в продукте

Блок 2

Изображение. Классические методы в CV
Современные архитектуры CNN
Построение эффективного пайплайна обучения сети
Vision transformers, CLIP
Сегментация изображений, SAM

Блок 1 | Темы занятий

1.1
1.2
1.3
1.4
1.5
1.6
1.7
Современные детекторы объектов
Key-point/pose estimation
Face recognition / re-iIdentification / iImage retrieval
Single object tracking (SOT)
Multi-object tracking (MOT)
Optical character recognition (OCR)
SOTA self-supervised learning

Блок 2 | Темы занятий

2.1
2.2
2.3
2.4
2.5
2.6
2.7
Ускорение и инференс моделей
Vision language models (VLMs)
Action recognition
2.8

2 пары в неделю

По понедельникам и четвергам

19:00—20:20

Длительность

Длительность 3,5 месяца

с перерывом на новогодние каникулы

Как проходит обучение

Две пары в неделю: лекция и семинар. Преподаватель всегда офлайн. А ты можешь выбрать удобный для себя вариант посещения

Вариант 1
Учиться офлайн в кампусе ЦУ на м. «Маяковская»
Вариант 2
Подключаться к парам онлайн
Вариант 3
Миксовать онлайн и офлайн-форматы

У тебя останутся

Записи и презентации леĸций и семинаров

Дополнительные материалы для самостоятельного изучения

Стоимость обучения

1 курс
100 000 ₽
Скидка 20%
2 курса
200 000₽
160 000 ₽
Скидка 25%
4 курса
400 000₽
300 000 ₽
Скидка 20%
3 курса
300 000₽
240 000 ₽