Профессия Data Science: что делает специалист, какие нужны навыки и roadmap, уровни от junior, реальные задачи и зарплата в 2026, как войти с нуля

Навыки Data Science

74 ключевых навыков · 0 из них завязаны на AI

Hard

Базовые навыки

EDARSQLАлгоритмыВизуализация данныхКачество данныхМатематикаМашинное обучениеМоделирование данныхОблакоОсновы PythonСтатистикаТеория вероятностейФиче-инжинирингФормирование гипотез

Продвинутые навыки

A/B-тесты PROBigDataNLPSQL PROВалидация моделейГиперпараметрический поискМетрики и KPIОптимизацияОсновы MLOpsПрогнозированиеПроектирование решенийРекомендательные системы

Stack

Основные инструменты

ClickHouseGitJupyterMatplotlibMongoDBMySQLNumPyPandasPostgreSQLPyCharmPython 3.xscikit-learnSciPySeaborn

Дополнительные инструменты

AirflowApache SparkDockerDVCFastAPIFlaskHadoopMLFlowPyTorchS3spaCyTensorFlow

Soft

Базовые навыки

Аналитическое мышлениеВнимание к деталямГибкость и адаптивностьКоммуникацияОбучаемостьОтветственностьПланированиеПродуктовое мышлениеРабота в командеСамостоятельностьЭмоциональный интеллект

Продвинутые навыки

Data storytellingКритическое мышлениеЛидерствоНаставничествоПереговоры с клиентамиПрезентация решенийРабота в неопределённостиРешение проблемУправление ожиданиямиФасилитация встреч

Как AI меняет работу Data Science

7 главных сдвигов профессии · ранжированы по влиянию на роль

Подход85%

Трансформеры заменили NLP с нуля

Hugging Face fine-tuning на доменных данных даёт результат за часы вместо недель кастомного обучения. DS теперь выбирает базовую модель и готовит данные — а не проектирует архитектуру.

Влияние на роль
Инструмент75%

ChatGPT Data Analysis вместо ручной EDA

DS загружает датасет в ChatGPT Pro и получает распределения, корреляции, выбросы и гипотезы за минуты. Рутинная часть EDA перестала требовать написания кода.

Влияние на роль
Инструмент70%

Cursor пишет sklearn-пайплайны

Preprocessing chains, cross-validation loops, логирование метрик в MLflow — Cursor генерирует этот boilerplate точно и быстро. DS тратит время на постановку задачи, а не на типовой код.

Влияние на роль
Навык65%

LLM-эмбеддинги как фичи для табличных моделей

Текстовые колонки (описания, отзывы) теперь превращаются в числовые признаки через pre-trained трансформер и уходят в XGBoost или LightGBM. Это улучшает качество там, где текст раньше просто отбрасывали.

Влияние на роль
Подход60%

LLM-разметка вместо ручного аннотирования

Слабая разметка через GPT закрывает задачи классификации текста или тональности без дорогостоящего ручного аннотирования. DS формирует промпт, валидирует выборку статистически — и получает обучающую выборку.

Влияние на роль
Навык55%

AI переводит SHAP-значения на язык бизнеса

Claude помогает сформулировать, почему модель приняла решение, в терминах продукта или финансов. DS меньше времени пишет интерпретации для стейкхолдеров — больше проверяет их корректность.

Влияние на роль
Подход50%

AutoML задаёт планку baseline

FLAML или AutoGluon строят конкурентоспособный baseline за минуты. DS ориентируется на этот результат и направляет усилия туда, где доменные признаки дают прирост — вместо перебора алгоритмов вручную.

Влияние на роль

Roadmap Data Engineer 2026

Что отличает каждый уровень, какие навыки нужны, как переходить дальше.

Junior

0-1 год130-220к ₽

Поддерживает существующие ML-модели, участвует в сборе и подготовке данных.

Аналитическое мышлениеМашинное обучениеscikit-learnSQLОсновы PythonPandasNumPyJupyterGitPandasСтатистикаФиче-инжиниринг
КоммуникацияОтветственностьОбучаемостьВнимание к деталям
  • Пишет скрипты на Python для обработки данных
  • Использует Jupyter для исследования данных
  • Выполняет фиче-инжиниринг с помощью Pandas
  • Тестирует простые модели в scikit-learn
  • Уверенно использует SQL для сложных запросов
  • Оптимизирует фиче-инжиниринг для больших данных
  • Работает с PyTorch или TensorFlow
  • Понимает гиперпараметрический поиск

Middle

2-4 года в роли240-450к ₽

Разрабатывает и оптимизирует ML-модели, выполняет анализ данных и строит отчёты.

Машинное обучениеscikit-learnSQLPyTorchTensorFlowOptunaHyperoptMLflowJupyterGitPostgreSQLФиче-инжинирингВалидация моделейPandasNumPyСтатистика
КоммуникацияРабота в командеГибкость и адаптивностьЭмоциональный интеллектОтветственность
  • Разрабатывает модели в PyTorch для задач классификации
  • Оптимизирует гиперпараметры с использованием Optuna
  • Ведёт трекинг экспериментов через MLflow
  • Работает с SQL для извлечения данных
  • Проектирует и внедряет сложные модели
  • Использует Apache Spark для обработки данных
  • Владеет A/B-тестами PRO
  • Проводит презентации решений

Senior

4-7 лет в роли430-800к ₽

Проектирует и внедряет сложные ML-решения, ведёт исследования и оптимизацию моделей.

Валидация моделейPyTorchTensorFlowApache SparkAirflowПроектирование решенийSQL PROA/B-тесты PROMLflowOptunaHyperoptGitРекомендательные системыNLPМетрики и KPIПрогнозированиеBigDataspaCyFlaskFastAPI
Решение проблемКритическое мышлениеПрезентация решенийРабота в неопределённостиУправление ожиданиями
  • Проектирует архитектуру сложных ML-систем
  • Оптимизирует модели для улучшения метрик
  • Проводит A/B-тесты и анализирует результаты
  • Настраивает пайплайны данных с помощью Airflow
  • Ведёт сложные системные решения
  • Менторит младших специалистов
  • Участвует в переговорах с клиентами
  • Оптимизирует BigData-процессы

Lead

7+ лет в роли600-1100к ₽

Разрабатывает архитектуру ML-систем, устанавливает инженерные стандарты, менторит команду.

Проектирование решенийЛидерствоНаставничествоПереговоры с клиентамиОптимизацияMLFlowРекомендательные системыNLPBigDataDockerDVCHadoopFastAPIFlaskApache SparkAirflowSQL PROPyTorchTensorFlowГиперпараметрический поискПрогнозированиеМетрики и KPIУправление ожиданиямиФасилитация встреч
ЛидерствоНаставничествоФасилитация встречРабота в неопределённостиУправление ожиданиямиКритическое мышление
  • Проектирует архитектуру ML-платформы
  • Устанавливает стандарты кодирования и моделирования
  • Менторит и развивает команду специалистов
  • Ведёт переговоры с ключевыми стейкхолдерами
  • Ведёт архитектуру сложных систем
  • Устанавливает стандарты и процессы
  • Менторит и развивает команду
  • Ведёт переговоры и управляет ожиданиями

Лучшие курсы для Data Scientists

Топ-10 курсов из 6 школ — ранжированы по покрытию карты навыков. Видно, какой процент карты закроет каждый курс и сколько стоит один навык.

💼
Специалист по Data Science — ПрактикумПолный курс
Практикум
71% навыков●●●●● практикаAI
Специалист по Data Science
💼 Карьерный центр
6 287 ₽/мес
168 000 ₽154 000 ₽ полная цена
≈ 4 278 ₽ / навык
Перейти к курсу →
💼
Специалист по Data Science расширенный — ПрактикумПолный курс
Практикум
66% навыков●●●●● практикаAI
Специалист по Data Science расширенный
💼 Карьерный центр
8 246 ₽/мес
212 000 ₽202 000 ₽ полная цена
≈ 6 313 ₽ / навык
Перейти к курсу →
📦
Профессия  Data scientist + ИИ — SkillboxПолный курс
Skillbox
63% навыков●●●●● практикаAI
Профессия Data scientist + ИИ
9 мес💼 Стажировка
9 180 ₽/мес
220 320 ₽110 160 ₽ полная цена
≈ 2 687 ₽ / навык
Перейти к курсу →
🧠
ДО Профессия Data Scientist с нуля до Junior — GeekbrainsПолный курс
Geekbrains
62% навыков●●●●○ практикаAI
ДО Профессия Data Scientist с нуля до Junior
💼 Карьерный центр
115 771 ₽199 015 ₽
Уточняем про рассрочку
≈ 3 308 ₽ / навык
Перейти к курсу →
📦
Data Scientist с нуля до Junior — SkillboxПолный курс
Skillbox
57% навыков●●●●● практикаAI
Data Scientist с нуля до Junior
9 мес💼 Стажировка
6 441 ₽/мес
283 404 ₽141 702 ₽ полная цена
≈ 4 049 ₽ / навык
Перейти к курсу →
🎓
Data Scientist — НетологияПолный курс
Нетология
56% навыков●●●●● практикаAI
Data Scientist
9 мес💼 Стажировка
3 718 ₽/мес
178 463 ₽96 400 ₽ полная цена
≈ 3 213 ₽ / навык
Перейти к курсу →
🏭
Полный курс по Data Science — SkillfactoryПолный курс
Skillfactory
54% навыков●●●●● практикаAI
Полный курс по Data Science
💼 Гарантия работы
3 750 ₽/мес
270 000 ₽135 000 ₽ полная цена
≈ 5 625 ₽ / навык
Перейти к курсу →
📊
Data scientist: тариф PRO — EdusonПолный курс
Eduson
53% навыков●●●●● практикаAI
Data scientist: тариф PRO
9 мес💼 Гарантия работы
5 412 ₽/мес
324 750 ₽129 900 ₽ полная цена
≈ 4 996 ₽ / навык
Перейти к курсу →
🎓
Data Scientist: расширенный курс — НетологияПолный курс
Нетология
51% навыков●●●●● практикаAI
Data Scientist: расширенный курс
18 мес💼 Стажировка
4 640 ₽/мес
334 118 ₽150 400 ₽ полная цена
≈ 4 852 ₽ / навык
Перейти к курсу →
📊
Data Science + ИИ — EdusonПолный курс
Eduson
51% навыков●●●●● практикаAI
Data Science + ИИ
8 мес💼 Гарантия работы
4 579 ₽/мес
274 750 ₽109 900 ₽ полная цена
≈ 4 396 ₽ / навык
Перейти к курсу →

Все 56 курсов для Data Scientists

Отранжированы по покрытию карты навыков · 13 школ

Смотреть каталог →

Откуда и куда переходят Data Scientists: нативные карьерные траектории

Толщина линии — пересечение по hard- и stack-навыкам: полезно, если выбираешь смежную профессию или думаешь о возврате к старой.

Data Science
Твои навыки в Python и Docker уже на высоте. Этого хватит, чтобы попробовать себя в ML-инженерии или MLOps, углубляя понимание сложных систем.
2 путей в профессию · 3 куда расти

Вопросы и ответы о профессии Data Science

Что такое Data Science и чем занимаются в этой области?
Data Science — прикладная дисциплина на стыке математики, программирования и доменной экспертизы, позволяющая извлекать из данных закономерности и строить предсказательные модели. Data Scientist формулирует задачу совместно с бизнесом, проводит разведочный анализ (EDA), строит и валидирует ML-модели — классификацию, регрессию, кластеризацию, временные ряды, рекомендательные системы — и передаёт готовый артефакт команде для последующего деплоя. Инструменты 2026: Python + scikit-learn, PyTorch, XGBoost/LightGBM, MLflow для трекинга, Weights & Biases для логирования экспериментов.
Какими задачами занимается специалист по Data Science в реальных компаниях?
Специалист по Data Science решает задачи, где ответ зависит от паттернов в данных: предсказание оттока клиентов, скоринг заявок, ранжирование контента, детекция аномалий, прогноз спроса. Типичный рабочий день — EDA в Jupyter, написание пайплайна обработки фичей на pandas/numpy, обучение модели на PyTorch или LightGBM, оценка через cross-validation и подготовка презентации для стейкхолдеров. Деплой модели в производственную среду и мониторинг инференса — зона ответственности MLOps-инженера, не Data Scientist.
Что такое аналитик Data Science — это то же самое, что Data Scientist?
Аналитик данных и Data Scientist — две разные роли, хотя их часто путают. Аналитик данных отвечает на вопрос «что происходит»: строит дашборды, ведёт продуктовую аналитику, анализирует A/B-тесты продуктовых фичей — преимущественно с помощью SQL и BI-инструментов. Data Scientist отвечает на вопрос «что будет»: строит предсказательные модели с помощью машинного обучения. Граница проходит через ML: если в задаче нет обучения модели — это аналитика данных. В небольших компаниях роли совмещают, но на уровне Middle и выше они разделяются.
Как выглядит рынок вакансий Data Science в России в 2026 году?
На hh.ru и Хабр Карьере в 2026 году одновременно открыто от 800 до 1 200 вакансий Data Scientist — роль входит в топ-15 самых востребованных IT-профессий в России. Спрос концентрируется в финтехе (Сбер, Т-Банк, Альфа), e-commerce (Wildberries, Ozon), телекоме и медтехе. Junior-позиции конкурентны: на одно место приходится 40–70 резюме, поэтому портфолио на GitHub и участие в Kaggle-соревнованиях — не рекомендация, а необходимость для прохождения первичного скрининга.
Какой Python-стек нужен для работы в Data Science?
Базовый Python-стек Data Scientist в 2026 году: pandas и numpy для работы с данными, scikit-learn для классических алгоритмов, PyTorch (или Lightning) и Hugging Face Transformers для нейросетей, XGBoost / LightGBM / CatBoost для табличных задач. Для подбора гиперпараметров — Optuna или Hyperopt. Трекинг экспериментов — MLflow + Weights & Biases. Весь цикл работы проходит в Jupyter или Colab, код пишется с помощью Cursor + Claude Code. SQL на уровне оконных функций и сложных JOIN — обязательное требование в 90% вакансий.
Насколько быстро вырастет зарплата после первого года в Data Science?
Переход с Junior на Middle обычно занимает 1,5-2 года при активной работе над реальными проектами. В Москве это означает рост с 150-220 тыс. ₽ до 280-450 тыс. ₽ в месяц, то есть примерно вдвое. Регионы дают схожую динамику в пропорциях. Главные ускорители: опыт с продакшен-стеком (MLflow, Docker, облачные платформы), умение доносить результаты до бизнеса и участие в проектах с реальными данными и нагрузкой. Те, кто целенаправленно расширяет стек и берётся за сложные задачи, нередко достигают уровня Middle уже через год.
За сколько месяцев реально выйти на уровень Junior Data Scientist?
Минимальный путь от нуля до первого офера — 12–18 месяцев при учёбе 15–20 часов в неделю. За это время нужно освоить Python + pandas + scikit-learn, математику (линейная алгебра, теория вероятностей, статистика) и собрать портфолио из 3–5 проектов с реальными данными. Ускоряет процесс: математический бэкграунд (физика, экономика, биология), опыт программирования на любом языке, участие в Kaggle. Свитчер с IT-бэкграундом — например, разработчик — добирается до Junior за 6–9 месяцев.
Возьмут ли Data Scientist в возрасте после 35 лет?
Возраст не является препятствием — работодатель смотрит на портфолио и технические навыки. Свитчеры после 35 с бэкграундом в медицине, финансах или промышленности имеют преимущество: они понимают доменную задачу лучше вчерашних студентов. Сложности возникают только в очень молодых продуктовых стартапах с культурой «до 28». В корпоративном секторе — финтех, ритейл, телеком — возраст кандидата не фигурирует в офферах.
Можно ли стать Data Scientist без высшего образования?
Формально высшее образование не требуется — ни одна российская компания не указывает его как обязательный критерий в вакансиях. Фактически математическая база (линейная алгебра, статистика, теория вероятностей) необходима, и самостоятельно её получить сложнее, чем с профильным дипломом. Без диплома проходят отбор кандидаты с сильным Kaggle-профилем (серебро/золото в соревнованиях) или открытыми проектами на GitHub с описанием методологии. Для зарубежных компаний отсутствие диплома заметнее — там степень часто требуется для визового спонсорства.
Чем Data Scientist отличается от аналитика данных, MLOps-инженера и AI-инженера?
Это четыре роли с разными выходными артефактами. Аналитик данных строит дашборды и отвечает на продуктовые вопросы через SQL и BI — без машинного обучения. Data Scientist строит ML-модели, но не выкатывает их в прод. MLOps-инженер берёт готовую модель и обеспечивает её работу в production: inference-сервис, мониторинг дрейфа, A/B в продакшне. AI-инженер строит RAG-приложения и агентов поверх LLM-API — это ближе к backend-разработке, чем к ML. На старте карьеры важно понять, в какую сторону хочется расти, чтобы правильно выбрать курс.
Какие AI-инструменты реально используют Data Scientist в 2026 году?
В рабочем процессе Data Scientist 2026 три AI-инструмента стали стандартом. Cursor + Claude Code — написание и рефакторинг кода моделей, анализ ошибок пайплайна, генерация unit-тестов. ChatGPT Pro с Code Interpreter — быстрый EDA по CSV без Python-окружения, code review, объяснение незнакомых алгоритмов. Hugging Face Transformers — доступ к предобученным моделям для NLP и CV задач без обучения с нуля. AI-инструменты сокращают рутину в два-три раза, но не заменяют понимание математики — этого ждут на техническом интервью.
Какие pet-проекты собрать в портфолио Data Scientist?
Три проекта закрывают 80% запросов рекрутеров. Первый — таблично-регрессионная задача: предсказание цены жилья или б/у авто с EDA, feature engineering, сравнением XGBoost vs LightGBM и интерпретацией через SHAP. Второй — NLP-классификация: тональность отзывов или категоризация текстов с fine-tuning BERT через Hugging Face Transformers. Третий — временной ряд: прогноз продаж или веб-трафика с Prophet или LSTM, с метриками MAE/RMSE и анализом сезонности. Kaggle-медаль в любом соревновании весит больше pet-проекта и часто определяет исход скрининга.
Где в России искать первую вакансию Data Scientist?
Основные площадки: hh.ru (фильтр «Data Scientist» + «Junior» + «стажировка»), Хабр Карьера (IT-компании публикуют напрямую, конкуренция ниже чем на hh.ru), Telegram-каналы — «ML Jobs», «Data Science Jobs», «Вакансии для джунов». Стажировки с конкурентным отбором — Сбер AI, Т-Банк ML, Яндекс, VK — публикуются весной (март–май) и осенью (сентябрь–октябрь). Первый оффер чаще приходит через нетворк: Kaggle-комьюнити, митапы ODS (Open Data Science) и курсовые группы в Telegram.
Куда расти Data Scientist после уровня Middle?
После уровня Middle открываются три направления. Senior Data Scientist — углубление в конкретный домен (рекомендательные системы, CV, NLP) и менторство Junior-коллег. Lead/Principal — техническая экспертиза на уровне команды: проектирование ML-решений, выбор стека, review экспериментов. Research — сдвиг в applied research: публикации, работа над новыми архитектурами в R&D-командах Яндекса, Сбера, AIRI. Менеджерский путь — Head of ML или Chief Data Officer — требует управленческих навыков и понимания P&L. В 2026 году наиболее востребован путь Lead DS со специализацией в генеративном ИИ.
Какой уровень математики нужен Data Scientist?
Три обязательных раздела: линейная алгебра (матрицы, собственные векторы — для понимания PCA и нейросетей), теория вероятностей и математическая статистика (распределения, доверительные интервалы, проверка гипотез — для валидации моделей и A/B-тестов), математический анализ (производные, градиент — для понимания backpropagation). Уровень — прикладной, не олимпийский: нужно понимать, почему алгоритм работает, а не доказывать теоремы. Отсутствие этой базы критично при переходе от Junior к Middle — рекрутеры проверяют её на техническом интервью.
С чего начать обучение Data Science с полного нуля?
Последовательность из четырёх шагов. Первый — Python-базис: переменные, функции, циклы, работа с файлами — 4–6 недель. Второй — pandas + numpy + matplotlib на реальных датасетах из Kaggle — 6–8 недель. Третий — математика параллельно: Khan Academy (статистика и линейная алгебра) или профильный курс с проверяемыми заданиями. Четвёртый — scikit-learn: обучить первую модель (логрегрессия, дерево, gradient boosting), оценить через cross-validation, разобрать метрики качества. После — первое Kaggle-соревнование (начинать с «Titanic» или «House Prices»). Полный цикл до первого работающего ML-пайплайна — 3–4 месяца.

Профессия Data Scientist: навыки, стек, зарплата

Data Scientist строит ML-модели для бизнеса: классифицирует заявки, прогнозирует спрос, обучает рекомендательные системы и временные ряды. Роль не касается деплоя в прод и продуктовой аналитики, это территория MLOps и аналитиков данных. Страница рассказывает, что именно делает специалист, какой стек актуален в 2026 году, сколько платят на разных грейдах и откуда удобнее всего войти в профессию.

Чем занимается специалист по Data Science

Ядро работы — исследование данных, конструирование признаков и обучение моделей. Специалист проводит EDA, проверяет гипотезы через A/B-тесты, валидирует качество на отложенной выборке и описывает результаты так, чтобы бизнес мог принять решение. Он работает с табличными данными, текстом и изображениями. Граница роли заканчивается на воспроизводимом эксперименте с задокументированными метриками: деплой в прод берёт MLOps-инженер, а продуктовую аналитику (retention, воронки, BI) ведёт аналитик данных.

Стек и инструменты Data Science в 2026

Python остаётся единственным обязательным языком. Для табличных задач используют pandas и numpy, а в соревновательном ML предпочитают градиентный бустинг: XGBoost, LightGBM, CatBoost. Глубокое обучение строится на PyTorch с Lightning или TensorFlow, современный NLP и CV опираются на Hugging Face Transformers.

Для воспроизводимости и контроля экспериментов выстраивают отдельный слой:

  • Jupyter или Colab: интерактивное прототипирование и исследование данных
  • MLflow и Weights & Biases: трекинг метрик, параметров и артефактов
  • Optuna или Hyperopt: автоматический подбор гиперпараметров
  • Docker: воспроизводимая среда запуска

С большими объёмами данных работают через Apache Spark, оркестрацию пайплайнов обеспечивает Airflow. В 2026 году нормой стало использование AI-инструментов: Cursor и Claude Code ускоряют написание кода моделей, ChatGPT Pro помогает с разведочным анализом и ревью кода.

Зарплата Data Scientist в 2026

Уровень дохода зависит от сложности задач и специализации: специалисты с опытом в NLP и CV зарабатывают больше тех, кто работает только с таблицами. Зарубежные удалённые позиции дают двух-трёхкратный прирост уже на уровне Junior.

ГрейдМоскваРегионы
Junior150–220 тыс. ₽100–160 тыс. ₽
Middle280–450 тыс. ₽200–330 тыс. ₽
Senior500–800 тыс. ₽360–580 тыс. ₽
Lead700–1100 тыс. ₽500–790 тыс. ₽

Откуда приходят и куда растут

Удобнее всего войти из аналитики данных: 43% навыков пересекаются, A/B-тесты и EDA применяются напрямую. Python-разработчики переходят легко, язык и SQL уже есть, остаётся добавить математику и ML-библиотеки.

Дальше карьера разветвляется. В ML-инженеры шаг короткий: 41% навыков общие, Docker и Airflow уже знакомы. MLOps требует DevOps-навыков, зато прибавка к доходу около 30%. AI-инженерия предполагает работу с RAG и агентами, зарплаты выше в среднем на 19%.

Готов выбрать курс?

56 курсов для Data Scientists отранжированы по карте навыков. Выбирай и иди учиться.

Смотреть каталог →
Data Science: обучение, обязанности и зарплата 2026 | Skillmaps