Senior Data Scientist (ML разработчик)
- Предприятие: Москва, НЛМК-Информационные технологии
- Опыт работы: От 1 года до 3 лет
- График: Полный день, Полная занятость
Группа НЛМК - крупнейший в России и один из самых эффективных в мире производителей стальной продукции.
Открыта вакансия data-scientist в одном из проектов Группы НЛМК.
Чем предстоит заниматься:
- Трансформация бизнес запросов на язык машинного обучения: анализ запросов (проблематики) от производства; формирование возможных ML решений этих проблем;
- Поиск необходимых для задач данных и анализ качества;
- Подготовка данных для эксперимента;
- Постановка и проведение экспериментов с моделями, выбор наилучшего подхода;
- Выбор и обоснование метрики оценки качества;
- Объяснение простым языком результатов разработки ML модели;
- Написание чистого продакшн кода и выведение модели в работу;
- Постановка задач и управление аналитиком;
- Презентация и защита результатов исследования.
Для нас важно:
- Высшее техническое/математическое/экономическое;
- Знание методов математического моделирования, машинного обучения, статистики, оптимизации. Понимание задач регрессии, классификации, кластеризации; а также применения различных метрик качества к основным видам задач;
- Умение оперативно погрузиться в производственную задачу, изучить нюансы производства и технологий;
- Понимание методов интерпретации black box моделей (SHAP, Monoforest) и умение применять их на практике будет плюсом;
- Уверенное владение библиотеками Python (Numpy, Pandas, Sklearn, SciPy), умение визуализировать данные;
- Опыт работы с библиотеками машинного обучения XGBoost, CatBoost, Scikit-learn. Опыт анализа временных рядов, знание R forecast, Prophet – приветствуется;
- Опыт работы с TensorFlow (Keras) или PyTorch, знание основных архитектур нейросетей будет плюсом;
- Уверенное знание SQL. Опыт работы с Hadoop в качестве аналитика будет плюсом (Hive, Spark);
- Опыт работы с GitLab, Jira, Confluence.
Будет преимуществом:
- Опыт работы с Apache Spark (PySpark), Hadoop/Spark;
- Опыт работы с алгоритмами CV (классификация, сегментация, object detection);
- Опыт работы с продукционным стеком CV (TensorRT, Nvidia Deepstream, Docker, ONNX);
- Успешный опыт участия в конкурсах машинного обучения (kaggle и аналогичные);
- Опыт работы с временными рядами, обработкой текстовых данных.
Работа в Группе НЛМК - это:
- График работы 5/2 (возможен удаленный формат);
- Современный офис с инновационной зоной. В пешей доступности от метро «Полянка»;
- Конкурентный уровень заработной платы, годовые бонусы;
- Корпоративные льготы: ДМС, стоматология, льготное страхование родственников, банковские продукты сотрудникам и скидки партнеров;
- Обучение и развитие: английский язык в лучших языковых школах, большое количество обучающих курсов от внутреннего корпоративного университета, посещение митапов и конференций.