Обязанности:

Подготовка данных для валидации:
- сбор выборок, целевых переменных (таргетов) и признаков из распределённых хранилищ данных;
- формирование и проверка SAMPLE, TARGET, FEATURES-наборов;
- проверка качества данных: дубликаты, пропуски, выбросы, смещение распределений;
- анализ датасетов на соответствие техническим и бизнес-требованиям.
Поддержка валидационных проектов:
- участие в валидации моделей разных продуктов (CLTV, Antifraud, CC, Corp MMB и др.);
- поддержка различных веток валидации (с разной логикой сбора данных и таргетов).

Требования:

- Опыт работы с SQL / Impala (написание сложных запросов, оптимизация);
- Опыт работы с Hadoop / Spark (работа с большими объёмами данных);
- Знание базовых статистических метрик для моделей (KS, PSI, GINI, AUC, IV);
- Опыт обработки и подготовки данных: pandas, PySpark;
- Опыт работы с Jupyter Notebook;
- Базовое понимание ML-моделей (классификация, регрессия, калибровка);
- Внимательность к деталям и аккуратность при работе с данными;
- Готовность работать с регуляторной документацией.

Что мы предлагаем:

- Стабильный и прозрачный доход: размер заработной платы обсуждается по итогам собеседования;
- Корпоративные и внешние программы обучения;
- Чувство локтя: у нас дружелюбная атмосфера и команда лучших профессионалов, которые готовы делиться с тобой экспертизой;
- Забота о твоем здоровье: программа ДМС, куда входит стоматология и обслуживание в лучших клиниках города, скидки на абонементы в фитнес-клубы, неформальные спортивные сообщества;
- Возможности для разнообразного досуга: скидки на услуги туристических агентств, продукты питания, в рестораны и бары, в магазины и салоны красоты;
- Предложения от банка только для сотрудников: льготные условия обслуживания на карты Cash Back и другие предложения.

Подготовка данных для валидации: - сбор выборок, целевых переменных (таргетов) и признаков из распределённых хранилищ данных; - формирование и проверка SAMPLE, TARGET, FEATURES-наборов; - проверка качества данных: дубликаты, пропуски, выбросы, смещение распределений; - анализ датасетов на соответствие техническим и бизнес-требованиям. Поддержка валидационных проектов: - участие в валидации моделей разных продуктов (CLTV, Antifraud, CC, Corp MMB и др.); - поддержка различных веток валидации (с разной логикой сбора данных и таргетов). - Опыт работы с SQL / Impala (написание сложных запросов, оптимизация); - Опыт работы с Hadoop / Spark (работа с большими объёмами данных); - Знание базовых статистических метрик для моделей (KS, PSI, GINI, AUC, IV); - Опыт обработки и подготовки данных: pandas, PySpark; - Опыт работы с Jupyter Notebook; - Базовое понимание ML-моделей (классификация, регрессия, калибровка); - Внимательность к деталям и аккуратность при работе с данными; - Готовность работать с регуляторной документацией. - Стабильный и прозрачный доход: размер заработной платы обсуждается по итогам собеседования; - Корпоративные и внешние программы обучения; - Чувство локтя: у нас дружелюбная атмосфера и команда лучших профессионалов, которые готовы делиться с тобой экспертизой; - Забота о твоем здоровье: программа ДМС, куда входит стоматология и обслуживание в лучших клиниках города, скидки на абонементы в фитнес-клубы, неформальные спортивные сообщества; - Возможности для разнообразного досуга: скидки на услуги туристических агентств, продукты питания, в рестораны и бары, в магазины и салоны красоты; - Предложения от банка только для сотрудников: льготные условия обслуживания на карты Cash Back и другие предложения.