Данные проекты были выполнены в ходе обучения в Яндекс.Практикум, профессия "Специалист по Data Science".
| Название проекта | Описание проекта | Используемые библиотеки |
|---|---|---|
| Исследование надежности заемщиков | Исследование факторов, влияющих на возврат/невозврат кредита в срок для создания модели кредитного скоринга | Pandas, Plotly Express, PyMystem3 |
| Исследование рынка недвижимости в Санкт-Петербурге | Анализ рынка вторичной недвижимости в Санкт-Петерурге и Ленинградской области, выявление аномалий для создания модели антифрода | Pandas, Matplotlib, Seaborn |
| Исследование тарифов мобильного оператора | Анализ поведения клиентов мобильного оператора с целью определения более выгодного тарифа | Pandas, Matplotlib, Seaborn, NumPy, SciPy |
| Анализ игровой индустрии | Анализ рынка игр и платформ в Европе, Северной Америке и Японии для планирования рекламной кампании | Pandas, Matplotlib, Seaborn, NumPy, SciPy |
| Рекоментация тарифов мобильной связи | Создание модели машинного обучения, анализирующей поведение пользователей, с целью предложения более выгодного тарифа | Pandas, Matplotlib, Seaborn, Sklearn |
| Прогнозирование оттока клиентов банка | Создание модели машинного обучения, прогнозирующей, уйдет клиент из банка в ближайшее время или нет | Pandas, Matplotlib, Seaborn, Sklearn, SciPy |
| Выбор локации нефтяной скважины | Определение региона, где добыча нефти принесет наибольшую прибыль, а также анализ возможных рисков | Pandas, Matplotlib, Seaborn, Sklearn, Bootstrap |
| Прогнозирование восстановления золота из руды | Создание модели машинного обучения для определения коэффициента восстановления золота | Pandas, Matplotlib, Seaborn, Sklearn |
| Шифрование персональных данных клиентов страховой компании | Разработка такого метода преобразования данных, чтобы по ним было сложно восстановить персональную информацию, и чтобы в результате преобразования качество моделей не ухудшилось | Pandas, Matplotlib, Seaborn, Sklearn, NumPy |
| Определение стоимости подержанных автомобилей | Создание модели машинного обучения для определения стоимости подержанных автомобилей по их характеристикам | Pandas, Matplotlib, Seaborn, Sklearn, LightGBM, CatBoost |
| Прогнозирование спроса на такси | Прогнозирование спроса на такси в аэропортах на следующий час | Pandas, Matplotlib, Seaborn, Sklearn, LightGBM, CatBoost |
| Определение токсичных комментариев | Создание модели машинного обучения для определения токсичности англоязычных комментариев | Pandas, Sklearn, PyTorch, Transformers, BERT |
| Прогнозирование оттока клиентов телеком-оператора | Прогнозирование оттока клиентов телеком-оператора на основании поведения клиентов за последние 4 месяца | Pandas, Sklearn, SciPy, LightGBM, Matplotlib, Seaborn |