Skip to content

Портфолио проектов Data Science, выполненных в рамках профессиональной переподготовки в Яндекс.Практикум. Включает исследования в области финансов, недвижимости, кинопроката и других, с использованием статистики, машинного обучения и анализа данных.

Notifications You must be signed in to change notification settings

Verbasik/Yandex.Practicum.DataScience

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Проекты Data Science. Яндекс.Практикум (Школа Анализа Данных)

Специалист по Data Science (2023 — 2024)

logo_DS+ Certificate

В данном репозитории собраны проекты, выполненные в процессе обучения по программе профессиональной переподготовки Специалист по Data Science в Яндекс.Практикум

Проект Описание Библиотеки     Навыки    
Исследование надёжности заёмщиков Исследование факторов, влияющих на факт возврата кредита в срок, на основе статистики о платёжеспособности клиентов. Pandas NumPy Data Analysis
Финансовый_анализ
Исследование объявлений о продаже квартир Анализ рынка недвижимости Санкт-Петербурга и Ленинградкой области, выявление аномалий для отслеживания мошеннической деятельности. Pandas NumPy Matplotlib Seaborn Data Analysis
Маркетинг_анализ
Исследование о показах фильмов в Российских кинотеатрах Анализ рынка российского кинопроката, выявление текущих тенденций. Pandas NumPy Matplotlib Seaborn Data Analysis
Маркетинг_анализ
Исследование сервиса аренды самокатов "GoFast" Исследовательский анализ данных сервиса аренды самокатов "GoFast". Статистический анализ и проверка гипотез. Pandas NumPy Matplotlib Seaborn Scipy Data Analysis
Статистический_анализ
Построение модели для задачи классификации тарифов мобильной связи Построение и поиск оптимальной модели для задачи классификации тарифов мобильной связи. Исследование и проверка качества разных моделей. Pandas NumPy Matplotlib Seaborn Sklearn Data Science
Машинное обучение
Построение модели для задачи прогнозирования оттока клиентов из «Бета-Банка» Построение и поиск оптимальной модели для задачи прогнозирования оттока клиентов из «Бета-Банка». Исследование и проверка качества разных моделей. Pandas NumPy Matplotlib Seaborn Sklearn Data Science
Машинное обучение
Построение модели выбора локации для скважины Требуется построить модель машинного обучения, которая поможет определить регион, где добыча нефти принесёт наибольшую прибыль. Pandas NumPy Matplotlib Seaborn Sklearn Data Science
Машинное обучение
Построение модели предсказания отказа от брони для сети отелей «Как в гостях» Требуется разработать модель машинного обучения, которая будет прогнозировать отказ посетителей от брони в отеле. После внедрения модели, чистая прибыль компании должна увеличиться +400k. Pandas NumPy Matplotlib Seaborn Sklearn Keras Tensorflow Data Science
Машинное обучение
Работа с базой данных Yandex_Hive и анализ данных Мы будем работать с базой данных Yandex-Hive, которая хранит информацию о венчурных фондах и инвестициях в компании-стартапы. pyspark pyspark.sql Data Science
СУБД
Построение модели классификации музыкальных произведений по жанрам Требуется разработать модель машинного обучения, позволяющую классифицировать музыкальные произведения по жанрам. Pandas NumPy Matplotlib Seaborn Sklearn Data Science
Машинное обучение
Построение модели для предсказания медианной стоймости дома Разработать модель линейной регрессии в среде PySpark, позволяющей предсказать медианную стоимость домов. Pandas NumPy Matplotlib Seaborn Sklearn PySpark MLlib Data Science
Машинное обучение
Защита персональных данных клиентов Требуется разработать такой метод преобразования данных, чтобы по ним было сложно восстановить персональную информацию. Pandas NumPy Sklearn Data Science
Машинное обучение
Линейная алгебра
Определение стоймости автомобилей Создать модель, способную с высокой точностью предсказывать стоймость автомобиля на рынке. Pandas NumPy Sklearn CatBoostRegressor LGBMRegressor DummyRegressor RandomForestRegressor Data Science
Машинное обучение
Matching Разработать алгоритм, который для всех товаров из одного множества, предложит несколько вариантов наиболее похожих товаров из другого множества. Pandas NumPy Sklearn faiss optuna lightgbm Data Science
Алгоритмы
Продвинутый SQL Состоит из двух частей на 20 задач на составление запросов к базе данных (PostgreSQL) StackOverFlow за 2008 год. SQL PostgreSQL оконные функции временные таблиц подзапросы продвинутые функции SQL Data Analysis
Работа с БД
Прогнозирование температуры звезды Разработка метода определения температуры на поверхности обнаруженных звёзд с использованием нейросетевого подхода. Pandas NumPy Sklearn torch skorch optuna Data Science
Машинное обучение
Оценка риска ДТП Создать систему, которая может оценить риск ДТП по выбранному маршруту движения. Pandas NumPy Matplotlib Seaborn Scipy Sklearn Data Science
Машинное обучение
Прогнозирование заказов такси Создать модель, способную с высокой точностью предсказывать количество заказов такси на следующий час. NumPy Pandas Seaborn Matplotlib CatBoost Scipy Sklearn Statsmodels Prophet Sklearn XGBoost Data Science
Машинное обучение Временные ряды
Classification of Text Целью проекта является разработка модели бинарной классификации в связки с моделью трансформером BERT. NumPy Pandas sklearn torch transformers Data Science
Машинное обучение
ResNet_Age_detect Целью проекта является разработка модели, которая по фотографии будет определять приблизительный возраст человека NumPy Pandas sklearn tensorflow keras Data Science
Computer Vision
Поиск изображений по текстовым запросам Разработка демонстрационной версии системы поиска изображений по текстовым запросам, использующей нейросетевой подход для анализа и сопоставления изображений и текстов NumPy Pandas sklearn nltk torch tensorflow Data Science
Computer Vision
Предсказание температуры стали на металлургическом комбинате Разработка модели для предсказания температуры стали на этапе обработки. Модель будет использоваться для имитации технологического процесса и оптимизации производственных расходов за счёт контроля температуры сплава. NumPy Pandas sklearn nltk torch tensorflow Data Science
Машинное обучение

About

Портфолио проектов Data Science, выполненных в рамках профессиональной переподготовки в Яндекс.Практикум. Включает исследования в области финансов, недвижимости, кинопроката и других, с использованием статистики, машинного обучения и анализа данных.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published