
Data science
Изучи Data science углубленно за 6 месяцев
Информация о преподавателе

Нурбек Саиднасим
Data Scientist
Data Scientist
Навыки
С#
ASP .Net
.Net Core
WebAPI
EF Core
Nginx
Azure
Git
Kafka
PostgreSQL
CI/CD
Elasticearch
Linux
Solidity
MSSQL
О проекте
Курс «Data Science: Практика анализа данных и машинного обучения» — это прикладной онлайн-курс, ориентированный на получение востребованных навыков в сфере анализа данных, статистики и машинного обучения. Участники курса с самого начала будут работать с реальными данными и научатся применять инструменты анализа на практике: от загрузки и очистки данных до построения и развертывания моделей машинного обучения.
195 академических часов
Язык обучения – Русский
Длительность курса - 26 недель
Стоимость курса – 600.000 KZT
Процесс отбора студентов, предполагает 3 этапа

Тестирование
Прохождение тестового задания.

Мотивационное письмо
Оценка резюме и мотивационных писем.

Интервью
Интервью с преподавателем и куратором курса.
Критерии отбора студентов
-
Выполнение тестового задания должно быть не менее чем на 70% от максимально возможного количества баллов.
-
Получение не менее 7 баллов из 10, при оценке мотивационных писем.
-
Положительное решение о допуске к курсу по итогам интервью с преподавателем и куратором курса
Кому подойдет курс?

Кто уже работает
Кто хочет сменить профессию, и кому требуется удаленная работа в IT-сфере

Студентам
Которые хотят развиваться в новом и современном направлений

Разработчикам
Кто хочет закрепить свои знания практикой
Программа курса
-
1.1. Настройка среды разработки (Python, Jupyter, VS Code, Git)
-
1.2. Загрузка реальных наборов данных (Kaggle, UCI, открытые API)
-
1.3. Написание скриптов Python для загрузки, анализа и сохранения данных
-
1.4. Использование Git для контроля версий (основные команды)
-
1.5. Практика: загрузить, очистить и сохранить набор данных
-
2.1. Загрузка «грязных» CSV/Excel файлов с кодировками и пропущенными значениями
-
2.2. Умный фильтр, сортировка, группировка больших таблиц
-
2.3. Создание вычисляемых столбцов и показателей (KPI)
-
2.4. Преобразование данных: pivot и melt
-
Практика: очистка и анализ HR или продаж
-
3.1. Создание EDA-ноутбуков и мини-отчетов
-
3.2. Визуализация распределений, выбросов, корреляций
-
3.3. Анализ сезонности, трендов и пробелов в данных
-
3.4. Практика: полный EDA реального датасета (Airbnb, Titanic и др.)
-
4.1. Извлечение признаков из дат, текста, категорий
-
4.2. Бининг числовых признаков в интервалы
-
4.3. Кодирование категориальных признаков (в том числе high-cardinality)
-
4.4. Практика: подготовка признаков для задачи предсказания цен
-
5.1. Построение графиков (гистограммы, боксплоты, тепловые карты)
-
5.2. Создание интерактивных отчетов с помощью Streamlit или Plotly
-
5.3. Практика: построение визуального отчета по реальному датасету (финансы, прокат велосипедов и т.д.)
-
6.1. Построение моделей с использованием scikit-learn
-
6.2. Разделение на train/test, кросс-валидация
-
6.3. Метрики: точность, recall, F1, ROC-AUC, MAE
-
6.4. Практика 1: предсказание оттока клиентов
-
6.5. Практика 2: предсказание цен на жильё или объема продаж
-
7.1. Отбор признаков: какие переменные реально важны?
-
7.2. Настройка гиперпараметров (GridSearchCV, RandomizedSearchCV)
-
7.3. Проверка на переобучение и утечку данных
-
7.4. Практика: тюнинг нескольких моделей и сравнение результатов
-
8.1. Сохранение модели (Pickle, Joblib)
-
8.2. Создание API с помощью FastAPI
-
8.3. Тестирование модели через Postman или простую веб-форму
-
8.4. Практика: развернуть модель скоринга кредита
-
9.1. Сегментация клиентов с помощью k-Means
-
9.2. Снижение размерности с PCA для визуализации
-
9.3. Практика: сегментация клиентов на основе транзакций
-
10.1. Работа с датами и временными индексами
-
10.2. Построение трендов, скользящие средние
-
10.3. Прогнозирование с помощью Prophet или ARIMA
-
10.4. Практика: прогнозирование спроса или трафика
-
11.1. Очистка и нормализация текста (стоп-слова, токенизация)
-
11.2. Векторизация текста (TF-IDF)
-
11.3. Классификация текста (напр. спам или тональность)
-
11.4. Практика: анализ отзывов пользователей или твитов
-
12.1. Выбор своей темы и набора данных
-
12.2. Построение решения от EDA до модели и отчета
-
12.3. Презентация результатов с визуализациями или веб-интерфейсом