Skip to content

Zerrant2/Laba4

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 

Repository files navigation

Лабораторная работа №4: Обработка и визуализация данных (Data Science)

📌 Цели работы

  1. Освоение интерактивной среды разработки Jupyter Notebook / Google Colab.
  2. Изучение библиотеки NumPy для выполнения векторно-матричных вычислений без использования циклов.
  3. Изучение библиотек Pandas, Matplotlib и Seaborn для разведочного анализа данных (EDA) и визуализации.

🛠 Технологии

  • Python 3.10
  • NumPy (Матричные операции, линейная алгебра)
  • Pandas (Работа с датафреймами, фильтрация, группировка)
  • Matplotlib / Seaborn (Построение графиков и гистограмм)

📝 Индивидуальное задание (Вариант 5)

Часть 1. NumPy (Векторные вычисления)

Задача: Вычислить значения выражений $f$ и $g$ на основе сгенерированных матриц $M, N$ и векторов $p, q$ без использования циклов for (только векторизация).

Формулы варианта:

  1. $v_i = M_{84-i, 84-i} + 2 N_{i,i}$
  2. $f = \mathbf{p} \cdot \text{Tr}(\mathbf{q}\mathbf{v}^T)$
  3. $g = ||\mathbf{q}^T \mathbf{N}||_1$

Часть 2. Pandas (Анализ данных "Титаник")

Задача: Провести анализ датасета пассажиров Титаника. Выполненные пункты:

  1. Оценка пропущенных значений.
  2. Расчет средней цены билета для пассажиров, путешествующих без родственников (одиночек).
  3. Анализ выбросов в цене билетов (Boxplot).
  4. Проверка гипотезы: "Чем больше родственников у человека, тем выше его шанс погибнуть".
  5. Предобработка данных: удаление лишних столбцов (Name), One-Hot Encoding пола, MinMax-нормировка числовых признаков.
  6. Визуализация распределения возраста и пола по классам кают.

📂 Файлы и запуск

Работы выполнены в формате Jupyter Notebook (.ipynb). Вы можете просмотреть их прямо на GitHub или открыть в Google Colab.

Задание Файл в репозитории Ссылка на Colab (Опционально)
NumPy (Матрицы) Ivanov_Lab3_NumPy.ipynb Открыть в Colab
Pandas (Титаник) lab3_TP_Pandas_Tasks.ipynb Открыть в Colab

(Примечание: Для корректного отображения графиков в GitHub используйте nbviewer, если они не прогружаются).


📊 Выводы

В ходе работы были освоены методы эффективной работы с данными в Python.

  • Реализованы сложные математические вычисления с использованием векторизации NumPy, что значительно ускоряет обработку данных по сравнению со стандартными списками Python.
  • Проведен полноценный анализ датасета Титаника: выявлены зависимости между размером семьи и выживаемостью, а также проанализировано ценообразование билетов.

Ссылка для скачивания

About

Laba 4 programming

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors