GitHub - kpdvstu/CloudCS-Lab1

Лабораторная работа № 1 "Изучение синхронного инференса с применением веб-сервиса"

Дисциплина: "Облачные вычислительные системы"

Цели и задачи работы:

Познакомиться с понятием инференса в системах машинного обучения.
Познакомиться с протоколом HTTP и микросервисной архитектурой.
Изучить принципы сохранения обученной модели.
Получить навыки проектирования и разработки веб-сервисов.

Теоретические сведения

Обычно система машинного обучения предполагает наличие этапов обучения и инференса. На первом из них системе подается на вход обучающая выборка, выполняется настройка параметров и подбор гиперпараметров, оценивается качество её работы. Результатом данного этапа является готовая модель, которая может быть использована для решения задачи, для которой она создавалась.

Инференсом называют процесс получения предсказания обученной модели машинного обучения для новых данных. Инференс принято подразделять на:

потоковый, в котором объекты с их признаковым описанием в достаточно большом количестве поступают потоком, например, с использованием Kafka. Для систем потокового инференса важна, в первую очередь, пропускная способность, определяющая количество объектов, обработанных моделью в единицу времени.
синхронный, в котором клиент, отправивший объект в систему для инференса, ожидает ответа. Такие системы обрабатывают объекты поодиночке, но должны делать это быстро, чтобы задержка обработки данных и время ожидания клиента были небольшими.
асинхронный, в котором клиент может оправить объект в систему и сразу отключиться от нее. Позже, он обращается вновь к системе и проверяет, обработаны ли его данные, и, если да, то получает их. Такая модель инференса применяется, как правило, к данным, которые не могут быть обработаны в пределах времени ожидания клиента.

В данной работе студенту предлагается реализовать синхронную модель инференса, в которой система, обрабатывающая клиентские данные, представлена в виде веб-сервиса.

Веб-сервисом называют обладающую уникальным веб-адресом (URL) программную систему, построенную на базе открытых протоколов / стандартов и применяющуюся для обмена данными между приложениями или системами. Различные приложения используют веб-сервисы для обмена информацией друг с другом по компьютерной сети с использованием HTTP-протокола. Одним из широко распростаненных архитектурных стилей построения веб-сервисов является REST, требующий выполнения определенных принципов, введенных Роем Филдингом:

Клиент-серверная модель.
Отсутствие сохранения состояния.
Единообразие интерфейса.
Кэшируемость.
Многоуровневая система.
Предоставление кода по требованию.

Для работы с ресурсами в REST используют методы HTTP, а информация пересылается между клиентом и сервером с использованием распространенных форматов (чаще всего, JSON или XML).

Спецификацией для описания REST API является OpenAPI, ставший стандартом для описания программного интерфейса с большим количеством сопутствующих инструментов и сервисов. Данная спецификация предполагает независимость от языков программирования, и удобна в использовании как человеком, так и программными системами. Для языка Python создан высокопроизводительный веб-фреймворк FastAPI, использующий стандарт OpenAPI для определения своего программного интерфейса.

В данной работе сервис инференса получает данные с признаковым описанием и отправляет результаты клиенту в формате JSON.

Порядок выполнения работы

Создайте папку на компьютере для проекта и склонируйте в нее содержимое репозитория:

git clone https://github.com/kpdvstu/CloudCS-Lab1.git

Изучите содержимое проекта. Директория notebooks содержит ноутбук для обучения и сохранения модели, в data хранится датасет, в models — готовые к инференсу модели (данная директория первоначально отсутствует в проекте, она будет создана при выполнении кода в ноутбуке). Папки src и test содержат исходный код и модульные тесты для веб-сервиса.
Изучите содержание ноутбука и выполните все его ячейки. Убедитесь, что модель обучилась с хорошим качеством и сохранилась в папке models.
Изучите код сервиса для инференса (для удобства его можно открыть в любой среде разработки, например, PyCharm).
Установите виртуальное окружение с версией питона 3.10 и необходимые зависимости (в терминале или среде разработки):

conda create -n cloudsc-env python=3.10

conda activate cloudsc-env

pip install -r requirements.txt

Запустите модульные тесты и убедитесь, что они выполнились успешно:

PYTHONPATH=./:./src/ pytest test

Тесты можно запустить и с использованием встроенных средств среды разработки.

Перейдите в директорию с исходным кодом сервиса:

cd src/

Запустите веб-сервис для инференса:

MODEL_PATH="../models/pipeline.pkl" uvicorn main:app

Проверьте работоспособность сервиса в браузере по адресу http://localhost:8000/docs Открывшуюся страницу можно использовать для отправки запросов сервису и получения ответов от него.
С использованием curl (или любого другого клиента, например, telnet, PuTTY, Postman и др.) выполните следующие запросы. Дождитесь ответов от сервиса. Обратите внимание, что для выполнения инференса сервис требует авторизации клиента, ожидая от него Bearer Token. Корректный токен в данной тестовой задаче — строка из пяти нулей.

curl http://localhost:8000/healthcheck

curl -X POST http://localhost:8000/predictions -H "Authorization: Bearer 00000" -H 'Content-Type: application/json' -d '{"cylinders": 4, "displacement": 113.0, "horsepower": 95.0, "weight": 2228.0, "acceleration": 14.0, "model_year": 71, "origin": 3}'

curl -X POST http://localhost:8000/predictions -H 'Content-Type: application/json' -d '{"cylinders": 4, "displacement": 113.0, "horsepower": 95.0, "weight": 2228.0, "acceleration": 14.0, "model_year": 71, "origin": 3}'

curl -X POST http://localhost:8000/predictions -H "Authorization: Bearer 00002" -H 'Content-Type: application/json' -d '{"cylinders": 4, "displacement": 113.0, "horsepower": 95.0, "weight": 2228.0, "acceleration": 14.0, "model_year": 71, "origin": 3}'

Проанализируйте отправленные запросы и полученные ответы. Сделайте выводы.

Индивидуальное задание

Данная лабораторная работа является составной частью курсовой работы, защищаемой студентами в конце семестра. При выполнении лабораторной работы можно использовать любые языки и фреймворки, позволяющие выполнить поставленную задачу.

Реализуйте или возьмите готовую модель машинного обучения, для которой Вы будете реализовывать синхронный инференс, аналогичный рассматриваемому в примере. Модель может быть любой работоспособной, её сложность значения не имеет. Варианты получения модели могут быть любыми:

написать самостоятельно;
найти подходящую на Kaggle или в любом другом хранилище моделей;
использовать уже ранее созданную и обученную модель (например, в рамках дисиплины "Машинное обучение и нейросетевые модели" или магистерской диссертации), и т.д.

!!! При выборе модели обратите внимание, что скрипт или ноутбук, реализующий ее обучение, должны сохранять не только саму модель, но и все этапы предварительной обработки данных в виде, например, Scikit-Learn Pipeline (как в рассматриваемом примере). Сохранения только весов обученной модели недостаточно! На вход конвейер должен получать сырые, необработанные данные, а всю их обработку и применение модели к ним должно обеспечиваться различными этапами сохраненного конвейера! Сохранение конвейера можно дописать к существующей модели, но для этого он должен быть!

Обучите выбранную модель, проконтролируйте качество ее обучения и сохраните для дальнейшего использования.
Используя представленный в лабораторной работе пример сервиса как шаблон, создайте свой собственный сервис для инференса выбранной Вами модели. Реализуйте модульные тесты для сервиса. Авторизацию клиента оставьте такой же, как в примере.
Добейтесь работоспособности сервиса, продемонстрируйте корректную обработку запросов преподавателю.
Создайте свой репозиторий на GitHub с разработанным проектом. Реализуйте CI-конвейер в GitHub Actions для тестирования сервиса, убедитесь в его работоспособности.
Оформите первую главу пояснительной записки к курсовой работе, описав в ней следующие моменты:

Постановку задачи.
Краткое описание разработанной или выбранной модели со ссылкой на ее расположение (не более пары страниц), для решения какой задачи она используется.
Описание API сервиса (какие ресурсы поддерживает сервис, какие методы к нему применяются, какие данные и какого формата передаются, какие коды ответов сервис возвращает в различных ситуациях, как сервер реагирует на ошибочные запросы, и т.д.).
Описание проектирования и реализации сервиса с использованием выбранного фреймворка, фрагменты кода наиболее важных функций с их описанием.
Тестирование работоспособности сервиса и CI (содержание запросов, содержание ответов, демонстрация корректной обработки сервисом различных сценариев, возникающих в процессе его использования (в том числе, ошибочных), скрины с результатами тестирования и их пояснением).
Выводы по главе с анализом полученных результатов.

Список вопросов к отчету работы

Жизненный цикл системы машинного обучения. Методология CRISP-DM.
Понятие инференса, виды инференса.
Понятие и назначение протокола HTTP. История и версии протокола.
Понятие ресурса в HTTP. Понятие URL (URI), его формат.
Этапы работы HTTP. Структура запросов и ответов.
MIME-типы, их назначение и характеристика.
Методы протокола HTTP. Безопасность, идемпотентность и кэшируемость.
Заголовки HHTP: общие, запросов, ответов, содержимого.
Коды ответов сервера и их интерпретация.
Управление кэшированием в HTTP.
Понятие веб-сервисов. Архитектура веб-сервисов.
Архитектурный стиль REST, принципы проектирования RESTful-сервисов.
Реализация CRUD в REST.
Модели зрелости REST по Ричардсону.
Понятие микросервисной архитектуры. Её преимущества и недостатки. Сравнение с монолитным приложением.
Стандарт OpenAPI для описания REST API. Основные особенности. Примеры фреймворков, поддерживающих OpenAPI.

Список литературы для подготовки к отчету

Хапке, Х. Разработка конвейеров машинного обучения : руководство / Х. Хапке, К. Нельсон ; перевод с английского Н. Б. Желновой. — Москва : ДМК Пресс, 2021. — 346 с. — ISBN 978-5-97060-886-9. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/241088 (дата обращения: 27.02.2023).
Поллард, Б. HTTP/2 в действии : руководство / Б. Поллард ; перевод с английского П. М. Бомбаковой. — Москва : ДМК Пресс, 2021. — 424 с. — ISBN 978-5-97060-925-5. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/241037 (дата обращения: 27.02.2023).
Fielding, R.T. Architectural Styles and the Design of Network-based Software Architectures: dissertation ... doctor of philosophy in Information and Computer Science / Fielding, R.T. - Irvine, 2000. - URL: https://www.ics.uci.edu/~fielding/pubs/dissertation/top.htm (дата обращения: 27.02.2023).
OpenAPI Initiative [Электронный ресурс] : документация по спецификации OpenAPI. – [2023]. – Режим доступа : https://www.openapis.org/ (дата обращения: 27.02.2023).
FastAPI [Электронный ресурс] : документация по фреймворку FastAPI. – [2023]. – Режим доступа : https://fastapi.tiangolo.com/ (дата обращения: 27.02.2023).

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
.github/workflows		.github/workflows
.idea		.idea
data		data
notebooks		notebooks
src		src
test		test
.gitignore		.gitignore
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Лабораторная работа № 1 "Изучение синхронного инференса с применением веб-сервиса"

Дисциплина: "Облачные вычислительные системы"

Цели и задачи работы:

Теоретические сведения

Порядок выполнения работы

Индивидуальное задание

Список вопросов к отчету работы

Список литературы для подготовки к отчету

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Лабораторная работа № 1 "Изучение синхронного инференса с применением веб-сервиса"

Дисциплина: "Облачные вычислительные системы"

Цели и задачи работы:

Теоретические сведения

Порядок выполнения работы

Индивидуальное задание

Список вопросов к отчету работы

Список литературы для подготовки к отчету

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages