Payload Manager

Payload Manager is a high-performance control plane for managing opaque binary payloads across multiple storage tiers (GPU, RAM, disk, object storage, or void) without routing payload bytes through the service itself.

The platform is designed around a strict control-plane/data-plane split:

Control plane: metadata, placement, leases, lineage, lifecycle, and APIs.
Data plane: direct producer/consumer access to memory regions, files, or object references.

Why Payload Manager

Modern pipelines often spend more time moving bytes through orchestration services than doing useful work. Payload Manager avoids this by returning descriptors and leases so clients can access data directly from the selected tier.

Core capabilities

Tier-aware placement across GPU, RAM, disk, object storage, and void (discard-on-eviction).
Lease-based read stability for payload access.
Lifecycle orchestration (allocate -> commit -> active -> expire/delete).
Metadata and lineage tracking.
Multiple repository backends (memory, SQLite, PostgreSQL).
gRPC service interfaces for admin, data, catalog, and stream workflows.

Architecture at a glance

Browser / HTTP clients
   |
   v
gRPC-Gateway  (REST → gRPC, embedded Svelte UI, OpenAPI docs)
   |
   v
gRPC Servers (admin/data/catalog/stream)
   |
   v
Service Layer (lifecycle, placement, leasing, metadata, streams)
   |
   v
Repository API (transaction + persistence abstraction)
   |
   +--> Memory
   +--> SQLite
   +--> PostgreSQL

Placement + Tiering + Spill
   |
   +--> GPU (CUDA IPC)
   +--> RAM (shared memory)
   +--> Disk
   +--> Object storage
   +--> Void (delete on eviction)

For detailed documentation, see:

Build

mkdir -p build
cd build
cmake ..
cmake --build .

Optional CMake flags:

-DPAYLOAD_MANAGER_ENABLE_SQLITE=ON
-DPAYLOAD_MANAGER_ENABLE_POSTGRES=ON
-DPAYLOAD_MANAGER_ENABLE_OTEL=ON (builds OpenTelemetry support from third_party/opentelemetry-cpp)
-DPAYLOAD_MANAGER_ENABLE_ARROW_CUDA=ON (enables GPU tier runtime support in the service via Arrow CUDA)

Client build switch:

C++ CUDA-capable client build: -DPAYLOAD_MANAGER_CLIENT_ENABLE_CUDA=ON

To build with OpenTelemetry enabled:

git submodule update --init --recursive
cmake -S . -B build-otel -DPAYLOAD_MANAGER_ENABLE_OTEL=ON
cmake --build build-otel

Run

./payload-manager --config config.yaml

Docker

All Dockerfiles and Compose manifests now live under docker/.

Dockerfiles

Dockerfile	OTEL	GPU	Use
`docker/Dockerfile`	Off	Off	Lightweight production image
`docker/Dockerfile.otel`	On	Off	Production image with OpenTelemetry
`docker/Dockerfile.cuda`	On	On	GPU-capable image with OpenTelemetry
`docker/Dockerfile.gateway`	—	—	gRPC-Gateway + embedded Svelte UI

# No-OTEL image (default)
docker build -f docker/Dockerfile -t payload-manager:latest .

# OTEL-enabled image
docker build -f docker/Dockerfile.otel -t payload-manager:otel .

# GPU + OTEL image
docker build -f docker/Dockerfile.cuda -t payload-manager:cuda .

# payloadctl CLI image
docker build -f docker/Dockerfile.payloadctl -t payloadctl:latest .

Docker Compose

Full compose matrix — pick one backend × feature combination:

Compose file	Database	OTEL	GPU	Host port
`docker/docker-compose.sqlite.yml`	SQLite	Off	Off	50052
`docker/docker-compose.postgres.yml`	Postgres	Off	Off	50051
`docker/docker-compose.otel.sqlite.yml`	SQLite	On	Off	50054
`docker/docker-compose.otel.postgres.yml`	Postgres	On	Off	50055
`docker/docker-compose.gpu.sqlite.yml`	SQLite	On	On	50053
`docker/docker-compose.gpu.postgres.yml`	Postgres	On	On	50056
`docker/docker-compose.gateway.yml`	SQLite	Off	Off	8080 (HTTP)

# SQLite, no OTEL
docker compose -f docker/docker-compose.sqlite.yml up --build

# Postgres, no OTEL
docker compose -f docker/docker-compose.postgres.yml up --build

# SQLite + OTEL (add observability stack)
docker compose -f docker/docker-compose.otel.sqlite.yml -f docker/docker-compose.observability.yml up --build

# Postgres + OTEL (add observability stack)
docker compose -f docker/docker-compose.otel.postgres.yml -f docker/docker-compose.observability.yml up --build

# GPU + SQLite + OTEL (add observability stack)
docker compose -f docker/docker-compose.gpu.sqlite.yml -f docker/docker-compose.observability.yml up --build

# GPU + Postgres + OTEL (add observability stack)
docker compose -f docker/docker-compose.gpu.postgres.yml -f docker/docker-compose.observability.yml up --build

The docker/docker-compose.observability.yml overlay adds Grafana Alloy (OTLP receiver), Prometheus, Grafana (:3000), and Tempo. It should only be layered on OTEL-enabled compose files.

payloadctl

payloadctl supports tiering advisory commands that are useful during placement tuning and spill control:

# Best-effort hint to stage a payload in a faster tier.
payloadctl <addr> prefetch <uuid> <tier=ram|disk|gpu>

# Best-effort advisory pin. duration_ms=0 means "stay pinned until explicit unpin".
payloadctl <addr> pin <uuid> [duration_ms]

# Removes an active pin (idempotent if the payload is already unpinned).
payloadctl <addr> unpin <uuid>

Behavior notes:

prefetch is best-effort and idempotent; it does not guarantee immediate movement.
pin blocks spill while active. Use a finite duration_ms for bounded pinning windows.
unpin is safe to call repeatedly and is a no-op when no pin exists.

Clients (CPU vs CUDA)

C++ client build modes:

# CPU-focused (default)
cmake -S . -B build
cmake --build build

# CUDA-capable build intent (requires Arrow CUDA artifacts)
cmake -S . -B build-cuda -DPAYLOAD_MANAGER_CLIENT_ENABLE_CUDA=ON
cmake --build build-cuda

Python client install modes:

# CPU-safe base install
pip install ./client/python

# Explicit CUDA-capable install intent
pip install './client/python[cuda]'

Current GPU client runtime status:

C++ client: GPU descriptor runtime handling is implemented when built with -DPAYLOAD_MANAGER_CLIENT_ENABLE_CUDA=ON and Arrow CUDA libraries are available.
Python client: GPU descriptor read/write runtime handling is implemented when installed with CUDA extras and Arrow CUDA dependencies are available.
Result: Both C++ and Python clients can use GPU descriptors at runtime in CUDA-capable environments.

Gateway and UI

The gateway/ directory contains a Go binary that bridges REST/HTTP to the gRPC backend and serves an embedded Svelte web UI.

Features

REST API via gRPC-Gateway — all gRPC services exposed as JSON over HTTP.
OpenAPI spec at gateway/openapi/apidocs.swagger.json.
Embedded Svelte UI served at / — no separate web server needed.
Payload download endpoint (GET /v1/payloads/{id}/download) — automatically spills RAM/GPU payloads to disk before streaming.

Quick start (Docker)

# Start payload-manager + gateway (SQLite, no GPU)
docker compose -f docker/docker-compose.gateway.yml up --build

The UI is then available at http://localhost:8080/.

UI overview

Page	API coverage
Payloads	List, filter by tier, download, spill, promote, pin/unpin, prefetch, delete, view snapshot/lineage/metadata
Streams	Create/delete streams, read entries, append entries, manage consumer group offsets
Admin	Per-tier stats (GPU/RAM/Disk/Object) with totals

Environment variables

Variable	Default	Description
`GRPC_ADDR`	`localhost:50051`	gRPC backend address
`HTTP_ADDR`	`:8080`	HTTP listen address
`DISK_ROOT_PATH`	`/var/lib/payload-manager/payloads`	Disk storage root (must match payload-manager config)

Regenerate code

# Regenerate Go stubs + OpenAPI from proto definitions
make generate

Requires buf, protoc-gen-go, protoc-gen-go-grpc, protoc-gen-grpc-gateway, and protoc-gen-openapiv2 on PATH.

Repository layout

cmd/: executable entrypoints (payload-manager, payloadctl).
internal/: core runtime, services, storage tiers, DB adapters, lease/tiering/spill logic.
api/: protobuf definitions and generated interface artifacts.
gateway/: gRPC-Gateway binary and Svelte UI.
client/: C++ and Python client surfaces.
tests/: unit and integration coverage.
docs/: architecture, design, and testing documentation.

License

Apache-2.0

Name		Name	Last commit message	Last commit date
Latest commit History 424 Commits
.github/workflows		.github/workflows
api		api
client		client
cmake		cmake
cmd		cmd
config		config
docker		docker
docs		docs
examples		examples
gateway		gateway
grafana		grafana
internal		internal
scripts		scripts
tests		tests
third_party		third_party
ui		ui
.clang-format		.clang-format
.dockerignore		.dockerignore
.gitignore		.gitignore
.gitmodules		.gitmodules
CMakeLists.txt		CMakeLists.txt
LICENSE		LICENSE
Makefile		Makefile
README.md		README.md
buf.gen.yaml		buf.gen.yaml
buf.lock		buf.lock
buf.yaml		buf.yaml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Payload Manager

Why Payload Manager

Core capabilities

Architecture at a glance

Build

Run

Docker

Dockerfiles

Docker Compose

payloadctl

Clients (CPU vs CUDA)

Gateway and UI

Features

Quick start (Docker)

UI overview

Environment variables

Regenerate code

Repository layout

License

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Payload Manager

Why Payload Manager

Core capabilities

Architecture at a glance

Build

Run

Docker

Dockerfiles

Docker Compose

payloadctl

Clients (CPU vs CUDA)

Gateway and UI

Features

Quick start (Docker)

UI overview

Environment variables

Regenerate code

Repository layout

License

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages