Data Engineering Demos

⚡ Ten self-contained, 10-minute tutorials that walk you from zero to a modern data stack: Postgres → dbt → Great Expectations → MLflow → Kafka/Spark → Prefect → Grafana. Clone any folder, run docker compose up, and you’re exploring in minutes.

A collection of 10-minute demos showcasing modern data engineering tools and practices.

🚀 Demo Topics

No.	Topic	Status	Description
01	Postgres + dbt quick-start	✅ Complete	Data transformation with dbt
02	Great Expectations with S3	✅ Complete	Data quality validation
03	FastAPI + MLflow tracking	✅ Complete	ML model serving & tracking
04	Airbyte to DuckDB	✅ Complete	Data integration & warehousing
05	Streamlit → Grafana	✅ Complete	Real-time metrics & visualization
06	Kafka + Spark Structured Streaming	✅ Complete	Real-time streaming
07	Superset + SQLite	✅ Complete	Business intelligence
08	Prefect 3 local deployment	✅ Complete	Workflow orchestration
09	Dagster data assets	✅ Complete	Asset-based orchestration & lineage
10	Snowflake + dbt Cloud	✅ Complete	Cloud data warehouse & transformation

🚀 Quick Start

Each demo is self-contained and can be run independently:

# Navigate to any demo
cd 01-postgres-dbt-quickstart

# Follow the README instructions

🛠️ Tech Stack

Category	Tools
Databases	PostgreSQL, DuckDB, SQLite, Snowflake
ETL/ELT	dbt, Airbyte, Prefect, Dagster
Data Quality	Great Expectations
ML/AI	MLflow, BentoML, spaCy
Streaming	Kafka, Spark
Visualization	Grafana, Superset
Infrastructure	Docker, Kubernetes

📚 Learning Path

These demos follow a logical progression:

Data Storage (Postgres, DuckDB, Snowflake)
Data Transformation (dbt, Airbyte)
Data Quality (Great Expectations)
ML Pipeline (MLflow, BentoML)
Streaming (Kafka, Spark)
Orchestration (Prefect, Dagster)
Visualization (Grafana, Superset)

🤝 Contributing

Feel free to contribute additional demos or improvements!

Name		Name	Last commit message	Last commit date
Latest commit History 34 Commits
.github		.github
01-postgres-dbt-quickstart		01-postgres-dbt-quickstart
02-great-expectations-s3		02-great-expectations-s3
03-fastapi-mlflow		03-fastapi-mlflow
04-airbyte-duckdb		04-airbyte-duckdb
05-streamlit-grafana		05-streamlit-grafana
06-kafka-spark-streaming		06-kafka-spark-streaming
07-superset-sqlite		07-superset-sqlite
08-prefect-3-local		08-prefect-3-local
09-dagster-data-assets		09-dagster-data-assets
.gitignore		.gitignore
.pre-commit-config.yaml		.pre-commit-config.yaml
.yamllint		.yamllint
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Data Engineering Demos

🚀 Demo Topics

🚀 Quick Start

🛠️ Tech Stack

📚 Learning Path

🤝 Contributing

📞 Contact

About

Uh oh!

Releases 1

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Data Engineering Demos

🚀 Demo Topics

🚀 Quick Start

🛠️ Tech Stack

📚 Learning Path

🤝 Contributing

📞 Contact

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases 1

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages