update

tom-sapletta-com · tom-sapletta-com · commit bac8f47caae5 · 2025-05-13T15:29:35.000+02:00
diff --git a/containers/llm-orchestrator-min/Dockerfile b/containers/llm-orchestrator-min/Dockerfile
@@ -0,0 +1,50 @@
+FROM python:3.9-slim
+
+# Instalacja zależności systemowych
+RUN apt-get update && apt-get install -y --no-install-recommends \
+    build-essential \
+    git \
+    curl \
+    wget \
+    ca-certificates \
+    && rm -rf /var/lib/apt/lists/*
+
+WORKDIR /app
+
+# Kopiowanie tylko pliku requirements.txt najpierw, aby lepiej wykorzystać cache
+COPY requirements.txt .
+
+# Ustawienie zmiennych środowiskowych dla pip, aby zoptymalizować cache
+ENV PIP_NO_CACHE_DIR=0 \
+    PIP_DISABLE_PIP_VERSION_CHECK=1 \
+    PYTHONDONTWRITEBYTECODE=1 \
+    PYTHONUNBUFFERED=1
+
+# Utworzenie katalogu cache dla pip i instalacja zależności
+RUN mkdir -p /root/.cache/pip && \
+    pip install -r requirements.txt
+
+# Kopiowanie pozostałych plików aplikacji
+COPY api.py ./
+COPY model-configs/ ./model-configs/
+COPY data/ ./data/
+
+# Utworzenie potrzebnych katalogów
+RUN mkdir -p /app/models /app/config
+RUN mkdir -p /app/model-configs /app/data
+
+# Pobieranie małego modelu LLM (TinyLlama-1.1B)
+# Używamy ARG, aby wymusić przebudowanie tej warstwy przy zmianie wersji modelu
+ARG MODEL_VERSION=1.0
+RUN mkdir -p /app/models/tinyllama && \
+    cd /app/models/tinyllama && \
+    wget -q https://huggingface.co/TinyLlama/TinyLlama-1.1B-Chat-v1.0/resolve/main/tokenizer.model && \
+    wget -q https://huggingface.co/TinyLlama/TinyLlama-1.1B-Chat-v1.0/resolve/main/tokenizer_config.json && \
+    wget -q https://huggingface.co/TinyLlama/TinyLlama-1.1B-Chat-v1.0/resolve/main/config.json && \
+    wget -q https://huggingface.co/TinyLlama/TinyLlama-1.1B-Chat-v1.0/resolve/main/pytorch_model.bin
+
+# Ekspozycja portu API
+EXPOSE 5000
+
+# Uruchomienie API
+CMD ["python", "-u", "api.py"]
diff --git a/containers/llm-orchestrator-min/api.py b/containers/llm-orchestrator-min/api.py
@@ -0,0 +1,62 @@
+import os
+import torch
+from flask import Flask, request, jsonify
+from transformers import AutoModelForCausalLM, AutoTokenizer
+
+app = Flask(__name__)
+
+# Ścieżka do modelu
+MODEL_PATH = "/app/models/tinyllama"
+
+# Ładowanie modelu i tokenizera
+print("Ładowanie modelu TinyLlama-1.1B...")
+tokenizer = AutoTokenizer.from_pretrained(MODEL_PATH)
+model = AutoModelForCausalLM.from_pretrained(
+    MODEL_PATH,
+    torch_dtype=torch.float32,  # Używamy float32 dla CPU
+    low_cpu_mem_usage=True
+)
+print("Model załadowany!")
+
+@app.route('/api/generate', methods=['POST'])
+def generate():
+    try:
+        data = request.json
+        prompt = data.get('prompt', '')
+        max_length = data.get('max_length', 256)
+        
+        # Formatowanie promptu dla modelu czatowego
+        chat_prompt = f"<human>: {prompt}\n<assistant>:"
+        
+        # Generowanie odpowiedzi
+        inputs = tokenizer(chat_prompt, return_tensors="pt")
+        outputs = model.generate(
+            inputs.input_ids,
+            max_length=max_length,
+            temperature=0.7,
+            top_p=0.9,
+            do_sample=True
+        )
+        
+        # Dekodowanie odpowiedzi
+        response = tokenizer.decode(outputs[0], skip_special_tokens=True)
+        
+        # Wyodrębnienie odpowiedzi asystenta
+        assistant_response = response.split("<assistant>:")[-1].strip()
+        
+        return jsonify({
+            "response": assistant_response,
+            "success": True
+        })
+    except Exception as e:
+        return jsonify({
+            "error": str(e),
+            "success": False
+        }), 500
+
+@app.route('/api/health', methods=['GET'])
+def health():
+    return jsonify({"status": "ok"})
+
+if __name__ == '__main__':
+    app.run(host='0.0.0.0', port=5000)
diff --git a/containers/llm-orchestrator-min/requirements.txt b/containers/llm-orchestrator-min/requirements.txt
@@ -0,0 +1,11 @@
+torch==2.0.1
+transformers==4.30.2
+accelerate==0.20.3
+sentencepiece==0.1.99
+pydantic==1.10.8
+fastapi==0.100.0
+uvicorn==0.22.0
+flask==2.3.3
+numpy==1.24.3
+requests==2.31.0
+python-dotenv==1.0.0
diff --git a/docker-compose.min.yml b/docker-compose.min.yml
@@ -0,0 +1,48 @@
+version: '3.8'
+
+services:
+  llm-orchestrator-min:
+    build:
+      context: ./containers/llm-orchestrator-min
+    container_name: llm-orchestrator-min
+    volumes:
+      - ./volumes/models:/app/models
+      - ./volumes/config:/app/config
+      - pip-cache:/root/.cache/pip
+    ports:
+      - "5000:5000"  # API LLM
+    networks:
+      - autoformfiller-min-network
+
+  browser-service:
+    build:
+      context: ./containers/browser-service
+    container_name: browser-service
+    volumes:
+      - ./volumes/recordings:/app/recordings
+      - pip-cache:/root/.cache/pip
+    environment:
+      - DISPLAY=:99
+    ports:
+      - "5900:5900"  # VNC
+    networks:
+      - autoformfiller-min-network
+
+  novnc:
+    build:
+      context: ./containers/novnc
+    container_name: novnc
+    ports:
+      - "8080:8080"  # noVNC Web UI
+    networks:
+      - autoformfiller-min-network
+    depends_on:
+      - browser-service
+
+networks:
+  autoformfiller-min-network:
+    driver: bridge
+
+volumes:
+  pip-cache:
+    name: coboarding-pip-cache
diff --git a/runmin.sh b/runmin.sh
@@ -0,0 +1,86 @@
+#!/bin/bash
+
+# Kolory do formatowania wyjścia
+GREEN='\033[0;32m'
+YELLOW='\033[1;33m'
+RED='\033[0;31m'
+NC='\033[0m' # No Color
+
+echo -e "${GREEN}=== coBoarding - Minimalna Wersja ===${NC}"
+echo -e "${YELLOW}Uruchamianie minimalnej wersji coBoarding z prostym modelem LLM (TinyLlama-1.1B)${NC}"
+echo -e "${YELLOW}Ta wersja zawiera tylko podstawowe funkcje:${NC}"
+echo -e "- Prosty model LLM działający na CPU (do 2B parametrów)"
+echo -e "- Przeglądarka dostępna przez noVNC"
+echo -e "- Brak menedżerów haseł, pipelines i sterowania głosowego"
+
+# Sprawdzenie czy Docker jest zainstalowany
+if ! command -v docker &> /dev/null; then
+    echo -e "${RED}Docker nie jest zainstalowany. Instaluję Docker...${NC}"
+    curl -fsSL https://get.docker.com -o get-docker.sh
+    sudo sh get-docker.sh
+    rm get-docker.sh
+fi
+
+# Sprawdzenie czy Docker Compose jest zainstalowany
+if ! command -v docker-compose &> /dev/null; then
+    echo -e "${RED}Docker Compose nie jest zainstalowany. Instaluję Docker Compose...${NC}"
+    sudo curl -L "https://github.com/docker/compose/releases/download/v2.20.3/docker-compose-$(uname -s)-$(uname -m)" -o /usr/local/bin/docker-compose
+    sudo chmod +x /usr/local/bin/docker-compose
+fi
+
+# Tworzenie katalogów dla wolumenów
+mkdir -p ./volumes/models ./volumes/config ./volumes/recordings
+
+# Zatrzymanie istniejących kontenerów, jeśli istnieją
+echo -e "${YELLOW}Zatrzymywanie istniejących kontenerów, jeśli istnieją...${NC}"
+docker-compose -f docker-compose.min.yml down 2>/dev/null
+
+# Budowanie i uruchamianie kontenerów
+echo -e "${GREEN}Budowanie i uruchamianie kontenerów...${NC}"
+docker-compose -f docker-compose.min.yml up --build -d
+
+# Sprawdzenie statusu kontenerów
+echo -e "${YELLOW}Sprawdzanie statusu kontenerów...${NC}"
+docker-compose -f docker-compose.min.yml ps
+
+# Funkcja do otwierania przeglądarki
+open_browser() {
+  local url="$1"
+  echo -e "${GREEN}Otwieranie przeglądarki: $url${NC}"
+
+  # Wykrywanie systemu operacyjnego i otwieranie URL w przeglądarce
+  if [[ "$OSTYPE" == "linux-gnu"* ]]; then
+    if command -v xdg-open &>/dev/null; then
+      xdg-open "$url" &>/dev/null &
+    elif command -v gnome-open &>/dev/null; then
+      gnome-open "$url" &>/dev/null &
+    else
+      echo -e "${YELLOW}Nie można automatycznie otworzyć przeglądarki. Otwórz ręcznie URL: $url${NC}"
+      return 1
+    fi
+  elif [[ "$OSTYPE" == "darwin"* ]]; then
+    open "$url" &>/dev/null &
+  elif [[ "$OSTYPE" == "cygwin" || "$OSTYPE" == "msys" || "$OSTYPE" == "win32" ]]; then
+    start "" "$url" &>/dev/null &
+  else
+    echo -e "${YELLOW}Nieobsługiwany system. Otwórz URL ręcznie: $url${NC}"
+    return 1
+  fi
+
+  # Daj przeglądarce czas na otwarcie
+  sleep 3
+  return 0
+}
+
+# Czekanie na uruchomienie usług
+echo -e "${YELLOW}Czekanie na uruchomienie usług...${NC}"
+sleep 10
+
+# Otwieranie noVNC w przeglądarce
+echo -e "${GREEN}Otwieranie noVNC w przeglądarce...${NC}"
+open_browser "http://localhost:8080/vnc.html?autoconnect=true&password=secret"
+
+echo -e "${GREEN}=== coBoarding - Minimalna Wersja uruchomiona ===${NC}"
+echo -e "noVNC dostępny pod adresem: http://localhost:8080/vnc.html?autoconnect=true&password=secret"
+echo -e "API LLM dostępne pod adresem: http://localhost:5000"
+echo -e "${YELLOW}Aby zatrzymać, użyj: docker-compose -f docker-compose.min.yml down${NC}"