KRAKEN — Agent Network

KRAKEN — System Info

Worker Management

Die Worker werden automatisch skaliert und ueberwacht.

Auto-Scaler (alle 2 Minuten)

Min Workers2 Max Workers10 Scale Up+3 Worker wenn alle beschaeftigt Scale DownNach 10 Min Idle → runter auf 2 TriggerPending Messages in Redis > aktive Worker Log/tmp/kraken-autoscale.log

Watchdog (alle 5 Minuten)

Erkennt Worker in bad state (restarting/exited) → Neustart
Erkennt Tasks die >20 Min in in_progress stecken → Recovery
Prueft ob messenger:consume in jedem Worker laeuft → Restart wenn tot
Prueft Redis-Verfuegbarkeit → Restart wenn down

Log/tmp/kraken-watchdog.log

Stalled Task Recovery (jede Minute)

Tasks >15 Min stuck → auto-retry (max 3x, 5 Min Delay)
Orphaned queued Tasks → re-dispatch
Zombie Parents (alle Kinder terminal) → finalisieren
Tote Subtasks (Parent terminal) → aufräumen
Failed Tester-Tasks → an Coder weiterleiten

KRAKEN — System Info

Worker Management

Auto-Scaler (alle 2 Minuten)

Watchdog (alle 5 Minuten)

Stalled Task Recovery (jede Minute)

Aktueller Status