Die Worker werden automatisch skaliert und ueberwacht.
Auto-Scaler (alle 2 Minuten)
Min Workers2Max Workers10Scale Up+3 Worker wenn alle beschaeftigtScale DownNach 10 Min Idle → runter auf 2TriggerPending Messages in Redis > aktive WorkerLog/tmp/kraken-autoscale.log
Watchdog (alle 5 Minuten)
Erkennt Worker in bad state (restarting/exited) → Neustart
Erkennt Tasks die >20 Min in in_progress stecken → Recovery
Prueft ob messenger:consume in jedem Worker laeuft → Restart wenn tot
Prueft Redis-Verfuegbarkeit → Restart wenn down
Log/tmp/kraken-watchdog.log
Stalled Task Recovery (jede Minute)
Tasks >15 Min stuck → auto-retry (max 3x, 5 Min Delay)
Orphaned queued Tasks → re-dispatch
Zombie Parents (alle Kinder terminal) → finalisieren