inferenceSemaphore

Semaforo condiviso che limita le inferenze AI locali simultanee su tutti i moduli (LLAMA, Tesseract, Sussurro). Configurato tramite "AI_LLAMA_ENGINE_MaxConcurrent" (predefinito 2).