데이터수집이나 전처리, 추론, RAG와 같은 기능들이 서로 독립적인 마이크로서비스형태로 분리하여 이런 장애전파를 방지할수 있겠습니다. 그리고 사용자별 트래픽유형을 분리하고 AI모델별 리소스를 분리하거나 제한시키는 것도방법이 될 것 같습니다.