에이전트마다 역할이나 응답시간 리소스사용량이 다를것이므로, 요청내용에 따라 특정 AI에이전트로 요청을 분기하는 작업이 필요할 것같습니다. 예를들면 실시간 리소스 사용량이나 응답지연시간기준의 부하분산이 될 수 있겠습니다.