LLM 추론 결과 로깅은 API endpoint에서 응답이 나가기 전 미들웨어 또는 서비스 레이어에서 비동기적으로 처리하는 것이 최적화 방안입니다. 로그 데이터를 별도의 메시지 큐(예: Kafka, RabbitMQ)에 적재한 후 전용 로깅 시스템(예: Elasticsearch, Splunk)으로 전송하여 저장하면, 메인 서비스의 성능에 영향을 주지 않으면서 대규모 로깅이 가능합니다. 필요한 경우 민감 데이터를 마스킹하여 저장해야 합니다.