채널온티비(잇츠맨) - IT 테크 콘텐츠 채널

AI 서비스, API 쓸까 직접 만들까?
현명한 LLM 서빙 선택 가이드

AI 서비스, API 쓸까 직접 만들까? 현명한 LLM 서빙 선택 가이드

Q

[질문]대규모 LLM의 추론 시, 메모리 최적화(FP8, 모델 압축, quantization)는 어떻게 적용되고 있으며, 성능에 어떤 영향을 주는지요?

조성영 2025-06-24 14:59

아직 답변이 없습니다

사업자등록번호 : 315-81-38649
통신판매업신고 : 제2022-성남분당C-0084호
전화번호 : 02-6949-4298
이메일 : [email protected]

Copyright @ 2021 (주)채널온티비 All rights reserved