본문 바로가기

vllm1

[AI] vLLM 실전 가이드: 고성능 LLM 추론 및 API 서빙 최적화 목차vLLM, 도대체 뭘까요? (feat. PagedAttention)vLLM, 실전에서 써봅시다! (설치부터 API 서빙까지)1. vLLM 설치2. LLM 모델 로드 및 API 서버 실행3. API 요청 보내기⚠️ 삽질 경험담: GPU 메모리 부족과 버전 호환성vLLM, 얼마나 빨라졌을까? (성능 검증)1. GPU 사용량 모니터링2. 처리량 비교마무리: vLLM, LLM 서비스의 핵심 병기!안녕하세요, 13년차 서버실 지킴이입니다. 🤓요즘 LLM(Large Language Model, 대규모 언어 모델)을 활용한 서비스들이 정말 많아졌죠? 저도 홈랩에서 이것저것 돌려보면서 LLM이 우리의 일상을 어떻게 바꿀지 매일매일 흥미진진하게 지켜보고 있습니다. 그런데 이 LLM이라는 친구, 성능은 기가 막히지만.. 2026. 5. 9.

이전 1 다음

티스토리툴바