1. 모델 서빙의 출발점: 단일 서버 아키텍처의 탄생과 한계머신러닝 모델이 연구실을 벗어나 실제 서비스에 적용되기 시작했을 때, 모델 서빙은 매우 단순한 형태로 시작되었다. 하나의 서버에 모델을 로드하고, 외부 요청이 들어오면 해당 서버가 추론을 수행해 결과를 반환하는 구조였다. 이 방식은 구현이 간단하고 이해하기 쉬웠으며, 초기 서비스나 실험 단계에서는 충분히 실용적인 선택이었다.단일 서버 기반 모델 서빙 아키텍처의 가장 큰 장점은 구조적 단순성이다. 모델 파일은 로컬에 존재하고, 메모리에 한 번 로드되면 반복적으로 사용된다. 네트워크 경로도 단순하며, 디버깅과 모니터링 역시 비교적 수월하다. 이로 인해 초기 머신러닝 서비스의 상당수는 단일 서버 구조로 출발했다.하지만 모델의 크기와 복잡도가 증가하고,..