1. LLM 비용은 왜 항상 예상보다 커지는가LLM을 실제 서비스에 붙여본 팀이라면 한 번쯤은 비슷한 경험을 한다. 초기에는 테스트 호출 몇 번으로 비용이 미미해 보였고, 단순한 계산으로 월 비용을 추정했지만, 실제 운영이 시작되자 예상과 전혀 다른 금액의 청구서를 받게 된다. 이 현상은 단순한 계산 실수가 아니라, LLM 비용 구조 자체가 직관적이지 않기 때문에 발생하는 구조적 문제에 가깝다.전통적인 서버 비용은 비교적 예측 가능하다. CPU나 GPU를 몇 대 쓰는지, 트래픽이 얼마나 늘어나는지에 따라 선형적으로 증가하는 경향이 있다. 반면 LLM 비용은 “사용량”이라는 하나의 개념으로 묶기 어렵다. 같은 요청 수라도 입력 길이, 출력 길이, 컨텍스트 구성, 프롬프트 설계 방식, 재시도 횟수, 사용자 ..