⋄ 학습에서 추론으로: Gemini, GPT, Claude 등 주요 모델은 한 번 학습되지만, 추론은 매일, 매시간, 수십억 번 호출된다. AI 경쟁의 기준은 ‘모델의 크기’에서 ‘연산의 지속가능성’으로 옮겨가고 있다.
⋄ 사후학습과 장시간 추론: 기초 학습 이후에도 사후 학습(Post-training)이 필수 단계가 되었고, 답변 하나를 생성하는데 수백, 수천 단계의 추론을 거치는 장시간 사고 추론(Long Thinking) 기법이 표준으로 자리 잡았다.
⋄ 추론경제의 역설: 개별 연산의 단가는 낮아지고 있지만, 하나의 서비스 응답을 만들기 위해 수행해야 하는 연산 단계는 오히려 늘어나고 있다.