'시스템 프롬프트 학습'의 등장과 미래 가능성

‘시스템 프롬프트 학습’의 등장과 미래 가능성

Tech Adapter

Published: 2025-05-23

Updated: 2025-11-11

‘시스템 프롬프트 학습’의 등장과 미래 가능성

인공지능 분야에서 가장 주목받는 대형 언어 모델(LLM)의 발전 방향이 새로운 국면을 맞이하고 있습니다. 테슬라와 OpenAI의 공동 창업자이자 인공지능 분야의 권위자 Andrej Karpathy는 최근 자신의 소셜 미디어를 통해 기존의 ‘프리트레이닝’과 ‘파인튜닝’을 넘어서는 제3의 학습 패러다임인 ‘시스템 프롬프트 학습(System Prompt Learning)’의 필요성을 제기했습니다.

이는 LLM의 발전 방향을 근본적으로 바꿀 수 있는 혁신적 접근법으로, 인간의 학습 방식에 더 가까운 AI 발전을 이끌어낼 잠재력을 갖고 있다고 평가됩니다.

LLM 학습의 현재와 한계

현재 LLM 개발에 사용되는 주요 학습 방법으로는 크게 두 가지가 있습니다.

첫째는 방대한 텍스트 데이터를 통해 언어의 패턴과 지식을 습득하는 ‘프리트레이닝(Pretraining)’이고, 둘째는 특정 과제나 행동 양식에 맞게 모델을 조정하는 ‘파인튜닝(Fine-tuning)’입니다.

이 두 방법은 모두 모델의 가중치(파라미터)를 직접 변경하는 방식으로 작동합니다.

그러나 Karpathy에 따르면, 이러한 방식만으로는 인간의 복잡한 학습 메커니즘을 완전히 모방하기 어렵습니다.

인간은 새로운 문제에 직면했을 때, 그 문제를 해결하는 과정에서 얻은 통찰과 전략을 명시적으로 기억하고 다음에 비슷한 상황이 발생했을 때 활용합니다. 이는 단순히 지식을 습득하거나 행동 패턴을 학습하는 것을 넘어서는, 고차원적인 문제 해결 전략의 개발과 적용이라고 볼 수 있습니다.

인간 학습과 시스템 프롬프트 학습의 유사성

인간의 학습 과정을 살펴보면, 우리는 문제 상황에 직면하고, 이를 파악한 후 전략을 도출하며, 다음에 활용하기 위해 명시적으로 기억하는 방식으로 학습합니다. 예를 들어, “이런 종류의 문제가 발생하면 이런 접근 방식을 시도해야겠다”와 같은 자기 메모를 통해 문제 해결 전략을 정립합니다.

Karpathy는 이러한 인간의 학습 방식이 ‘시스템 프롬프트의 변화’와 유사하다고 주장합니다. 일반적인 사용자 맥락 기억과 달리, 시스템 프롬프트 학습은 전반적인 문제 해결 전략과 추론 절차를 명시적으로 저장하는 방식에 가깝습니다.

이는 단순한 보상 신호 기반의 강화 학습(RL)보다 훨씬 더 고차원적이고 데이터 효율적인 피드백 경로가 될 수 있습니다.

Claude의 시스템 프롬프트 사례

최근 유출된 Anthropic의 AI 어시스턴트 Claude의 시스템 프롬프트는 이러한 접근의 실제 사례를 보여줍니다. 약 17,000단어로 구성된 이 시스템 프롬프트는 단순한 행동 선호를 넘어 일반적인 문제 해결 전략까지 상세히 명시하고 있습니다.

예를 들어, Claude에게 단어 수를 세도록 요청하면, 즉시 답하지 않고 단계적으로 생각하며 각 단어, 글자, 문자에 번호를 매긴 후 명시적인 카운팅 절차를 거쳐 응답합니다. 이는 마치 인간이 어려운 문제를 풀 때 단계적으로 접근하는 방식과 유사합니다.

Karpathy는 이러한 지식이 즉시 또는 배타적으로 가중치에 내재화되어야 할 종류가 아니며, 사람이 직접 시스템 프롬프트를 손으로 작성해서 일일이 부여해서도 안 된다고 강조합니다.

대신, 새로운 형태의 학습인 시스템 프롬프트 학습을 통해 이러한 전략적 지식을 개발하고 적용할 수 있다고 제안합니다.

시스템 프롬프트 학습의 작동 방식

시스템 프롬프트 학습은 설정만 놓고 보면 강화 학습(RL)과 유사하지만, 학습 방식은 경사하강법(gradient descent)이 아닌 텍스트 기반 편집(edit)에 가깝습니다.

이는 LLM이 문제 해결 방법에 대한 책을 직접 집필하는 것과 유사한 방식으로, LLM이 스스로 프롬프트를 편집하고 갱신하는 방식은 강력한 새로운 학습 패러다임이 될 가능성이 있습니다.

Karpathy는 이러한 접근법이 마치 영화 ‘메멘토(Memento)’의 주인공처럼 기억 장애를 가진 LLM에게 스크래치패드를 제공하는 것과 같다고 비유합니다. 현재의 LLM은 학습한 내용을 가중치로만 저장할 수 있을 뿐, 명시적인 전략과 접근법을 자기 자신을 위해 기록하고 활용하는 메커니즘이 부족합니다.

해결해야 할 과제들

시스템 프롬프트 학습이 실현되기 위해서는 여러 중요한 과제들이 해결되어야 합니다:

텍스트 편집 메커니즘: 어떻게 LLM이 자신의 시스템 프롬프트를 효과적으로 편집할 수 있을까요?
편집 시스템 학습: 이러한 편집 시스템 자체를 모델이 학습할 수 있을까요? 또는 학습해야 할까요?
내재화 메커니즘: 인간처럼 명시적인 전략 지식을 점진적으로 내재화된 습관/가중치로 이관하려면 어떤 메커니즘이 필요할까요?

이러한 질문들은 앞으로 LLM 연구자들이 깊이 탐구해야 할 중요한 연구 방향을 제시합니다.

시스템 프롬프트 학습의 잠재적 영향

시스템 프롬프트 학습이 성공적으로 구현된다면, LLM의 학습 효율성과 문제 해결 능력은 획기적으로 향상될 수 있습니다. 이는 단순히 더 많은 데이터로 모델을 학습시키는 것을 넘어, 보다 인간적인 방식으로 문제를 이해하고 해결하는 AI의 발전을 의미합니다.

특히, 보상 신호에만 의존하는 강화 학습보다 훨씬 더 고차원적이고 데이터 효율적인 학습이 가능해질 것입니다. 또한, 모델이 자신의 문제 해결 전략을 명시적으로 기록하고 개선함으로써, 보다 투명하고 해석 가능한 AI 시스템의 개발도 기대할 수 있습니다.

결론

Andrej Karpathy가 제안한 ‘시스템 프롬프트 학습’은 LLM의 발전에 새로운 방향성을 제시합니다. 프리트레이닝과 파인튜닝이라는 기존의 두 축에 더해, 인간의 학습 방식에 더 가까운 제3의 학습 패러다임이 등장함으로써 LLM은 더욱 지능적이고 효율적인 시스템으로 발전할 가능성을 갖게 되었습니다.

이러한 접근법은 아직 초기 단계에 있으며, 많은 기술적 과제들이 해결되어야 하지만, LLM이 단순한 패턴 인식 기계를 넘어 보다 인간적인 방식으로 문제를 이해하고 해결하는 지능형 시스템으로 발전하는 데 중요한 이정표가 될 것입니다.

참고 자료: Andrej Karpathy, “We’re missing (at least one) major paradigm for LLM learning. Not sure what to call it, possibly it has a name – system prompt learning?”