AI 프로덕트: 채팅을 넘어선 생성형 인터페이스의 미래

0

AI 기술이 급속도로 발전하는 지금, 사용자와 AI의 상호작용 방식은 여전히 기본적인 채팅 인터페이스에 머물러 있습니다. 하지만 이것이 최선일까요?

노션(Notion)의 리서치 엔지니어 라이너스 리(Linus Lee)는 “초지능을 개발하고도 단순히 텍스트를 주고받는 방식으로만 상호작용할 것인가?”라는 도발적인 질문을 던지며, AI와 소통하는 새로운 패러다임을 제시했습니다.

이 글에서는 채팅 인터페이스의 한계를 넘어, 더 직관적이고 효율적인 생성형 인터페이스의 가능성을 살펴보겠습니다.

왜 지금의 채팅 인터페이스를 넘어서야 하는가?

여러분은 ChatGPT나 다른 AI 챗봇을 사용하면서 답답함을 느낀 적이 있으신가요?

매번 세세한 설명을 입력해야 하고, 원하는 결과를 얻기 위해 여러 번 질문을 다시 작성해야 했던 경험이 있을 겁니다. 이는 현재 AI 인터페이스의 가장 큰 한계를 보여줍니다.

라이너스 리는 AI의 언어적 유연성을 유지하면서도, 사용자가 더 직관적으로 다가갈 수 있는 ‘새로운 생성적 인터페이스’가 필요하다고 강조합니다. 지금의 챗 기반 모델은 강력하지만, 이를 진화시켜 사용자 경험을 혁신적으로 개선할 시점이 왔다는 것이죠.

대화의 4가지 핵심 요소: 현재 무엇이 부족한가?

효과적인 대화는 네 가지 핵심 요소로 구성됩니다:

  • 맥락(Context): 대화가 이루어지는 환경과 배경
  • 의도(Intent): 사용자가 표현하고자 하는 목적
  • 생각(Rollout/Chain of Thought): 모델이 사용자의 의도를 처리하는 내부 과정
  • 행동(Action): 최종적인 응답이나 작업 수행

현재의 챗봇 인터페이스는 주로 의도(프롬프트)와 행동(출력)에만 초점을 맞추고 있으며, 맥락과 내부 처리 과정은 상대적으로 간과되고 있습니다. 이로 인해 사용자와 AI 사이의 소통에 큰 간극이 발생합니다.

맥락 공유의 중요성: 왜 ‘상황’이 필수적인가?

대화는 단어만으로 이뤄지지 않습니다. 여러분이 사무실에서 동료와 이야기할 때, 마트에서 점원과 대화할 때, 친구와 길거리에서 얘기할 때 등 같은 문장이라도 상황에 따라 전혀 다른 의미를 가질 수 있습니다.

대화의 효율성과 정확성은 바로 이 ‘공유된 상황’에 달려 있습니다.

하지만 ChatGPT와 같은 챗봇은 이런 공유 맥락이 거의 없습니다. 그래서 사용자는 매번 문장 하나하나에 모든 배경 정보를 담아야 합니다.

이 부담을 줄이려면, 언어 모델이 사용자와 같은 공간을 공유하고, 사용자가 무엇을 보고 있고 무엇을 하려는지를 자연스럽게 이해해야 합니다.

가리키기와 선택: 직관적 소통의 핵심 메커니즘

맥락 공유의 좋은 예로 GitHub Copilot Chat을 들 수 있습니다. VSCode와 같은 개발 환경 내에서 Copilot은 사용자가 어떤 파일을 열어두었는지, 커서가 어디에 있는지, 터미널에서 무슨 에러가 났는지를 모두 볼 수 있습니다.

이 풍부한 맥락 덕분에 “이 함수 테스트코드 짜줘”라는 짧은 요청만으로도 정확한 결과를 얻을 수 있습니다.

반면, Microsoft의 Excel용 Copilot에서는 사용자가 스프레드시트의 특정 열을 언급할 때 “지난달 판매 데이터 열”과 같이 직접 구체적으로 설명해야 합니다. 훨씬 더 비효율적이죠.

라이너스는 ‘가리키기와 선택(point and select)’ 메커니즘을 통해 사용자가 UI의 요소(명사)를 선택하고 원하는 작업(동사)을 수행하는 방식을 강조했습니다. 이는 웹의 기본 상호작용 방식과 유사하지만, 현재 챗 인터페이스에서는 이러한 기능이 부족합니다.

직관적 인터페이스를 구현하는 세 가지 방법

라이너스 리는 AI 인터페이스를 더 직관적으로 만들기 위한 세 가지 주요 접근법을 제시합니다:

1. 이름으로 호출(Call by Name)

모델이 어떤 객체를 봐야 할지 모를 때는 ‘이름으로 호출(call by name)’하는 방식을 활용할 수 있습니다. 디자인 앱에서 특정 아트보드에 “타임라인 패널”이라는 이름을 붙여두고, “타임라인 패널 정리해줘”라고 요청하는 식입니다.

이름을 통해 객체를 명시적으로 지정하면, 모델이 더욱 정확하게 사용자의 의도를 이해할 수 있습니다.

이는 Figma나 Sketch와 같은 디자인 도구에서 이미 부분적으로 활용되고 있는 방식이지만, AI와의 상호작용에서는 훨씬 더 강력한 잠재력을 갖고 있습니다.

2. 리터럴 멘셔닝(Literal Mentioning)

한 발 더 나아가, 라이너는 ‘드래그 앤 드롭을 통한 프롬프트 작성’이라는 미래적 인터페이스도 상상합니다. 프롬프트 창에 문단, 이미지, 연락처 아이콘 같은 오브젝트를 직접 드래그해 넣어 대상을 지정하는 것이지요.

“이 사람에게 전화 걸어줘”, “이 문단 요약해줘” 같은 요청을 훨씬 직관적으로 만들 수 있습니다.

이는 Sikuli 프로젝트의 접근 방식과 유사하게, 텍스트뿐만 아니라 시각적 요소도 직접 소통의 대상으로 활용할 수 있게 합니다.

3. 컨텍스트 액션(Context Actions)

또 하나 주목할 점은 ‘컨텍스트 메뉴(우클릭 메뉴)’의 진화입니다. 현재도 Notion이나 Figma 같은 앱에서는 객체를 선택하고 오른쪽 클릭하면 다양한 옵션이 뜨지요. Linus는 이 컨텍스트 메뉴를 언어 모델로 구동하면 훨씬 강력해질 것이라고 말합니다.

사용자가 어떤 객체를 선택했는지, 어떤 작업을 주로 해왔는지를 모델이 학습해, 가장 적합한 옵션을 추천해주는 방식입니다. AI 프로덕트에서도 ‘요약하기’, ‘새 파일로 분리하기’, ‘포맷 수정하기’ 등 예상 가능한 행동 옵션을 추천할 수 있다는 것이죠.

직관성과 유연성 사이의 균형 잡기

Lee는 UI 설계의 궁극적인 목표는 직관성과 유연성 사이의 균형을 찾는 것이라고 설명합니다. 채팅 인터페이스는 모델의 모든 기능에 접근할 수 있는 유연성을 제공하지만,

다음과 같은 제약을 추가함으로써 직관성을 높일 수 있습니다:

  • 사용자의 관심사 파악: 현재 사용자가 보고 있는 것에 기반한 추천
  • 행동 예측: 맥락에 적합한 가능한 작업 제안
  • 구조화된 지시: 사용자 입력에 가이드라인 제공

이러한 접근은 ChatGPT와 같은 앱에서 흔히 나타나는 “백지 증후군”(사용자가 무엇을 입력해야 할지 모르는 상태)을 완화하는 데 도움이 됩니다.

챗봇 인터페이스는 유연성이 뛰어납니다. 무엇이든 요청할 수 있죠. 하지만 자유도가 너무 높으면 오히려 사용자가 막막함을 느끼게 됩니다.

반대로 그래픽 기반 인터페이스는 직관적이지만, 표현할 수 있는 요청이 제한될 수 있습니다. 언어 모델을 기반으로 한 인터페이스는 이 두 가지를 조화시켜야 합니다.

인터랙티브 컴포넌트: 빠른 피드백 루프의 핵심

라이너는 인터페이스 디자인에서 또 하나 중요한 목표가 ‘피드백 루프를 닫는 것’이라고 강조했습니다. 사용자가 무언가를 시도하고, 결과를 보고, 수정하는 과정을 빠르게 반복할 수 있어야 한다는 것입니다.

예를 들어, 이미지 생성 앱에서는 하나의 이미지만 보여주기보다 여러 버전을 제공해 선택하게 하고, 선택한 버전을 바탕으로 다시 변형할 수 있도록 하는 방식이지요. 그는 “사람들은 무언가를 새로 만드는 것보다 고르는 것을 더 좋아한다는 점을 활용해야 한다”고 말합니다.

그는 피드백 루프를 빠르게 닫는 것과 관련해, 스스로 ‘인터랙티브 컴포넌트(interactive components)’라고 부르는 인터페이스 프로토타입을 소개했습니다. 여기서 말한 인터랙티브 컴포넌트는 챗 기반 인터페이스에서 질문을 했을 때, 단순히 긴 답변 문단을 받는 대신, 다양한 버튼 옵션 등을 제공하는 것입니다.

예를 들어 “뉴욕의 날씨는 어때?”라고 물었을 때, 모델이 “내일 기온은 85도입니다”라고 텍스트로 답하는 것이 아니라, 작은 날씨 위젯을 함께 제공하는 방식이죠. 이 위젯에는 시간대를 조절할 수 있는 슬라이더나 강수량 같은 다른 정보를 볼 수 있는 버튼도 있을 수 있습니다.

이렇게 모델이 상황에 맞게 작은 인터랙티브 컴포넌트, 작은 위젯들을 즉석에서 합성해 제공할 수 있다면, 사용자는 추가로 다시 질문하거나 프롬프트를 입력하지 않고도 다양한 옵션과 정보를 직접 탐색할 수 있게 됩니다. 즉, 피드백 루프를 훨씬 빠르고 자연스럽게 닫을 수 있는 것이죠.

채팅을 넘어선 AI 인터페이스의 미래

라이너스 리는 향후 AI 인터페이스가 나아가야 할 방향을 다음과 같이 제시합니다:

  • 에이전트가 사용자의 작업 공간에 함께 존재해야 합니다.
  • 프롬프트에 모든 정보를 집어넣지 않아도 풍부한 맥락을 공유할 수 있어야 합니다.
  • 추천된 ‘행복한 경로(happy path)’를 제공하고, 고급 사용자는 자유롭게 벗어날 수 있어야 합니다.
  • 빠른 피드백 루프를 통해 사용자가 쉽게 수정하고 개선할 수 있어야 합니다.

초지능과 소통하는 방법은 단순한 채팅이 아닙니다. 우리는 지금, 그 다음 인터페이스를 상상하고 만들어야 할 시점에 있습니다.

새로운 AI 인터페이스의 시대, 여러분은 준비되셨나요?

지금까지 살펴본 것처럼, AI와의 상호작용은 단순한 텍스트 주고받기를 넘어 훨씬 더 풍부하고 직관적인 경험으로 진화할 수 있습니다.

사용자의 맥락을 이해하고, 작업 공간에 자연스럽게 통합되며, 빠른 피드백 루프를 제공하는 새로운 인터페이스의 등장은 AI 활용의 새로운 지평을 열 것입니다.

여러분은 어떤 AI 인터페이스를 상상하시나요? 단순히 채팅을 넘어, 어떤 방식으로 AI와 소통하는 것이 가장 자연스럽고 효율적일까요? AI 기술이 계속 발전함에 따라, 우리가 이 기술과 상호작용하는 방식 역시 혁신적으로 변화할 것입니다.

그 변화의 중심에서, 우리는 더 나은 사용자 경험을 위한 새로운 패러다임을 함께 만들어 나갈 수 있을 것입니다.

참고 자료: Generative Interfaces Beyond Chat // Linus Lee // LLMs in Production Conference

답글 남기기