LLM 너머 — Tool/Agent/MCP와 도구를 엮은 AI 서비스들

요즘 쓰는 AI 서비스는 사실 LLM(Large Language Model: 대규모 언어 모델) 하나로 굴러가지 않는다. LLM에 여러 도구를 붙여 조립한 결과물이다. 비유 하나로 시작하자. 뇌만으로는 전화를 걸 수 없다.

LLM은 뇌다. 생각하고 말하지만, 직접 웹을 뒤지거나 계산을 정확히 하거나 그림을 그리지는 못한다.
도구(Tool)는 손발이다. 검색기, 계산기, 이미지 생성기 같은 외부 기능.
MCP(Model Context Protocol: 모델 컨텍스트 프로토콜)는 표준 콘센트다. 어떤 도구든 같은 규격으로 꽂게 해 주는 약속.

Tool Use — 못 하는 일을 도구에 시킨다

LLM이 직접 못 하는 일을 외부 도구에 시키고 그 결과를 받아 답에 반영하는 것을 Tool Use(도구 사용)라고 한다. 흐름은 단순하다. 사용자가 "오늘 서울 날씨 알려 줘"라고 하면, LLM은 혼자 답하지 않고 날씨 도구를 부른다. 도구가 실제 날씨 데이터를 돌려주면, 그걸 받아 사람이 읽기 좋은 문장으로 정리한다.

어제 만진 이미지 생성이나 음성 전사 같은 기능이 전부 LLM의 도구가 될 수 있다. 뇌가 손에게 "이건 네가 해"라고 넘기고, 손이 가져온 결과를 뇌가 말로 풀어 주는 셈이다. 검색, 계산, 코드 실행, 캘린더 등록, 메일 발송까지 도구로 붙는다.

MCP — 한 번 꽂으면 어디서나

도구가 늘어나면 문제가 생긴다. 도구마다 연결 방식이 제각각이면, 새 도구를 붙일 때마다 매번 다른 배선을 짜야 한다. 그래서 나온 게 MCP다. 도구를 꽂는 규격을 하나로 통일한 표준 콘센트라고 보면 된다.

콘센트가 표준이라 가전제품을 어디서든 꽂아 쓰듯, MCP를 따르면 한 번 만든 도구(예: 사내 문서 검색기)를 Claude든 다른 앱이든 같은 방식으로 꽂아 쓸 수 있다. "도구를 한 번 만들면 여러 곳에서 재사용"이 핵심이라, 요즘 AI 서비스가 빠르게 기능을 늘리는 바탕이 됐다.

Agent — 스스로 판단하며 도구를 쓰는 AI

Agent(에이전트: 스스로 판단하고 도구를 써 가며 목표를 달성하는 AI)는 한 발 더 나간다. 한 번 답하고 끝이 아니라, 같은 루프를 목표가 끝날 때까지 반복한다.

그림처럼 생각(무엇을 할지 판단) → 도구 사용(검색/계산/생성) → 결과 확인(보고 반영)을 돌고 또 돈다. 한 단계의 결과를 보고 다음 행동을 스스로 정하기 때문에, 여러 단계가 필요한 일을 사람이 일일이 시키지 않아도 알아서 진행한다.

직접 보기 ① — 도구가 단계적으로 도는 과정

한 번에 여러 도구가 필요한 요청을 던지고 화면을 함께 지켜보자 (Claude나 ChatGPT).

"오늘 서울 날씨를 찾아보고, 그 날씨에 어울리는 활동 3개를 표로 정리한 다음, 간단한 안내 카드 한 장을 만들어 줘."

그러면 AI가 웹 검색 → 표 정리 → 카드 생성 순으로 도구를 차례로 쓰는 과정이 화면에 그대로 드러난다. "검색 중", "분석 중" 같은 표시가 단계별로 지나가는 게 보인다. 바로 이 장면이 "지금 쓰는 AI 서비스가 LLM과 여러 도구의 조립"이라는 사실을 눈으로 보여 준다.

직접 보기 ② — tool call과 MCP를 눈으로

위에서는 도구가 도는 "결과"를 봤다면, 이번엔 도구가 호출되는 "속"을 직접 들여다본다. 설치 없이 브라우저에서 할 수 있다.

MCP가 무엇인지 — 먼저 공식 소개 페이지에서 개념과 예시를 훑는다 (MCP 공식 사이트).
도구 호출을 눈으로 — 브라우저 기반 놀이터에 공개 MCP 서버 주소를 붙이면, 그 서버가 제공하는 도구 목록이 뜨고, 값을 넣어 실행하면 요청과 응답 메시지가 그대로 보인다 (MCP Playground, 무설치/무계정). 마침 날씨 도구를 호출하면 위치/기온/날씨가 구조화된 형태로 돌아오는 걸 직접 확인할 수 있다.
한 걸음 더 — 개발 환경이 있다면 공식 점검 도구로 더 자세히 볼 수 있다 (MCP Inspector).

여기서 깨닫는 게 있다. AI가 "마법처럼" 답하는 게 아니라, 정해진 규격으로 도구를 부르고 그 답을 받아 정리하고 있을 뿐이라는 점이다. 콘센트에 플러그를 꽂는 장면을 직접 보는 셈이다.

도구를 엮어 만든 특이한 AI 서비스들

이 "LLM + 도구 + 반복 루프"라는 한 가지 뼈대로, 요즘은 채팅을 넘어선 특이한 서비스들이 쏟아진다. 무엇을 도구로 엮었느냐에 따라 성격이 갈린다.

서비스	무엇을 도구로 엮나	특장점
Perplexity	웹 검색 + LLM	질문하면 웹을 뒤져 출처를 단 답을 만드는 "답변 엔진"
ChatGPT 에이전트	브라우저 조작 + 코드 실행	사람처럼 웹을 클릭하고 코드를 돌려 작업을 대신 수행
Claude	MCP로 외부 도구 연결 + 화면 조작	표준 콘센트로 여러 도구를 붙이고 컴퓨터까지 직접 조작
Manus	클라우드 샌드박스 + 자율 실행	스스로 계획하고 코드를 실행해 결과물까지 자율로 완성
Genspark	검색을 에이전트로	링크 대신 슬라이드/페이지 같은 구조화된 산출물을 생성
Gemini 딥 리서치	다중 출처 + 자율 탐색	여러 자료를 스스로 훑어 한 편의 리포트로 정리
NotebookLM	내 문서 + 오디오 생성	올린 문서를 근거로 답하고 두 사람이 대화하는 오디오 개요까지

겉모습은 제각각이지만 속은 같다. 전부 LLM(뇌)이 도구(손발)를 골라 부르고, 결과를 보고 다음을 정하는 루프를 돈다. 이름이 무엇이든 이 뼈대를 알아보면 새 서비스가 나와도 "아, 이건 검색 도구를 엮었구나", "이건 브라우저를 도구로 붙였구나" 하고 구조가 읽힌다.

정리 — 도구의 시대에도 기본은 좋은 지시

오늘의 한 문장. AI 서비스는 LLM(뇌)에 도구(손발)를 표준 콘센트(MCP)로 붙여 조립한 것이고, Agent는 그 도구를 스스로 골라 쓰며 목표까지 반복한다. 도구와 Agent가 아무리 늘어도, 무엇을 시킬지 좋은 지시(맥락)를 주는 일이 여전히 기본 역량이다.

다음 글에서는 내 문서를 하나의 도구처럼 붙여, 근거 있는 답을 만드는 RAG로 들어간다.

10. LLM 너머 — Tool과 Agent로 일하는 AI