AI 에이전트란

박선규's avatar
Apr 04, 2026
AI 에이전트란
YouTubeYouTubeAgents에 대한 모든 기초 설명
📌
사람의 간섭 없이 스스로 생각하고 결정 내리는 것을 에이전트라고한다.

Agent 동작방식

notion image
오케스트레이션(에이전트 구조) 예시로 사용자가 기존에 작성했던 프롬프트를 분석해서 생각을 한다. 그다음에 모델에 맞게 계획을 세우고 논리적으로 답변을 한다. 중간 중간에 외부 결정을 내려서 API를 사용하는거를 Tools 이라고 한다.
 

LLM (model)

📌
GPT, Claude, Gemini 같은 언어모델로 질문을 이해하고 추론하고 답변을 생성한다. 추론하고 답변을 생성하는 범위는 자체 학습된 지식으로만 답변을 할 수있다. 그렇기 때문에 외부 정보를 직접가져오거나 API를 호출 하는 기능은 없다.

Agents vs model

📌
모델은 사전에 학습시킨거를 토대로 대답을 하는거다. 그러나 Agents는 생각해서 적절한 답변을 내놓기 위해 기존에 학습시킨거 외에 외부 Tools도 사용해서 적절한 답변을 한다.
ex) A(치과) 회사의 정보가 필요하다고 했을 때 모델 같은 경우는 기존에 모델한테 줬던 A회사의 정보량까지만 대답할 수있는데 Agents 같은 경우에는 외부에서도 A 회사의 정보를 찾아서 생각하고 답변한다.
 

에이전트가 생각하는 3가지 방법

React (Reasoning + Acting)

Reasoning(추론) + Acting(행동)이 합친 줄임말인데
외부 도구(API, 데이터 베이스)를 사용할 때 Tools를 사용할 때 React가 사용이 된다.
 

Reasoning

Chain-of-Thought

복잡한 논리 문제, 수학 문제, 명확한 답변 과정 같은 깊은 생각을 요구하는 것을 생각을 말로표현 하는 프롬프트 기법
ex) 질문: 루팡이 가져간 사과의 갯수가 3개고 다시 돌려놓은 사과의 갯수가 2개일 경우에 현재 루팡이 가지고 있는 사과의 갯수는?
답변: 루팡이 가져간 사과의 갯수가 3개고 다시 돌려놓은거는 빼기를 해야하니 2를 빼서 현재 루팡이 가지고 있는 사과의 갯수는 1다 3-2=1.

Tree-of-Thoughts

📌
문제를 해결하는 과정에서 즉 생각하는 과정에서 여러가지 경우의 수를 나무가지 형태처럼 만들어서 답변을 하는 거를 얘기한다.
ex) 회사 운영 방식, 게임 저략 등 여러가지 전략 답변이 나와야하는 상황에서 사용
 

Acting (행동)

Tools

📌
에이전트가 외부 세계에 접근하기 위해 사용하는 API들.
예: 항공권 API, 날씨 API, 금융 API, 지도 API 등

extensions

notion image
에이전트가 Google FLights API 를 호출하는 과정
사용예시: 맹목적으로 사용자가 일본으로 가는 항공편을 알려줘라고 하면 출발지가 모르기 때문에 API 규칙에 어긋나므로 API 호출은 실패하게 되는 이 때 오류를 방지하기 위해 Extension이 필요하다.
 
notion image
 
 
Extensions이 Agent에게 알려주는 것들
  1. 출발지를 항상 입력해야 한다.
  1. argument는 파라미터가 뭐가 필수적으로 필요한지 알려주는 역할을 한다.
 
API Tool 호출에 필요한 파라미터 목록을 보고
  • 필수 값이 비어있으면
  • 사용자에게 다시 물어봄 (“출발지를 알려주세요”)
  • 완성된 인자를 넣어서 API 호출
  • 오류 없이 정상 실행
 
notion image
Extension이 여러개를 사용 할 수도 있음 각 API 별로 안내서 역할을한다.

functions

보안·구조적 이유로 LLM이 직접 외부 API를 호출할 수 없거나,(로그인/ 인증 API, 내부 DB접근, 결제 민감 API)
결과를 정제/필터링해야 할 때 사용하는 ‘서버 내부 함수’.
특징
  1. Functions이 API를 호출하지 않는다.
  1. Clint-side 즉 사용자 측에서 호출되는 것이다.
예시) sum 함수안에 + 결과 값이 들어져있다.
 
Agent, function, API와의 상호관계
notion image
에이전트에게 어떤 함수들이 있는지, 사용자가 어떤 정보들을 원하는지 Agent에게 알려주는 것을 의미한다.
 
notion image
에이전트가 사용자에게 재요청을 받았을 경우에 Function을 정보들을 정리하고 다시 사용자에게 돌려주면 UI/middleware API를 직접 호출 하는 구조이다.
 
function의 필요 예: 개발자 입장에서 데이터의 흐름에 컨트롤을 더 가질 수 있다/?
 
  1. API 호출 자체가 에플리케이션레이어 밖에서 호출 돼야 할 때 사용
  1. 로그인, 비밀번호에 시큐리티 키로 제한이 돼있는지등 agnet가 직접 API 를 호출하기 어려울 때 사용된다.
  1. 타이밍, 시간등 API 콜을 받고 기다려야하는 상황에서 사용 된다.
  1. 에이전트 자체가 API 답변을받고 Agent가 알아야하는 로직 등, 추가 정보 필요시에 사용
    1. API에게 답변을 1000개 정도 받았을 때 Agent에게 다 결과로 줄 수 없으니 10개정도 추릴 때 Function이 추려서 Agent에게 준다.
 

Data stores

notion image
Agent가 외부 툴뿐만 아니라 기존에 학습시켜놓은 또는 Database에서 콜링 할 수 있도록 만들어 놓는것을 의미한다.
에이전트가 과거 지식·문서·사용자 설정·파일을 영구적으로 저장하고,
필요할 때 ‘Retrieval(검색)’ 해서 활용하도록 만든 AI용 데이터 저장소
 
동작 원리
notion image
 

Vector DB

📌
텍스트나 이미지 같은 데이터를 숫자, 벡터 형태로 저장하고 검색하는 DB다.
ex)’고양이’라는 명령을 사용자가 입력하면 얘는 강아지와는 가깝고 컴퓨터와는 먼 좌표 값으로 변환된다.

1. 임베딩 (Embedding): 의미를 좌표로 바꾸기

  • 개념: 텍스트를 단순한 숫자가 아니라, **'의미가 담긴 다차원 좌표'**로 변환하는 과정입니다.
  • 핵심: 비슷한 의미를 가진 단어(예: 사과, 바나나)는 좌표 공간에서 가까운 거리에 위치하고, 상관없는 단어(예: 사과, 자동차)는 먼 거리에 위치하게 됩니다.

2. 유사도 검색 (Similarity Search): 가장 닮은 놈 찾기

  • 원리: 사용자가 질문을 던지면, 그 질문도 좌표로 변환합니다. 그리고 벡터 DB 안에 이미 저장된 수만 개의 좌표 중 질문 좌표와 가장 가까운 거리에 있는 데이터를 광속으로 찾아냅니다.
  • 왜 쓰는가? 에이전트가 모든 데이터를 다 읽을 수 없으니, 질문과 가장 관련 있는 정보만 쏙 골라내기 위해 사용합니다.
저장: 대량의 문서를 임베딩(Embedding) 모델을 통해 좌표 값으로 변환하여 DB에 저장한다.
검색: 사용자의 질문이 들어오면 질문 또한 좌표로 변환하여, DB에서 유사도가 높은(거리가 가까운) 상위 K개의 문서를 찾아낸다.
활용: 찾아낸 정보를 LLM(에이전트)에게 전달하여, 에이전트가 그 근거 자료를 바탕으로 정확한 답변을 내놓게 한다.
Share article

p4rksk