Tag: claude-api
All the articles with the tag "claude-api".
-
Prompt Caching — 같은 입력을 반복할 때 input 비용을 거의 0으로
긴 시스템 프롬프트나 같은 컨텍스트를 매 호출마다 보내는 챗봇·에이전트·RAG에 필수인 prompt caching. 직접 STM32/임베디드 질문으로 캐싱 유무를 비교 실험했더니 비용은 절반, 시간은 미미하게 줄었다.
-
Claude Vision — 이미지를 어떻게 넣는가, 그리고 어느 모델로 받는가
이미지를 base64로 인코딩해서 보내는 방식과 URL로 보내는 방식 두 가지를 모두 써봤다. 정확하지만 토큰 비용이 더 든다는 점, 작은 텍스트·복잡한 도형의 한계, 그리고 정확도가 필요한 작업에는 더 큰 모델로 옮겨야 한다는 감각까지.
-
LLM에게 도구를 쥐여주기 — Claude Tool Use와 에이전트 루프
LLM은 큰 수 계산도, 오늘 날씨도 모른다. 그 약점을 외부 함수 호출로 메우는 Tool Use를 처음 만져봤다. 메시지 흐름, 다중 도구 자동 선택, 에이전트 루프까지.
-
Claude API 스트리밍 — TTFT가 왜 중요하고, 이벤트는 어떻게 흐르는가
스트리밍은 단순한 'LLM처럼 글자가 흘러나오는 효과'가 아니다. 같은 총 시간이라도 사용자가 첫 결과를 보기까지의 시간(TTFT)이 달라지고, 그 차이가 UX의 핵심이다. 그리고 그걸 받는 이벤트 순서도 직접 찍어봤다.