Posts
All the articles I've posted.
-
RAG 직접 구현 — 임베딩 · 코사인 유사도 · 청크 검색 (한국어 vs 영어 비교까지)
RAG (Retrieval-Augmented Generation) 의 안쪽을 직접 코드로 깎으면서 임베딩이 무엇인지부터 의심스러운 결과를 디버깅하는 데까지. OpenAI text-embedding-3-small 로 1536차원 벡터를 뽑고, 코사인 유사도로 비교하고, 한국어 vs 영어 성능을 비교하고, 청크 분할까지. 의외로 한국어 임베딩 유사도가 낮은 게 관찰됨.
-
바이브코딩을 위한 API 설계 어휘 — REST·상태 코드·멱등성·페이지네이션·인증/인가
용어 정리 시리즈 3탄. DB 테이블을 만든 다음 그 자원을 외부에 어떻게 노출하는가. 'API 짜줘' 라는 막연한 지시를 벗어나기 위한 5가지 핵심 어휘 — REST · 상태 코드 · 멱등성 · 페이지네이션 · 인증/인가 — 와 보너스 CORS 까지. 핵심 개념은 playground 에서 직접 만져볼 수 있게 따로 만들어뒀다.
-
AGV 사이드 프로젝트 일지 4편 — STM32 UART 송신 + ROS2 launch 파일
드디어 USB-UART 컨버터 도착. STM32F407 의 USART2 로 1초마다 메시지를 송신하고 PC 시리얼 모니터에서 수신 확인. USART3 을 RS485 용으로 남겨둔 이유, blocking 부터 시작하는 이유, STM32CubeIDE 안에서 시리얼 콘솔 띄우는 법까지. 그리고 ROS2 launch 파일로 노드 두 개 동시 실행.
-
Claude API 에러 핸들링과 재시도 — 일시적·영구·형식 오류 구분 + Exponential Backoff
신뢰성 있는 LLM 서비스를 만들려면 어떤 에러를 어떻게 처리해야 하는가. 에러 종류를 일시적 / 영구 / 사용자 입력 / 응답 형식으로 분류하고, 기본 try-except 래퍼 → Exponential backoff → Anthropic SDK 내장 재시도 → JSON 응답 검증까지 4단계로 실습.