무료 Gemini 2.5 API에서 Gemma 3로의 강제 이주기

Intro텍스트로부터 시간 정보를 추출하고 정규화하는 용도로 Gemini API를 사용해왔다. 그런데 gemini-2.0-flash를 무료로 넉넉하게 쓰던 게 어느 날 갑자기 막혔다. 찾아보니 2025년 12월 초에 Google이 무료 티어를 대폭 축소한 모양이다. 확인해보니 다수의 429 로그가 찍혀있었다.그래서 부랴부랴 확인해보니 gemini-2.5-flash-lite가 그나마 무료로 사용 가능하지만 RPM 10, RPD 20이라는 수치는 도저히 쓸 수 없는 수준이었다. gemini-2.5-flash-lite 사용 시 곧바로 limit에 다다른다.결국 Gemma 3로 갈아타게 되었고, 프롬프트 엔지니어링을 거치니 어느 정도 기존과 동일하게 동작하게 되어 이 후기 글을 작성한다.프론티어 LLM의 성능이..

Data/LLM 2026.01.12
Playwright MCP를 활용해 LLM이 스스로 UI 수정하게 하기

IntroLLM에게 UI 수정을 요청할 때마다 브라우저를 새로고침하며 결과를 확인하고, 다시 수정 요청을 하는 과정이 반복되곤 한다. 코드는 잘 생성해주지만, 실제로 의도한 대로 동작하는지는 직접 확인해야 하는 번거로움이 있다. 가끔 여러번의 수정 요청에도 제대로 처리가 되지 않으면 잘 안된 부분에 대해 브라우저의 devtools에서 현 상황을 보여주거나 스크린샷을 찍어서 직접 LLM에게 건네기도 한다. 해결에는 큰 도움이 되지만 여간 번거로운 일이 아니다.Playwright MCP를 활용하면 이런 수작업을 LLM이 스스로 처리하도록 만들 수 있다. AI가 직접 브라우저를 제어하며 수정 사항을 적용하고, 스크린샷을 찍어 확인하고, 문제가 있으면 다시 수정하는 과정을 자동으로 수행한다.Playwrighth..

Data/LLM 2025.11.20
Git Worktree 를 활용한 Claude Code 병렬 실행

IntroAGENTS.md 파일에 스펙을 명확히 정의해두고 , PLAN.md 파일을 생성해 수행할 체크리스트를 작성해두어 컨텍스트를 유지하게끔 하며 Claude Code나 Codex-cli 로 모노레포에 함꼐 들어있는 프론트엔드와 백엔드를 번갈아가며 개발을 진행하곤 했다.다양한 AI AGENT 에서 활용하려면 CLAUDE.md, GEMINI.md 등 심볼릭링크를 생성해둬야 한다. 혹은 해당 파일명으로 텍스트 파일을 생성하고 내용에 @AGENTS.md 만 작성해둬도 알아서 추적 한다.그런데 개발할 스펙이 이미 명확하게 정의되어 있고 프론트와 백엔드를 서로 독립적으로 개발할 수 있다면 굳이 순차적으로 번갈아가며 개발할 필요가 있을까 하는 생각이 들었다. 그래서 여러 개발자들로부터 적극 추천되었던 Git wo..

Data/LLM 2025.11.19
[Ubuntu] 멀쩡하던 한글 입력기가 갑자기 문제라면

IntroUbuntu를 쓰다보면 습관적으로 sudo apt update 와 sudo apt upgrade 를 입력하고는 한다.그런데, 출근하고 보니 IntelliJ에서 한글 입력이 엉망이 되는 기묘한 현상이 시작되었다.의도한 텍스트: 한글 띄어쓰기가 이상하게 됩니다.입력된 텍스트: 한 글띄어쓰기 가이상하 게됩니다.잘 알려진 한글 끝 글자 이슈인데, KIME 한글 입력기를 사용하고부터는 좀처럼 겪지 않았던 문제다. 사실 이게 전에도 한번 이런 일이 있었는데, 그때는 처음이라 해결하느라 너무 고생했었다. 이번에는 같은 문제를 다시 겪기도 했으니 글로 정리해두어 다음 번에 같은 상황이 왔을 때 낭비하는 시간을 줄이고자 한다.환경 요약OS: Ubuntu 22.04 LTSGPU: NVIDIA GeForce GTX..

IT ⁄ Computer/Linux 2025.10.22
Claude Code 사용량 확인 기능 추가 소식

Intro요즘에는 codex-cli와 Claude Code를 번갈아가며 쓰고 있다.AGENTS.md 파일을 만들고 ln -s AGENTS.md CLAUDE.md 명령어로 심볼릭 링크를 만들면 두 코딩 에이전트가 같은 컨텍스트 파일을 공유한다. 둘 다 성능이 매우 훌륭해 상황에 따라 골라 쓰기만 하면 된다.Claude Code는 5h limit이 빡빡해서 주간 리밋에 걸리는 일은 거의 없고, Codex는 5h limit은 넉넉하지만 Weekly limit에 쉽게 닿는 구조다. 그래서 평소에는 Claude Code Sonnet 4.5를 메인으로 사용하다가 5시간 제한에 걸리거나 Sonnet으로 풀기 어려운 문제가 있으면 codex-cli에서 gpt-5-codex-high 모델을 꺼낸다. 월 $20 + $20..

Development/Develop Tools 2025.10.10