Intro최근 OpenClaw를 사용하면서 가장 아쉬운 부분은 웹검색이었다. 에이전트가 최신 웹을 보게 하려면 결국 web_search 품질이 받쳐줘야 하는데, 기본 후보로 많이 거론되는 Brave Search는 편한 대신 유료 API이고 사용량 제한도 신경 써야 한다. 그래서 Brave Search fallback으로 DuckDuckGo가 보통 사용된다.처음에는 Playwright로 여러 사이트를 방문하며 하는 식으로 기본 검색을 사용하도록 설정도 해봤는데 실제로 어느 정도 결과는 가져오지만, 여러 소스를 돌며 검색하기에는 일관성이 부족했고 속도도 아쉬웠다. 무엇보다 브라우저 화면을 그대로 읽다 보니 LLM이 바로 소비하기 좋은 형태가 아니어서 토큰도 더 쓰게 된다. 결국 내가 원한 것은 브라우저 자동..
Data 54
Intro무료 Gemini 2.5 API에서 Gemma 3로의 강제 이주기에서 Gemini 무료 티어가 대폭 축소되면서 Gemma 3로 이주했던 경험을 기록했다. 무료로 사용할 수 있는 상용 LLM API 의 선택 범위가 너무 좁다보니 성능손해를 보면서도 선택했고, 당시 추론 능력 차이로 인해 프롬프트 엔지니어링에 꽤 시간을 쏟아야 해 아쉬웠는데, 오늘은 Google의 Gemma 4 출시 소식을 들었다.Gemma 4는 Gemini 3와 동일한 연구 기반으로 만들어진 오픈웨이트 모델로, 31B Dense와 26B MoE를 포함한 네 가지 크기로 제공되며 Apache 2.0 라이선스로 공개되었다. 특히 Gemma 3 대비 추론 능력이 크게 향상되었다는 점이 눈에 띄었다. 바로 기존 프로젝트에 모델명만 바꿔 ..
Intro2026년 1월 몰트북 사태와 함께 OpenClaw(a.k.a Clawbot/Moltbot.. 이름을 자주도 바꿨다) 가 바이럴되며 맥미니가 품절되는 사건이 있었다. 개인적인 생각으로는 아무리 통합 메모리라 한들 맥미니로 대형 로컬모델을 돌리는건 무리가 있으니.. 어차피 API 연결해서 상용모델 사용할거라면 굳이 비싼 돈 들여 장만할 필요 없이 적당한 클라우드 인스턴스에 우분투 설치해서 하면 되지 않나 생각했다.물론 홈 서버로서의 맥미니의 역할은 개인적으로 매우 높게 평가한다.지금 홈 서버로 사용하고 있는 10년차 노트북이 있는데, SSD도 새로 달아주고 램도 추가해주면서 서버로서의 임무를 오래 부여해 오고 있다. 이 컴퓨터의 수명이 다한다면 다음 홈서버로는 맥 미니를 생각하고 있으며 전력 소모..
Introcodex에 서브에이전트가 생기면서 병렬 작업이 가능해졌다. 기본값은 최대 6개 스레드인데, 큰 작업을 여러 에이전트로 쪼개다 보면 금방 한계에 닿는다. 클로드코드에서는 별도의 제한이 없었는데, 기본적으로 병렬 상한이 10개로 순차 배치 처리한다고 알려져있지만 내 경험으로는 20개이상을 동시에 요청해도 동시에 돌아가는걸 확인했었다.codex 에서 서브에이전트 20개를 요청하자 6개까지 생성하고 14개는 생성에 실패한 상태최근 출시한 M5 맥북 프로의 경우에는 CPU가 무려 15코어부터 시작하는데 서브에이전트 6개 제한은 많이 아쉽다.이 경우 수치를 늘리고싶다면 config.toml에서 직접 조정할 수 있다.설정 방법~/.codex/config.toml에 아래 항목을 추가하면 된다.[agents]..
Intro최근 육아휴직에 들어가면서 개인 용도로만 월 200달러짜리 Claude Code Max x20를 유지하는 것이 부담스러워졌다.그동안 Claude Code를 메인으로 쓰면서 ChatGPT Team 플랜을 사용했었고 codex의 깊은 코드 이해도와 복잡한 태스크 수행 능력을 개인적으로 높이 사고 있었다. 그런데 마침 2월 초 카카오톡 선물하기에서 ChatGPT Pro 1개월 이용권이 29,000원에 풀리는 대란이 있었고, 정가 월 200달러짜리 상품을 1인당 5개까지 살 수 있었기에 망설임 없이 5개를 구매했다.Claude Code Max x20 요금제는 조금 타이트하게 썼다 하면 5시간 리밋, 주간 리밋 모두 금방 금방 다 써버리곤 했었는데 ChatGPT Pro는 밤새 에이전트 혼자 작업하게끔 ..