ZeroZawa

AIエージェントで個人開発をしているエンジニア。Claude Code を毎日使い、コーディングエージェント・LLM・RAG の実践を記録しています。

Category: AI

2026

13 posts

07- 09
小さな言語モデルをゼロから学習する — nanoGPT 級を MPS で回し、PPL・速度・メモリを自分で測る
#llm #transformer #python #open-source
07- 08
サンプリングは賭けだ — 1 回の正解 vs N 回の多数決、self-consistency で精度を買う代償を実測する
#llm #transformer #python #evaluation
07- 08
KVキャッシュは記憶のコスト — 文脈が伸びるほど decode が重くなる理由を実測する
#llm #transformer #python #open-source
06- 28
Attention は過去を読み直している — Q/K/V と O(T²) の壁を最小実装で覗く
#llm #transformer #python #open-source
06- 27
LLM はトークンを1つずつ予測している — 自己回帰ループを手元で覗く
#llm #transformer #python #open-source
06- 03
RAG を作る前に読む地図 — 用語が「どこで牙を剥くか」を先に押さえる
#rag #llm #ollama
05- 22
本番運用 — Logging Safety / Drift / Cost / Rollback で RAG を運用する
#rag #llm #production #python
05- 22
評価 (クライマックス) — RAGAs 4 指標で Part 1-3 の改善を客観評価する
#rag #llm #evaluation #ollama #python
05- 21
Generation を引用付きで書く — Anthropic Citations API と cross-encoder reranker
#rag #llm #anthropic #ollama
05- 21
Retrieval を真面目に — chunking と hybrid search で recall を数値改善する
#rag #llm #ollama #python
05- 20
素朴な RAG の限界 — 100 行で動くけど「使える」とは言えない理由
#rag #llm #ollama #python
05- 16
プロンプトは「手順書」から「契約書」へ：GPT-3.5からGPT-5.5までの公式ガイド変遷と移行実践
#ai #llm #prompt-engineering #gpt-5
03- 11
ハーネスエンジニアリング入門：AIコーディングエージェントを「確実に動かす」設計思想
#ai-agent #coding-agent #prompt-engineering