Category: AI

2026

8 posts
  1. 評価 (クライマックス) — RAGAs 4 指標で Part 1-3 の改善を客観評価する

    #RAG #LLM #evaluation #RAGAs #Ollama #Python #golden-set
  2. 本番運用 — Logging Safety / Drift / Cost / Rollback で RAG を運用する

    #RAG #LLM #production #observability #PII #OpenTelemetry #Python
  3. Generation を引用付きで書く — Anthropic Citations API と cross-encoder reranker

    #RAG #LLM #Anthropic #Ollama #reranker #citations #cross-encoder
  4. Retrieval を真面目に — chunking と hybrid search で recall を数値改善する

    #RAG #LLM #Ollama #Python #retrieval #bm25 #chunking
  5. 素朴な RAG の限界 — 100 行で動くけど「使える」とは言えない理由

    #RAG #LLM #Ollama #Python #retrieval
  6. プロンプトは「手順書」から「契約書」へ:GPT-3.5からGPT-5.5までの公式ガイド変遷と移行実践

    #AI #LLM #プロンプトエンジニアリング #GPT-5.5 #OpenAI #Claude Opus 4.7 #Gemini 3 Pro #Responses API #reasoning effort
  7. ハーネスエンジニアリング入門:AIコーディングエージェントを「確実に動かす」設計思想

    #ai-agent #harness-engineering #context-engineering #coding-agent
  8. AIデータセンターの運営コストを構造化する──学習・推論にいくらかかるのか

    #AI #DataCenter #Cost #GPU #Infrastructure