## 🚀 啟動模板：AI Observability 諮詢

### 使用方式
將以下模板複製並填入你的 context，可快速啟動 Principal AI Observability Lead 的深度諮詢模式。

---

```
【諮詢類型】（擇一或多選）
□ 架構設計 — 從零建立 observability stack
□ 現況評估 — 成熟度診斷與 gap analysis
□ Instrumentation — 具體 code/SDK 整合
□ Eval 設計 — offline/online evaluation pipeline
□ SLO 定義 — SLI 選擇與 error budget policy
□ Incident RCA — 生產事故根因分析
□ 工具選型 — Langfuse vs LangSmith vs OTel 等
□ 成本治理 — token economics 與 budget alerting

【系統概況】
- AI 應用類型：{RAG chatbot / Agent with tools / Batch inference / Multi-modal}
- 技術棧：{LangChain / LlamaIndex / 自研 / Vercel AI SDK / 其他}
- 模型供應商：{OpenAI / Anthropic / Azure OpenAI / 自架 vLLM / 混合}
- 部署環境：{K8s / Serverless / VM / Edge}
- 現有監控：{Datadog / Grafana / CloudWatch / 無 / 其他}
- 流量規模：{QPS 估計、日 token 量、活躍用戶數}

【合規與限制】
- 數據留存要求：{天數 / 不存 prompt / 僅存 hash}
- 合規框架：{GDPR / SOC2 / HIPAA / 內部政策 / 無}
- 預算限制：{observability 月預算 / 可接受 overhead %}

【具體問題或目標】
{請描述你目前遇到的問題、想達成的目標、或最近的 incident 摘要}

【期望產出】
□ 架構圖（Mermaid/ASCII）
□ 分階段實施 roadmap（含時間估計）
□ Instrumentation code snippet
□ SLO/SLI 定義表
□ Alert runbook
□ 工具比較矩陣
□ Quick wins checklist（本週可完成）
```

---

### 精簡版（快速啟動）

```
我是 {角色}，負責 {公司/專案} 的 {AI 應用簡述}。
目前 observability 成熟度約 L{0-4}，主要痛點是 {1-2 個具體問題}。
技術棧：{框架 + 模型 + 部署}。
請幫我：{具體請求}，產出需包含 {期望 deliverable}。
```

### 範例（已填寫）

```
我是 Staff ML Engineer，負責 B2B SaaS 的 RAG 客服 Agent。
目前 observability 成熟度約 L1，主要痛點是：(1) 無法區分 retrieval 差 vs model 幻覺導致的錯誤回答；(2) 月 token 成本失控，無法按客戶歸因。
技術棧：LangChain + OpenAI GPT-4o + Pinecone + AWS EKS。現有 Datadog APM 但無 AI-specific spans。
流量：~50 QPS peak，日均 80M tokens，200 enterprise tenants。
合規：SOC2，prompt 可存 30 天但需 PII redaction。
請幫我：設計 L2→L3 升級 roadmap，產出需包含架構圖、OTel instrumentation 範例、per-tenant cost attribution 方案、及 2 週 quick wins。
```