## 🚀 啟動提示模板

### 通用諮詢

```
我目前的 AI 基礎架構狀況：
- 團隊規模：[X 人，角色分布]
- 雲端環境：[AWS/GCP/Azure/自建/混合]
- 主要工作負載：[LLM 推理 / 模型訓練 / RAG / Agent 編排 / 其他]
- 使用中的模型：[例如 Llama 3 70B、GPT-4 via API]
- 當前痛點：[延遲 / 成本 / 穩定性 / 擴展性 / 合規 / 其他]
- 預算範圍：[每月 $X 或年度 $Y]
- 時程要求：[例如 Q3 上線]

請幫我 [設計架構 / 優化效能 / 降低成本 / 制定路線圖 / 撰寫 Runbook]：
[具體描述你的需求]
```

### LLM 推理效能優化

```
我的 LLM 推理服務現況：
- 模型：[名稱 + 參數量 + 量化方式]
- 推理引擎：[vLLM / TGI / 自訂 / API]
- 硬體：[GPU 型號 x 數量，或 Serverless]
- 當前指標：P50 延遲 [X]ms，P99 [Y]ms，吞吐量 [Z] tokens/s
- 流量模式：平均 [A] QPS，峰值 [B] QPS，平均 context [C] tokens
- 瓶頸觀察：[GPU 利用率低 / 佇列堆積 / TTFT 過高 / 其他]

目標：P99 延遲 < [X]ms，成本 < $[Y]/月

請提供診斷思路、優化方案與預期效果。
```

### GPU 叢集規劃

```
我需要規劃一個 AI 訓練/推理叢集：
- 用途：[分散式訓練 / 推理服務 / 混合]
- 模型規模：[參數量，是否需要 multi-node]
- 預期規模：[X 張 GPU，Y 個節點]
- 部署位置：[雲端區域 / 自建機房]
- 網路頻寬：[已知或待規劃]
- 多租戶需求：[是/否，隔離等級]
- 預算：[CapEx $X 或 OpEx $Y/月]

請提供硬體選型、網路拓撲、排程方案與成本估算。
```

### RAG 系統架構

```
我要建構一個 RAG 系統：
- 資料來源：[文件類型、總量、更新頻率]
- 查詢模式：[即時問答 / 批次分析 / 混合]
- 延遲要求：[P99 < X 秒]
- 準確度要求：[高召回 / 高精確 / 平衡]
- 現有技術棧：[語言、框架、資料庫]
- 預算與規模：[用戶數、日查詢量]

請設計端到端架構，包含嵌入管線、向量 DB 選型、檢索策略與評估方案。
```

### AI Infra 路線圖

```
公司/團隊 AI 基礎架構現況評估：
- 當前成熟度：[L0-L4，參考 SKILL.md 模型]
- 未來 12 個月業務目標：[新產品、用戶增長、新模型]
- 團隊能力：[現有技能、可招聘、可外包]
- 預算趨勢：[遞增/持平/遞減]
- 最大風險：[單點故障、成本失控、合規、人才]

請制定分階段路線圖，包含里程碑、人力需求、預算分配與風險緩解策略。
```