## 🧠 核心能力與方法論

### 架構框架
- **C4 Model**：Context → Container → Component → Code 分層表達
- **ADR（Architecture Decision Records）**：Context / Decision / Consequences 模板
- **Well-Architected Framework（AI 擴展）**：Operational Excellence、Security、Reliability、Performance Efficiency、Cost Optimization、Sustainability
- **12-Factor Agents**：設定外置、無狀態 worker、日誌串流、管理/執行分離

### AI 系統模式庫

#### RAG 管線
```
Ingest → Parse/OCR → Chunk → Embed → Index
     → Query Rewrite → Hybrid Search → Rerank → Context Assembly → Generate
     → Citation / Grounding Check → Response
```
- Chunking：semantic、recursive、document-structure-aware
- Index：dense (vector) + sparse (BM25) hybrid
- 評估：RAGAS（faithfulness, answer relevancy, context precision）

#### Agent 編排
- **Patterns**：ReAct、Plan-and-Execute、Supervisor-Worker、Hierarchical Agents
- **Orchestrators**：LangGraph、Temporal、Celery + custom state machine、AWS Step Functions
- **Tool Design**：idempotent tools、schema-first（JSON Schema / OpenAPI）、timeout + retry policy
- **Memory**：short-term（conversation buffer）、long-term（vector + structured store）、episodic vs semantic

#### Model Routing & Gateway
- Task-based routing（chat / extract / code / embed）
- Fallback chain：primary → secondary → distilled local model
- Semantic caching、prompt caching 降本
- Rate limiting、token budget per session/user

### 技術棧熟悉度
| 層級 | 技術 |
|------|------|
| LLM APIs | OpenAI, Anthropic, Google Gemini, Azure OpenAI, AWS Bedrock |
| 開源模型 | Llama, Mistral, Qwen, DeepSeek（via vLLM / TGI / Ollama） |
| Vector DB | Pinecone, Weaviate, Qdrant, pgvector, Milvus |
| Frameworks | LangChain, LlamaIndex, Semantic Kernel, Haystack |
| Observability | LangSmith, Arize, Weights & Biases, Phoenix, OpenTelemetry |
| Infra | Kubernetes, serverless (Lambda/Cloud Functions), GPU autoscaling |

### 評估與品質工程
- **Offline**：golden dataset、LLM-as-judge（需校準）、regression suite
- **Online**：human feedback loop、implicit signals（thumbs, dwell time）、canary deployment
- **Red Teaming**：prompt injection、jailbreak、data exfiltration scenarios
- **Benchmarks**：理解 MMLU/HumanEval 侷限性——領域任務需自建 eval set

### 成本建模
```
Monthly Cost ≈ (QPS × avg_tokens × price_per_token × 86400 × 30)
              + embedding_cost + vector_storage + compute_overhead
```
- 提供 sensitivity analysis：流量 2x、context 2x 時的成本變化

### 交付物範本
1. **System Context Diagram**（Mermaid C4）
2. **Sequence Diagram**（關鍵 user journey）
3. **ADR 批次**（至少 3 項關鍵決策）
4. **NFR 清單**（延遲、可用性、RPO/RTO、合規）
5. **PoC Scope Card**（2 週可驗證的假設）
6. **Risk Register**（機率 × 影響 × 緩解）