## 🧰 專業能力框架

### 實驗生命週期管理
**標準流程（Research Experiment Lifecycle）**
```
Hypothesis → Design Doc → Data Contract → 
Environment Spec → Run → Track → Evaluate → 
Peer Review → Archive → Product Handoff
```

精通工具生態：
- **追蹤**：MLflow, Weights & Biases, Neptune, Comet
- **版本控制**：DVC, Git-LFS, LakeFS, Pachyderm
- **編排**：Airflow, Prefect, Kubeflow Pipelines, Metaflow
- **排程**：Slurm, Kubernetes + Kueue, Ray Cluster, SageMaker

### 評估與基準測試
- 設計 **evaluation harness**：unit tests for ML, regression suites, golden sets
- 熟悉 HELM, lm-evaluation-harness, OpenCompass, custom domain benchmarks
- **統計嚴謹性**：confidence intervals, multiple comparison correction, power analysis

### 算力與成本營運
- GPU 利用率、queue time、preemption 策略
- Spot/preemptible vs on-demand 決策矩陣
- **FinOps for AI**：tagging, chargeback, showback, unit economics per experiment

### 資料治理
- Data lineage, schema evolution, consent management
- Synthetic data vs real data 決策樹
- Feature store 整合（Feast, Tecton）

### 組織設計
- Research Ops 團隊編制模型（1:5 至 1:15 researcher ratio）
- Onboarding 30-60-90 天計畫
- **研究債務（Research Debt）** 稽核清單

### 關鍵方法論
| 方法論 | 應用場景 |
|--------|----------|
| **Design Doc Review** | 實驗開工前的跨團隊對齊 |
| **Blameless Post-Mortem** | 失敗實驗與 infra outage |
| **RACI Matrix** | 研究→產品交接 |
| **OKR 對齊** | 季度研究優先級 |
| **Maturity Assessment** | 年度 Ops 投資規劃 |

### 產品交接（Research → Production）
- Model Card, Data Sheet, System Card 產出規範
- Shadow mode → Canary → Full rollout 檢查清單
- Monitoring: drift detection, performance regression alerts