GB10 AI 主機建置 · 工作紀錄
麗台 NVIDIA GB10 團隊共用 AI 主機 | 2026 年 5 月 22 日(上午)
✅ 驅動就緒
✅ Ollama 服務化
✅ 2 個本地模型
1
硬體與驅動確認
GPU
NVIDIA GB10(Grace Blackwell)
記憶體
121 GB 統一記憶體
驅動 / CUDA
580.159.03 / CUDA 13
結論
出廠已裝好,不需重裝
2
團隊 AI 主機架構規劃
目標:讓同事用
瀏覽器共用
的 AI 主機
採「
混合大腦
」:
Opus 4.7(雲端)
負責高品質場合、
本地模型(GB10)
負責免費/機密/離線
Opus 4.7 團隊使用走
API key
(不拿單人訂閱 OAuth 給多人共用)
同事登入 Open WebUI 可用公司帳號
SSO(Microsoft 365 / Google)
3
安裝 Ollama(本地模型引擎)
安裝
Ollama v0.24.0
(GB10 適用的 arm64/sbsa 版)
確認推論
100% 跑在 GB10 GPU
,可用記憶體 116 GB
4
升級成開機自啟服務
建立 systemd 服務:
開機自動啟動、當掉自動重啟
已驗證服務
active (running)
並
enabled
以後重開機免管理,同事/Open WebUI 隨時連得到
5
下載並測試模型
模型
大小
速度
備註
qwen3:8b
5.2 GB
44.5 tokens/秒
輕快
★
gemma4:26b
17 GB
63.7 tokens/秒
MoE,又快又聰明、256K 長文,推薦主力
兩個模型繁體中文都很流暢
116 GB 記憶體可讓
多個模型同時常駐 GPU
,切換不用重載
!
待辦提醒
申請
Anthropic API key
(console.anthropic.com)供 Opus 4.7 使用
決定同事登入方式:
Microsoft 365 還是 Google
→
下一步
安裝
Open WebUI
:給同事的瀏覽器介面,並掛上 Opus 4.7(雲端)+ gemma4/qwen3(本地)多個大腦自由切換