一、先创建 HAI 实例¶

地址：

https://cloud.tencent.com/product/hai

1.1 进入 HAI 控制台¶

打开官网后，点击“立即使用”。

1.2 新建算力实例¶

进入：

算力管理 -> 新建

1.3 填写实例参数¶

可以参考以下组合：

选择应用：社区应用
计费模式：按量计费
地域：新加坡
算力方案：GPU 基础型
其他参数保持默认

1.4 重置登录密码¶

实例创建后，可以在更多菜单里重置密码。这里建议使用你自己的高强度密码，而不是固定测试密码。

二、终端连接后先验证 Ollama¶

2.1 连接终端¶

进入：

算力连接 -> 终端连接

然后输入你设置的密码登录。

2.2 查看 Ollama 已下载模型¶

ollama ls

示例输出里可以看到多种 deepseek-r1 模型：

NAME                ID              SIZE      MODIFIED
deepseek-r1:14b     ea35dfe18182    9.0 GB    4 months ago
deepseek-r1:32b     38056bbcbb2d    19 GB     4 months ago
deepseek-r1:8b      28f8fd6cdc67    4.9 GB    4 months ago
deepseek-r1:1.5b    a42b25d8c10a    1.1 GB    4 months ago
deepseek-r1:7b      0a8c26691023    4.7 GB    4 months ago

2.3 运行模型做测试¶

例如分别启动 deepseek-r1:1.5b 和 deepseek-r1:7b：

# 启动 deepseek-r1:1.5b
ollama run deepseek-r1:1.5b

# 启动 deepseek-r1:7b
ollama run deepseek-r1:7b

2.4 查看当前运行状态¶

ollama ps

示例里能看到模型运行在 GPU 上，以及大致显存占用情况。

2.5 查看 GPU 资源¶

# 单次查看
nvidia-smi

# 循环查看
nvidia-smi -l

这一步主要是确认：

GPU 是否被识别；
显存是否够用；
当前运行的模型是否真的在用 GPU。

三、通过 OpenWebUI 做图形化测试¶

3.1 打开 OpenWebUI¶

进入：

算力连接 -> OpenWebUI

3.2 初始化账号¶

填写名称、邮箱和密码，创建管理员账号即可。建议正式使用时换成自己的账号和高强度密码。

3.3 选择默认模型并提问¶

把默认模型切到 deepseek-r1:7b 后，就可以直接开始对话测试。

四、HAI 适合什么场景¶

如果你想快速感受“GPU 实例 + Ollama + Web UI”这条最短路径，腾讯云 HAI 很适合做体验入口。它尤其适合：

先验证模型能不能跑；
先验证显存够不够；
先验证团队是否需要继续投入做更复杂的私有化部署。

腾讯云 HAI 体验：从创建实例到 OpenWebUI 测试