跳转至

部署

上架的主机需要满足条件

  1. 主机有独立公网IP,且可开放端口数量 >= GPU数量x3(端口号需连续),具体端口数量计算逻辑可参考文档最下方

  2. Ubuntu Server系统(不能为桌面系统),且系统版本>=20.04

  3. 有独立的数据磁盘,可以被格式化,磁盘容量>1TB(建议8卡服务器硬盘3.5T+)

  4. 其他配置建议:每GPU配10vCPU+,每GPU配置的内存大小>=显存大小x2(比如4090 24GB显存,那么每卡配48GB内存+)

  5. 物理机上请安装好NVIDIA驱动(建议安装最新驱动),其他CUDA等无需安装

开始部署

1. 编写配置文件

创建文件夹:mkdir -p /etc/c2c-cloud

编辑文件:/etc/c2c-cloud/c2c-agent.yaml,文件内容请前往【管理主机】→ 【我的主机】→ 【添加新主机】页面获取,内容大致如下:

其中device字段需要根据您的主机磁盘情况进行修改。该磁盘会用于橘皮优存储用户实例数据的磁盘设备,在下面步骤部署服务时磁盘将被格式化(如果该磁盘有被挂载请先解除挂载)

以上配置对于同一个机主,每台服务器除了磁盘设备可能不同,其他字段均无差异

2. 部署agent服务

如果您本地机器没有安装驱动,请先安装驱动(请查看文档最下方),然后再部署agent

# 下载agent部署与管理工具:
curl -L -o /usr/local/bin/cct https://c2ccloud.oss-cn-beijing.aliyuncs.com/cct && chmod +x /usr/local/bin/cct
# 执行命令开始安装:
cct install c2c-agent
# 检查是否正常启动
systemctl status c2c-agent.service
# 如果未能正常启动,请使用命令查看日志发给技术支持解决
journalctl -u c2c-agent.service

以上完成后即可在主机列表页面看到有新主机记录生成了

3. 设置主机并上架

请前往【管理主机】→ 【我的主机】页面找到刚刚上架的主机,点击【编辑】根据实际情况填写完善信息后,再进入【管理主机】→ 【主机价格】页面设置价格,最后点击上架等待审核通过即可

附录:

安装NVIDIA驱动

访问下载驱动:https://www.nvidia.com/download/index.aspx

这里使用550.107驱动进行演示:

# 先切换root用户
sudo -i
# 先装gcc等依赖,否则无法安装驱动
apt-get update && apt-get install -y build-essential
# 下载驱动,请先切换到root用户
wget https://us.download.nvidia.com/XFree86/Linux-x86_64/550.107.02/NVIDIA-Linux-x86_64-550.107.02.run
# 安装驱动
chmod +x NVIDIA-Linux-x86_64-550.107.02.run
./NVIDIA-Linux-x86_64-550.107.02.run

安装完驱动后,禁用nouveau模块(不禁用nouveau会导致不稳定)

# 编辑文件
cat > /etc/modprobe.d/blacklist-nouveau.conf << EOF
blacklist nouveau
blacklist lbm-nouveau
options nouveau modeset=0
EOF

# 更新
update-initramfs -u

# 最后重启服务器
reboot

端口数

每台服务器至少开放多少端口数是够用的?

背景:运行中实例至少需要3个端口(该数量在机主后台设置,需>=3个,更多的端口对用户更有吸引力),实例关机后会保留SSH端口给当前容器,其他端口均释放到端口库存池中,此外实例需连续关机24小时会释放,因此关机但未释放的容器会固定占用一个端口

假设:您的机器是8卡服务器,最多的情况会同时有8个正常实例(每个实例1卡)在运行,还可能有无卡模式的实例在运行,这里假设最多有16个在运行中的容器,此外假设关机且还未释放的容器有20个

那么:需要的端口数量大约 = 16 x 3 + 20 = 68

因此需要开放的端口数量与服务器的GPU数量有明显关系,建议您常规开放100个端口避免极端情况端口数需求增加导致实例无法访问

路由器端口映射

如果您的内网集群中IP数量少于机器数量,那么可以尝试用路由器做端口映射,举例说明:

假设只有一个公网IP是:P,然后有多台服务器:A、B、C,那么映射比如:
P: 10000-10100 → A:10000-10100
P: 10101-10200 → B:10101-10200
P: 10201-10300 → C:10201-10300
这样让系统看上去,A、B和C好像分别拥有独立IP,最后在橘皮优后台设置A机器的端口开放范围时:配置IP为P,端口范围为10000-10100,设置B机器的端口开放范围时:配置IP为P,端口范围为10101-10200,依此类推