基本情况
服务器目前拥有两台GPU,分别为:
只有一台了
GPU0-RTX3090 24G
~GPU1-泰坦 12G~
使用前请务必检查服务器负载,因为使用人数较少不进行个人资源限制。
因管理员太菜,容器出现问题修不了,只能删机重来(甚至删机命令都是百度的),请务必明确自己发出的每一条指令,备份好自己的重要数据,不要当做存储!
1 | nvidia-smi |
服务器通过 docker 进行虚拟化和管理,所以容器中只保留
/home/ubuntu
目录内的文件。也就是说,自己安装的软件和这个目录之外的东西都不会进行保留!
容器已经内置了 nvidia 驱动、cuda、conda,除非明确知道自己需要做什么!明确知道自己敲入的每一条命令的后果!不要!不要!不要对GPU驱动和网络配置进行任何调整!
如有问题,请联系现任管理员
连接方式
- 公网连接
1、下载zerotier,不需要注册,直接下载客户端!加入网络:【联系管理员获取】
2、联系管理员同意授权网络
3、通过 SSH 进行连接,访问192.168.63.100:<管理员授权的端口>利用用户名 (默认为 ubuntu)及密码登录,传输文件不要使用 sftp 直接传数据集或者大文件(线路优化使用了流量转发做优化,线路流量挺贵的,钱包顶不住),公共数据集请使用 wget 等从网络直连下载(也就是先存个网盘或者找到下载链接,然后直接下载到服务器)
使用建议
- 服务器内置了conda,可以直接使用conda创建python环境,使用方法请自行搜索或者查看本人可能不太及时更新的博客
- 服务器内置了tmux,使用tmux可以保持进程,防止ssh断连导致的程序终端,具体使用方法参考百度。
- cuda相关的问题可以百度下什么是cuda toolkit,能解决99%的问题(多数情况下不需要对宿主机cuda进行调整,只需要调用特定版本的cuda toolkit工具包)
— 下面内容仅供管理员参考记录 —
容器部署:
使用了: https://github.com/gezp/docker-ubuntu-desktop 项目进行部署(这个仓库我PR了很多我们会用的工具包,有其他需求联系我,我评估处理)。
Docker 默认镜像版本为:
1 | docker pull gezp/ubuntu-desktop:22.04-cu11.7.1 |
复制模板文件:
1 | cp -r /home/wsh/dockermnt/template /home/wsh/dockermnt/wush |
启动 docker:
1 | docker run -d --restart=always --name 容器名 --privileged --cap-add=SYS_PTRACE --gpus all --cpus="4" -m="8g" --shm-size=1024m -e USER=ubuntu -e PASSWORD=password -v /home/wsh/dockermnt/容器名/home:/home/ubuntu -p XXX:22 gezp/ubuntu-desktop:22.04-cu11.7.1 |
所有人配置保存
1 | 加密内容,请查看私有仓库 |
—下面内容已被弃用 —
宿主机 LXD 设置
- 添加清华镜像站
1 | sudo lxc remote add tuna-images https://mirrors.tuna.tsinghua.edu.cn/lxc-images/ --protocol=simplestreams --public |
创建镜像
- lxc launch <镜像源>:<镜像名> <容器名>
1 | lxc launch tuna-images:ubuntu/22.04 user |
- 进入容器并修改密码
1 | lxc exec user bash |
此方法进入为root用户,其中内置一个ubuntu用户
1 | passwd root |
- 安装openssh便于用户访问
1 | apt-get install openssh-server |
- 注意首次进入系统请先安装显卡驱动!!!**
1 | sudo apt-get update |