2
3060 12G显卡deepspeed训练时报显存不够
deepspeed训练需要多大显存?
EnvironmentOS: Ubuntu 22.04
Python: 3.10
Transformers: 4.26.1
PyTorch: 1.12
CUDA Support: True
3060 12G显卡deepspeed训练时报显存不够
deepspeed训练需要多大显存?
EnvironmentOS: Ubuntu 22.04
Python: 3.10
Transformers: 4.26.1
PyTorch: 1.12
CUDA Support: True
24GB batch size为1 都不够
测试 deepspeed zero2 62G /单张
看你训练样本,调整一个参数,再搞个量化也许能成,不过12G确实有点少
请问 显卡吞吐量如何 大概多少tokens/GPU/s
看你显卡型号
Duplicate of #556