论文QLORA: Efficient Finetuning of Quantized LLMs
摘要作者提出了QLORA,一种高效的微调方法,可以在单个48GB的GPU上微调一个65B参数的模型,同时保持完整的16位微调任务性能,从而降低内
2023-05-28