Large language model

LLM

2023-09-14

LLM 是 Large Language Model 的缩写，是 [[AI]] 领域中的一种模型。

命名规范

Instruct: 表示指令微调模型，对话体验更好，理解能力更强
Base: 基础预训练模型，未经指令微调，适合继续训练

量化方式

质量排序（从高到低）：

fp32 > fp16/bf16 > q8_0 > q6_K > q5_K_M > q5_0 > q4_K_M > q4_0 > q3_K_M > q2_K

文件大小排序（从大到小）：

fp32 > fp16 > q8_0 > q6_K > q5_K_M > q4_K_M > q3_K_M > q2_K

# AI