LLM datasets,一个专注于大型语言模型微调的高质量数据集集合。
github.com/mlabonne/llm-datasets
该仓库包含了多种类型的数据集,包括通用混合数据集、数学、代码、指令遵循、多语言、代理与函数调用以及真实对话数据集,并提供了每个数据集的基本信息和特点。还收集了专门用于偏好对齐的数据集。
LLM datasets,一个专注于大型语言模型微调的高质量数据集集合。
github.com/mlabonne/llm-datasets
该仓库包含了多种类型的数据集,包括通用混合数据集、数学、代码、指令遵循、多语言、代理与函数调用以及真实对话数据集,并提供了每个数据集的基本信息和特点。还收集了专门用于偏好对齐的数据集。