LLMdatasets,一个专注于大型语言模型微调的高质量数据集集合。gith

又仁看科技 2025-01-11 16:19:41

LLM datasets,一个专注于大型语言模型微调的高质量数据集集合。

github.com/mlabonne/llm-datasets

该仓库包含了多种类型的数据集,包括通用混合数据集、数学、代码、指令遵循、多语言、代理与函数调用以及真实对话数据集,并提供了每个数据集的基本信息和特点。还收集了专门用于偏好对齐的数据集。

0 阅读:1