【KernelBench:用于评估大语言模型(LLM)编写GPU内核能力的基准测

爱生活爱珂珂 2024-12-06 21:59:24

【KernelBench:用于评估大语言模型(LLM)编写GPU内核能力的基准测试工具。提供4个级别的测试类别,包括单内核运算符、简单融合模式、完整模型架构和HuggingFace模型优化。可测试LLM将PyTorch算子转译为CUDA内核的能力,并评估生成代码的编译、正确性和性能】

'KernelBench - Can LLMs Write GPU Kernels? A benchmark for evaluating LLMs' ability to generate GPU kernels'

GitHub: github.com/ScalingIntelligence/KernelBench

0 阅读:4