【KernelBench:用于评估大语言模型(LLM)编写GPU内核能力的基准测试工具。提供4个级别的测试类别,包括单内核运算符、简单融合模式、完整模型架构和HuggingFace模型优化。可测试LLM将PyTorch算子转译为CUDA内核的能力,并评估生成代码的编译、正确性和性能】
'KernelBench - Can LLMs Write GPU Kernels? A benchmark for evaluating LLMs' ability to generate GPU kernels'
GitHub: github.com/ScalingIntelligence/KernelBench