魔女团新闻

【KernelBench：用于评估大语言模型(LLM)编写GPU内核能力的基准测

爱生活爱珂珂 2024-12-06 21:59:24

【KernelBench：用于评估大语言模型(LLM)编写GPU内核能力的基准测试工具。提供4个级别的测试类别，包括单内核运算符、简单融合模式、完整模型架构和HuggingFace模型优化。可测试LLM将PyTorch算子转译为CUDA内核的能力，并评估生成代码的编译、正确性和性能】

'KernelBench - Can LLMs Write GPU Kernels? A benchmark for evaluating LLMs' ability to generate GPU kernels'

GitHub: github.com/ScalingIntelligence/KernelBench

0 阅读：4

猜你喜欢