Proj CDeepFuzz Paper Reading: Large Language Models are Edge-Case Fuzzers: Testing Deep Learning Libraries via FuzzGPT

雪溯 / 2023-08-07 / 原文

Abstract

背景:

  1. 深度学习库需要满足编程语言的语法、语义需求,也需要满足valid computational graphs的tensor/operator constraints
  2. LLM倾向于生成普通正常的程序,但是模糊测试则需要异常模式
  3. 历史错误可能更有价值

本文:FuzzGPT
Task: fuzzing deep learning libraries
目的:通过学习历史错误,使用大模型自动生成语法、语义有效的异常模式下的测试程序
基础模型:Codex,CodeGen
实验:
测试对象:PyTorch, TensorFlow
效果:

  1. 检测到76个错误,49个已确认,11个高优先级错误或者安全漏洞