Machine Learning for Compilers-A Modern Perspective

Abstract

本综述系统性地回顾了自动调优领域的最新进展，并探讨了大型语言模型（LLMs）在代码优化和程序表示中的作用。通过整合算法、工具、数据集和基准测试等方面的研究成果，本工作总结了领域中的关键趋势、挑战和研究机会，构建了全面的框架，为未来研究提供了方向。

Introduction

Motivation and Challenges

随着现代软件和硬件系统的复杂性不断增加，传统的手动性能调优方法已无法满足实际需求。数据驱动的自动调优技术和大型语言模型（LLMs）的引入，为性能优化提供了新思路。然而，领域内仍面临许多挑战，例如算法的可扩展性、模型的适应性、数据集偏差以及评价标准的不一致。这些问题的存在表明对这一领域进行系统性综述的必要性。

Contributions of This Survey

本综述的目的是通过整合自动调优和基于 LLM 的优化技术的最新研究，系统地梳理这一领域的发展现状和面临的问题。我们的主要贡献包括：

Overview

Survey Scope and Focus

本综述聚焦于自动调优技术和基于 LLM 的方法的交叉领域，涵盖算法、工具、数据集、基准测试和方法论等多个关键组成部分。我们重点分析这些要素在代码优化中的作用，并探讨它们在不同应用领域中的潜力。

Key Trends in the Field

近年来，自动调优领域涌现出了一些重要趋势，包括 LLM 在自动调优管道中的集成、创新的基准测试方法的出现，以及性能分析与优化工具的不断发展。本部分将总结这些趋势，并讨论它们对未来研究的影响。

Auto-tuning Components

Algorithms

算法是自动调优的核心。本节将自动调优算法分为基于启发式的方法、基于机器学习的方法以及强化学习方法三类，并探讨它们各自的优点、局限性以及在不同场景下的应用。

Heuristic-Based Approaches
Machine Learning for Auto-Tuning
Reinforcement Learning in Tuning

Tools

自动调优工具通过提供性能分析和优化框架，为高效的性能调优奠定了基础。本节将回顾当前主流的性能分析工具，并探讨新兴的自动调优框架如何应对实际需求。

Profiling and Performance Analysis Tools
#TODO20241224
Auto-Tuning Frameworks
#TODO20241224

Datasets

数据集是训练和评估自动调优方法的基础。本节将讨论当前可用的公开数据集，以及这些数据集中存在的偏差和局限性，同时提出改进方向。

Publicly Available Datasets
#TODO20241224 随着深度学习的普及，
Dataset Bias and Limitations
#TODO20241224

Benchmarks

基准测试是衡量自动调优方法性能的关键。本节将介绍标准化的基准测试方法，并探讨创新型基准的作用，特别是在推动新技术发展的过程中。

Standardized Benchmarks for Evaluation
#TODO20241223
Innovative Benchmark
#TODO20241223

LLMs

大型语言模型（LLMs）正逐渐成为自动调优领域的重要工具。本节将探讨预训练 LLM 在代码理解中的作用，如何针对特定任务进行微调，以及 LLM 在自动调优中面临的挑战。

Pre-trained LLMs for Code Understanding
许多大模型在促进代码理解方面作出了不少努力。和支持人类语言的LLMs不同，代码生成需要xxx的几个方面。
- github Copilot
- 到现在的排行榜
  LLVM IR这门语言的发展较为薄弱，大部分是因为
Fine-Tuning LLMs for Specific Tasks
Challenges in LLM-Based Auto-Tuning