【NIPS】LLVM IR数据集论文 | 逸翎清晗🌈
avatar
文章
168
标签
39
分类
52

首页
文章
  • 归档
  • 标签
  • 分类
专区与和合辑
  • 多媒体资料专区
  • 论文导读专区
  • 学术会议专区
  • 推荐学习资料专区
  • 学习路线专区
编译器
操作系统
集成电路
AI编译
大语言模型
程序设计
计算理论
分布式
后台
  • 画廊
  • 统计
  • 休闲
  • 旧时光
  • 个人
  • 关于
逸翎清晗🌈
首页
文章
  • 归档
  • 标签
  • 分类
专区与和合辑
  • 多媒体资料专区
  • 论文导读专区
  • 学术会议专区
  • 推荐学习资料专区
  • 学习路线专区
编译器
操作系统
集成电路
AI编译
大语言模型
程序设计
计算理论
分布式
后台
  • 画廊
  • 统计
  • 休闲
  • 旧时光
  • 个人
  • 关于
PAGE_NAME
搜索

【NIPS】LLVM IR数据集论文

发表于 2025-03-20|更新于2025-06-13|论文个人
|字数总计:14|阅读时长:1分钟|阅读量:
【NIPS】LLVM IR数据集论文
https://yangzi.world/blog/posts/31480576.html
作者
逸翎清晗🌈
发布于
2025-03-20
更新于
2025-06-13
许可协议
CC BY-NC-SA 4.0
cover of previous post
上一篇
构建——如何交叉构建host是其他架构的LLVM
cover of next post
下一篇
LLMRA论文

评论
目录
  1. 正式笔记
    1. 本数据集的目的和意义是什么?
    2. 如何设计下游任务以凸显你的动机?(打动评审?)
    3. 如何将实验设计和数据指标结合?
    4. 提供什么样的工具链?
    5. 这篇论文对编译器社区的作用怎么讲?
    6. 阐释:大家都在做“表示 IR”和“理解 IR”,为啥我要做“丰富 IR、特定优化 IR”?
    7. 怎样证明“让模型优化 IR”这件事,大家确实需要?
    8. 为什么我这篇论文和传统开发类任务不同?
    9. 你这个数据集和别人的有区别吗?人家只不过是未优化的IR数据集,规模还比你大,人家的子集说不定就能达到你的效果
    10. 没有性能数据,优化说服力不够
    11. 没有考虑现实中的程序性能差异
    12. 你这个测试的时候选同样的文件数,那不是函数越大就包含更多pass覆盖率?实验不标准啊?
  • 杂合内容
    1. 动机
    2. 贡献
    3. 新指标:
      1. “多维度优化差异度”(Multi-Dimensional Optimization Diversity, MDOD)
  • 参考论文(结构)
  • 功能
    1. 数据库功能性支持
    2. 工具链支持
  • 参考文献
  • 工作清单
  • 新 Metric
    1. IRIE
      1. 🧨 ① 审稿人的尖锐质疑
      2. 🛠️ ② 具针对性的改进:IRIE‑v2(层级化熵 + 归一化 + 语义加权)
      3. 📈 ③ 如何实现(仅需 2 步)
      4. 📝 ④ 在论文/数据卡中这样写
    1. CFGEntropy
      1. 🧨 审稿人的尖锐批评:CFG Entropy 的不足
      2. 🛠️ 自我修正和优化:CFG Entropy 的改进
        1. 1️⃣ 增强控制流图熵的动态计算:执行代价和路径深度
        2. 批评回应:
        3. 改进方法:引入路径深度、循环结构以及基本块执行代价
        4. 改进后的公式:
        5. 2️⃣ 考虑执行顺序和依赖关系:跳转的动态特性
        6. 批评回应:
        7. 改进方法:引入数据依赖关系和跳转路径的动态特性
        8. 改进后的公式:
        9. 3️⃣ 考虑多种控制结构和语义
        10. 批评回应:
        11. 改进方法:引入控制结构分类和权重
        12. 改进后的公式:
        13. 4️⃣ 考虑与其他复杂度指标的融合
        14. 批评回应:
        15. 改进方法:结合多个复杂度指标
        16. 改进后的公式:
    2. 结构性异质性 (SD)
      1. 🧨 审稿人批评:结构性异质性 (SD) 的不足
      2. 🛠️ 自我修正和优化:结构性异质性(SD)的改进方案
        1. 1️⃣ 引入多层次的结构性分析:从低级到高级的结构分析
        2. 批评回应:
        3. 改进方案:引入低级结构与高级结构的分析
        4. 2️⃣ 动态分析与静态分析结合:加入运行时因素
        5. 批评回应:
        6. 改进方案:结合动态分析,加入运行时调用、分支预测等数据
        7. 3️⃣ 对代码重复和不规则模式的敏感度提升
        8. 批评回应:
        9. 改进方案:检测代码重复、模板实例化和异常处理的影响
        10. 4️⃣ 基 于结构性模式的多元化评分模型
        11. 批评回应:
        12. 改进方案:引入多元化模型,适应不同代码模式和任务场景
        13. 5️⃣ 与其他复杂度指标的结合:形成综合性复杂度模型
        14. 批评回应:
        15. 改进方案:融合 多种复杂度指标,进行加权组合
        16. 综合模型公式:
  • 数据集准备
    1. 对比数据集:
    2. 本数据集
      1. 来源:现有基准测试
      2. 来源:开源计算项目 (Computational Science)
  • 实验准备
    1. IR Understanding
    2. Optimization Analysis IR 分析任务(准确性、对 IR 理解是否正确)
    3. Optimized Code Generation IR2IR 生成优化 IR 的任务
    4. 静态数据集对比
    5. 函数性能对比
  • 《咏菊》 林黛玉

    无赖诗魔昏晓侵,绕篱欹石自沉音。
    毫端蕴秀临霜写,口角噙香对月吟。
    满纸自怜题素怨,片言谁解诉秋心。
    一从陶令平章后,千古高风说到今。✨
    A tour for Stars

    内容导航💡

    • 网址导航我的画廊
    • 关于作者文章归档
    • 文章分类文章标签
    ©2025  By 逸翎清晗🌈

    搜索
    数据库加载中

    复制百度搜索
    转到链接
    粘贴
    空降评论复制本文地址
    新窗口打开转到链接复制链接
    保存图片在新窗口打开复制图片链接
    随便逛逛昼夜切换关于博客美化设置切换全屏打印页面