Lab / Research
🏗️

Hierarchical Activation Steering

Multi-Scale Representation Control

Stage 12 Complete
10
精选论文
12/12
研究阶段
3
核心贡献
NeurIPS
目标会议

🔄 Research Evolution

单一引导
2306.11728
组合引导
2311.15548
层次引导
2402.05166

💡 Core Contribution

从单一尺度到多尺度:Transformer 不同层编码不同抽象层次的信息,复杂推理需要同时操控多个层次。

分层激活引导框架
在不同网络深度实现多尺度控制
自适应权重机制
自动学习各层引导权重
系统性评估
在多个推理基准上验证

⚠️ Research Gaps

G1
元学习自动权重
层次权重依赖手动调优
G5
组合-层次统一理论
缺乏统一的组合-层次框架
G2
信息论分析框架
层次引导的信息论分析不足

📋 Paper Outline

1 Introduction 1.5 pages
2 Background 2.5 pages
3 Hierarchical Framework 4 pages
4 Experimental Setup 2 pages
5 Results 4 pages
6 Discussion 2 pages
7 Conclusion 1 pages
Total: 17 pages Target: NeurIPS/ICML/ICLR

📚 Key Papers

core 2402.05166 Hierarchical Steering of Transformer
core 2306.11728 Activation Steering for LM Control
core 2310.01405 Representation Engineering