[LG]《Topographical sparse mapping: A neuro-inspired sparse training framework for deep learning models》M Kamelian Rad, F Neri, S Moschoyiannis, R Bauer [University of Surrey] (2025)
在当今人工智能迅猛发展的背景下,深度学习模型参数数量激增,带来了高昂的计算成本和能耗挑战。本文提出了一种全新且高效的神经启发稀疏训练框架——拓扑稀疏映射(TSM)及其增强版ETSM,突破了传统稀疏训练方法的局限。
核心观点如下:
1. 神经启发的拓扑稀疏连接设计
TSM受脊椎动物视觉系统拓扑结构启发,模拟视网膜中稀疏、局部且有序的神经连接,实现输入层稀疏化设计。每个输入特征对应唯一的连接,连接数仅与输入特征数量相关,独立于接收层神经元数。这种结构消除了随机连接引发的索引和优化复杂度,显著降低参数量和计算需求。
2. 增强版ETSM结合动态剪枝
ETSM在TSM基础上引入训练早期的动态剪枝策略,通过权重幅度门槛实现用户指定稀疏率,无需传统方法中的连接再生(regrowth)阶段,避免复杂计算和额外内存消耗,训练更高效且稳定。
3. 性能与效率优势显著
- 在MNIST、Fashion-MNIST、CIFAR-10及CIFAR-100等多种数据集上,ETSM在极高稀疏率(93%-98.9%)下均超越或持平现有领先稀疏训练方法的准确率。
- 在CIFAR-100上,ETSM比最佳对比方法准确率提升约14%,且训练周期减少5-20倍。
- TSM/ETSM通过结构化稀疏连接加速收敛,减少训练所需FLOPs和能耗,TSM训练能耗仅为传统稠密网络的0.00019%-0.00095%,极大提升了绿色AI的可行性。
4. 拓扑稀疏映射优于随机稀疏策略
系统比较了拓扑映射、全局随机和局部随机三种稀疏连接方式,结果表明拓扑映射不仅提升准确率3%-4%,且训练过程更稳定、结果方差更小,体现了生物启发结构的优势。
5. 避免信息丢失,保持全特征利用
与传统特征剪枝不同,TSM设计保证所有输入特征均被映射,无需复杂的特征选择或降维,避免了信息损失,提高了泛化能力。
6. 生物学启发与计算效率的结合
ETSM的设计理念源自大脑发育过程——初期密集连接随后剪枝,映射至ANN即为先稀疏初始化加早期剪枝微调。此策略打破了稀疏性与准确率的传统权衡,实现两者兼顾。
7. 应用前景广阔
由于多层感知机(MLP)是众多现代模型(包括CNN、Transformer等)的基础组件,ETSM框架具备广泛适用性。未来可将其拓展至更大规模模型和其他架构,实现AI训练和推理的节能减排。
总结来说,TSM和ETSM用结构化、拓扑化的神经连接策略,结合动态剪枝,提供了一条高效、低能耗且不牺牲性能的深度学习稀疏训练新路径。该研究不仅推动了神经启发AI设计理念的发展,也为实现可持续AI技术奠定了坚实基础。
详细内容和实验数据请见原文链接:
elsevier.com/locate/neucom/article/pii/S0925231225024129












