2月4日消息,据报道,中国的研究人员发明了一种创新的高性能算法,可以大幅提升NVIDIA消费级GPU的科学计算性能,最高达惊人的800倍!
这一算法来自深圳北理莫斯科大学的团队,该校由北京理工大学、莫斯科国立罗蒙诺索夫大学联合创立。
新的算法增强了近场动力学(Peridynamics)的计算效率,这是一种前沿的非局部理论,可以解决材料断裂、损坏等复杂的物理问题,广泛用于航空、工程、军事等领域。
但是,近场动力学的计算非常复杂,传统模拟方法效率不够高。
深圳北理莫斯科大学团队基于NVIDIA CUDA编程技术,创建了新的PD-General框架,优化了算法设计和内存管理,充分利用了GPU的大规模并行计算能力。
在一块普通的RTX 4070显卡上,新的算法比传统串行算法速度提升了惊人的800倍,对比新的OpenMP并行算法也提升了足足100倍。
在涉及上百万粒子的大规模模拟中,新算法完成4000步迭代所需的时间还不到5分钟。
而在大规模2D单轴拉伸问题中,新算法只用不到2分钟,就完成了695万次单精度迭代。
新算法拥有广阔的应用前景,包括但不限于:
- 航空与国防领域:改进航空器结构材料应力与失效的模型。
- 工程与制造领域:提升建筑与工业材料测试的效率。
- 军事研究:加快防御性材料的抗冲击研究。
最为关键的是,这一算法不需要高性能的GPU芯片,不会受到美国制裁限制,只需普通的消费级家用GPU就可以完成。
如果能迁移支持国产GPU硬件,那就更完美了!
标签: NVIDIA