缓存结构GPU矩阵乘法算法的自动优化
완존결구GPU구진승법산법적자동우화
Auto-tuning of matrix multiplication for Fermi GPU
저자의 최근 논문