cuda初步了解
找到对应的设备信息查看自己的设备性能

(008) Multiprocessors, (064) CUDA Cores/MP: 512 CUDA Cores解释为
有8个SM每个SM中有两个MP每个MP有32个core所有64个(064) CUDA Cores/MP
一些GPU的架构

Warp size: 32这个参数是指
每次执行的最小调度单位
所以叫做并行计算,只有启动的任务越多,效果才会越好
core是单精度的,DP是双精度的,LD/ST内存操作,SFU做特殊的三角函数等

这有一级缓存二级缓存