简单说说显卡的浮点运算

显示全部楼层 · 发表于 2009-5-28 16:44:33

定义还是维基或者百度吧

这里简单说说显卡的浮点运算

例如一条 FMADD 指令，可以看成是 d=a+b*c，这里有两个运算符，因此这条指令算是 2 flops

而类似mul，ADD单个指令，就是1 flops

而若是mul+一些函数运算（比如在R700中交给1D 处理的sin，cos）那么其结果就是 2 flops

当然上面的基本都是单精度运算

shader频率（A卡和核心频率一致）xSPxflops也便是我们通常说的浮点运算能力了

ps:本文乃个人原创，不过转载随意，只是让一些朋友们简单了解一下浮点运算

显示全部楼层 · 发表于 2009-5-28 16:52:59

gpu主要还是没缓存

显示全部楼层 · 发表于 2009-5-28 17:21:13

人们引入cache主要是因为所谓的局部性原理，即"最近使用的数据可能会被再次使用"的时间局部性和"最近使用过的cache-line中的其他字节可能会在不久后使用"的空间局部性。

还有其实GPU有缓存，但是很少，比如R700里的Local Data Share，G80的shared memory。

为什么在GPU引入一定量的cache，主要还是因为显存的带宽（即使是GDDR5，实际频率也只不过是225mhz）和GPU差距越来越大，存取lag越来越高，为了解决GPU无法被“喂饱”的情况，我们会引入高速缓存（当然还有平铺线程，Multi-Threading），来提高数据流通读。

不过GPU终究只能引入少量的cache，毕竟对流量控制，分支预测什么的没有太大要求，把晶体管更多的投入到数据运算方面。

显示全部楼层 · 发表于 2009-5-28 19:38:54

来扫盲一下

显示全部楼层 · 发表于 2009-5-28 19:44:56

了解了

以前不太懂的说

显示全部楼层 · 发表于 2009-5-28 23:16:33

学习学习，研究研究，知道知道，了解了解..............头晕中

[分享] 简单说说显卡的浮点运算

评分

回复 2楼 easybeing 的帖子