查看: 4495|回复: 5
收起左侧

[分享] 简单说说显卡的浮点运算

[复制链接]
caolizhen
发表于 2009-5-28 16:44:33 | 显示全部楼层 |阅读模式
定义还是维基或者百度吧

这里简单说说显卡的浮点运算

例如一条 FMADD 指令,可以看成是 d=a+b*c,这里有两个运算符,因此这条指令算是 2 flops

而类似mul,ADD单个指令,就是1 flops

而若是mul+一些函数运算(比如在R700中交给1D 处理的sin,cos)那么其结果就是 2 flops

当然上面的基本都是单精度运算

shader频率(A卡和核心频率一致)xSPxflops也便是我们通常说的浮点运算能力了

ps:本文乃个人原创,不过转载随意,只是让一些朋友们简单了解一下浮点运算

评分

参与人数 1人气 +1 收起 理由
永远Ъù分手 + 1 版区有你更精彩: )

查看全部评分

easybeing
头像被屏蔽
发表于 2009-5-28 16:52:59 | 显示全部楼层
gpu主要还是没缓存
caolizhen
 楼主| 发表于 2009-5-28 17:21:13 | 显示全部楼层

回复 2楼 easybeing 的帖子

人们引入cache主要是因为所谓的局部性原理,即"最近使用的数据可能会被再次使用"的时间局部性和"最近使用过的cache-line中的其他字节可能会在不久后使用"的空间局部性。

还有其实GPU有缓存,但是很少,比如R700里的Local Data Share,G80的shared memory。

为什么在GPU引入一定量的cache,主要还是因为显存的带宽(即使是GDDR5,实际频率也只不过是225mhz)和GPU差距越来越大,存取lag越来越高,为了解决GPU无法被“喂饱”的情况,我们会引入高速缓存(当然还有平铺线程,Multi-Threading),来提高数据流通读。

不过GPU终究只能引入少量的cache,毕竟对流量控制,分支预测什么的没有太大要求,把晶体管更多的投入到数据运算方面。
gho
发表于 2009-5-28 19:38:54 | 显示全部楼层
来扫盲一下
悠柚
发表于 2009-5-28 19:44:56 | 显示全部楼层
了解了 以前不太懂的说
dlei6699
发表于 2009-5-28 23:16:33 | 显示全部楼层
学习学习,研究研究,知道知道,了解了解..............头晕中
您需要登录后才可以回帖 登录 | 快速注册

本版积分规则

手机版|杀毒软件|软件论坛| 卡饭论坛

Copyright © KaFan  KaFan.cn All Rights Reserved.

Powered by Discuz! X3.4( 沪ICP备2020031077号-2 ) GMT+8, 2024-5-4 12:29 , Processed in 0.126317 second(s), 17 queries .

卡饭网所发布的一切软件、样本、工具、文章等仅限用于学习和研究,不得将上述内容用于商业或者其他非法用途,否则产生的一切后果自负,本站信息来自网络,版权争议问题与本站无关,您必须在下载后的24小时之内从您的电脑中彻底删除上述信息,如有问题请通过邮件与我们联系。

快速回复 客服 返回顶部 返回列表