首页 > 技术 > ML/机器学习

gpu的渲染流程是怎样的?有何优势?

人阅读 2024-04-25 23:23:09

在下述的内容中,小编将会对GPU的相关消息予以报道,如果GPU是您想要了解的焦点之一,不妨和小编共同阅读这篇文章哦。

一、GPU渲染流程

GPU的渲染流水线的主要任务是完成3D模型到图像的渲染(render)工作,典型的渲染过程可以分为以下几个阶段:

1.顶点生成

图形学API用简单的图元(点、线、三角形)表示物体表面。每个顶点除了( x , y , z ) 三维坐标属性外还有应用程序自定义属性,例如位置、颜色、标准向量等。

2.顶点处理

本阶段主要是通过计算把三维顶点坐标映射到二维屏幕,计算各顶点的亮度值等。这个阶段是可编程的,由vertex shader完成。输入与输出一一对应,即一个顶点被处理后仍然是一个顶点,各顶点间的处理相互独立,可以并行完成。

3.图元生成

根据应用程序定义的顶点拓扑逻辑,把上阶段输出的顶点组织起来形成有序的图元流。顶点拓扑逻辑定义了图元在输出流中的顺序,一个图元记录由若干顶点记录组成。

4.图元处理

这一阶段也是可编程的,由geometry shader完成。输入和输出不是一一对应,一个图元被处理后可以生成0个或者多个图元,各图元处理也是相互独立的。本阶段输出一个新的图元流。

5.片元生成

这一阶段将对每一个图元在屏幕空间进行采样,即光栅化。每一个采样点对应一个片元记录,记录该采样点在屏幕空间中的位置、与视点之间的距离以及通过插值获得的顶点属性等。

6.片元处理

片元处理阶段是可编程的,由pixel shader完成,主要完成图形的填色功能。模拟光线和物体表面的交互作用,决定每个片元的颜色及透明程度等属性。

7.像素操作

用每个片元的屏幕坐标来计算该片元对最终生成图像上的像素的影响程度。本阶段计算每个采样点离视点的距离,丢弃被遮挡住的片元。当来自多个图元的片元影响同一个像素时,往往都根据图元处理输出流中定义的图元位置进行像素更新。

二、GPU渲染优势

GPU 有数千个以相对较低的时钟速度运行的小内核。在这种情况下,正是这些核心的数量让 GPU 能够提供强大的渲染性能。GPU 本质上被设计为以并行方式运行任务。这使它们比 CPU 更具优势,因为渲染是一项通常涉及许多元素的任务。因此,GPU 以其极快的渲染时间而闻名。

快速渲染允许 GPU 实时处理图形,这就是为什么您会发现现代视频游戏使用 GPU 运行起来更加流畅。与游戏行业一起,GPU 已经彻底改变了加密大数据人工智能和机器学习领域。

GPU 渲染在许多领域逐渐普及,正在挑战传统的 CPU 渲染系统。Autodesk 的 Arnold 推出了他们的GPU 渲染引擎,认识到其巨大潜力。

GPU 渲染允许同时运行更多的并行进程,这使其速度更快,但它可以执行的任务数量有限。因此,在渲染具有许多对象的大型、详细场景时,它就没有那么强大了。另一方面,CPU 渲染不允许并行进程,但它可以执行更多不同的任务,从而呈现更多细节。Mythbusters 的演示中展示了两种渲染类型之间的区别。

GPU 并行运行任务,这通常会提高速度,因为可以同时渲染场景的各种元素。这会导致更快的周转并有助于重复过程.

GPU 也主要用于需要实时染的领域 (如视频游戏)。

与性能级 CPU 相比,GPU 接近价格范围的低端。一个好的 GPU,比如RTX 3090,可以花费大约 1500 美元,而像Threadripper 3990x这样强大的 CPU 的价格是 5000 美元。GPU 还在升级方面为您提供优势。您只需将另一个 GPU 连接到您预先存在的设置,就可以了。当您希望使用 CPU 进行升级时,除了 CPU 的成本之外,您可能还需要投资购买更多兼容的硬件。

经由小编的介绍,不知道你对GPU是否充满了兴趣?如果你想对它有更多的了解,不妨尝试度娘更多信息或者在我们的网站里进行搜索哦。

LOT物联网

iot产品 iot技术 iot应用 iot工程

Powered By LOT物联网  闽ICP备2024036174号-1

联系邮箱:support1012@126.com