OpenGL Draw 命令

Overview

OpenGL 有很多 Draw 命令, 大体分为 4 类:

  • DrawArrays
  • DrawElements (Indexed)
  • DrawInstanced
  • DrawIndirect

所谓的绘制,如果从pipeline的角度看,实际上主要是顶点着色(vertex shading)的过程。所以这些绘制方式中主要涉及的问题是顶点(vertices)及这些顶点如果构成图元(primitives)。这些绘制方式的不同主要在于它们各自是如何看待顶点,例如,在Basic绘制中,顶点就是顶点,而在Indexed绘制中,除了顶点本身外,还给出了构造三角形的顶点索引,这在特定场景下,是一种更有效率的绘制方式。

OpenGL中的Draw Commands是一组生成GPU渲染Command Stream的API,我们可以将它们简单分为4类:

Drawing 适用场景 Vertex Attributes Buffer Object Binding类型
Array 普通 GL_ARRAY_BUFFER
Indexed 重复的顶点 GL_ELEMENT_ARRAY_BUFFER
Instanced 重复的模型(Instance/Model) GL_ARRAY_BUFFER
GL_ELEMENT_ARRAY_BUFFER
Indirect Drawing命令的参数直接放在GPU GL_DRAW_INDIRECT_BUFFER

Array Drawing是最基本的Draw命令,其它3类都是从它衍生来的,为了某种绘制便利或顶点复用对Array Drawing API进行扩展,从而得到相应的索引绘制、实例绘制、间接绘制。

DrawArrays

1
2
3
void glDrawArrays(GLenum mode,
GLint first,
GLsizei count);

glDrawArrays是OpenGL中最基本的绘制命令,mode接受的图元类型是下面的一个子集:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
/* Primitives */
#define GL_POINTS 0x0000
#define GL_LINES 0x0001
#define GL_LINE_LOOP 0x0002
#define GL_LINE_STRIP 0x0003
#define GL_TRIANGLES 0x0004
#define GL_TRIANGLE_STRIP 0x0005
#define GL_TRIANGLE_FAN 0x0006
#define GL_QUADS 0x0007
#define GL_QUAD_STRIP 0x0008
#define GL_POLYGON 0x0009
#define GL_LINES_ADJACENCY 0x000A (since OpenGL 3.2)
#define GL_LINE_STRIP_ADJACENCY 0x000B (since OpenGL 3.2)
#define GL_TRIANGLES_ADJACENCY 0x000C (since OpenGL 3.2)
#define GL_TRIANGLE_STRIP_ADJACENCY 0x000D (since OpenGL 3.2)
#define GL_PATCHES 0x000E (since OpenGL 3.2)

例如顶点数组如下

1
2
3
4
5
6
7
    vertices
----------
0 | (-1, 1) |
1 | (-1, -1) |
2 | ( 1, -1) |
3 | ( 1, 1) |
----------

用3个顶点绘制一个三角形,调用命令如下

1
glDrawArrays(GL_TRIANGLES, 0, 3);

DrawElements

1
2
3
4
5
6
7
8
9
10
11
void glDrawElements(GLenum mode,
GLsizei count,
GLenum type,
const void* indices);


void glDrawElementsBaseVertex(GLenum mode,
GLsizei count,
GLenum type,
void* indices
GLint basevertex);

glDrawElements不是直接用顶点数组去绘制,而是用顶点数组的索引去绘制,例如还是用3个顶点绘制一个三角形

1
2
3
4
5
6
7
    vertices
----------
0 | (-1, 1) |
1 | (-1, -1) |
2 | ( 1, -1) |
3 | ( 1, 1) |
----------

这次除了顶点数组外,我们还要上传一个顶点索引数组

1
2
3
4
5
6
  indices
-----
0 | 0 |
1 | 1 |
2 | 2 |
-----

调用命令如下

1
glDrawElements(GL_TRIANGLES, 3, GL_UNSIGNED_BYTE, &indices);

当然上面这个只有3个顶点的例子体现不出来glDrawElements的复用顶点的好处,但是在三角形很多且这些三角形的顶点有很多重复的情形下就不同了,它的优势就体现出来了:

  • 虽然我们额外增加了一个索引数组indices去存储所绘制顶点的索引,但相比一个顶点最多4个float类型的数据量来说,用一个unsigned byte来表示一个顶点还是划算的。
  • 在顶点坐标一样,只需改变顶点顺序的图元绘制中,将大大减少数据量。

glDrawElementsBaseVertex的行为和glDrawElements一样,除了在所取到的索引数组相应元素值上加basevertex. 考虑如下情况:

1
2
3
4
5
6
7
8
9
    vertices                indices
---------- -----
0 | (-1, 1) | 0 | 0 |
1 | (-1, -1) | 1 | 1 |
2 | ( 1, -1) | 2 | 2 |
3 | ( 1, 1) | 3 | 3 |
---------- 4 | 0 |
5 | 2 |
-----

这种情况下,我们一般会调用

1
glDrawElements(GL_TRIANGLES, 6, GL_UNSIGNED_BYTE, &indices);

但是如果所索引的顶点不在顶点数组的开始,而是从第100个顶点开始

1
2
3
4
5
6
7
8
9
      vertices                indices2
---------- -----
.... 0 | 100 |
100 | (-1, 1) | 1 | 101 |
101 | (-1, -1) | 2 | 102 |
102 | ( 1, -1) | 3 | 103 |
103 | ( 1, 1) | 4 | 100 |
.... 5 | 102 |
---------- -----

这种情况下原来的indices不能用了,只能再创建并绑定一个新的VBO indices2, 而创建绑定VBO是内存操作开销很大,glDrawElementsBaseVertex就是解决这个问题的。我们只需要在原来的索引值上加一个offset

1
glDrawElementsBaseVertex(GL_TRIANGLES, 6, GL_UNSIGNED_BYTE, &indices, 100);

Draw*Instanced

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
void glDrawArraysInstanced(GLenum mode,
GLint first,
GLsizei count,
GLsizei instancecount);

void glDrawArraysInstancedBaseInstance(GLenum mode,
GLint first,
GLsizei count,
GLsizei instancecount,
GLuint baseinstance);

void glDrawElementsInstanced(GLenum mode,
GLsizei count,
GLenum type,
const void* indices,
GLsizei instancecount);

void glDrawElementsInstancedBaseInstance(GLenum mode,
GLsizei count,
GLenum type,
const void* indices,
GLsizei instancecount,
GLuint baseinstance);

void glDrawElementsInstancedBaseVertex(GLenum mode,
GLsizei count,
GLenum type,
void* indices,
GLsizei instancecount,
GLint basevertex);

要理解上面这些OpenGL Instanced Draw命令,首先我们要理解一个OpenGL里并不存在的Draw命令

1
2
3
4
5
void glDrawArraysOneInstance(GLenum mode,
GLint first,
GLsizei count,
GLint instance,
GLuint baseinstance);

Instanced Drawing简单说就是一次Draw Call绘制多个实例,比如一个布满树叶的场景,每片树叶的顶点数据可能是相似的,可能就是在世界坐标系中的位置不同,其它顶点属性可能都相同。那么Instanced Drawing是如何复制相同的实例到不同的位置上的呢?

OpenGL主要通过以下两个变量控制Instanced Drawing

  • gl_InstanceID (Vertex Shader)
  • divisor (glVertexAttribDivisor)

gl_InstanceID

gl_InstanceID是Vertex Shader里的内置变量,如果你这样调用

1
glDrawArraysInstanced(GL_TRIANGLES, 0, 3, 100);

那么gl_InstanceID的取值范围就是[0, 99]

divisor

假设location为2的Vertex Attribute用来设置每个实例的位置偏移,shader如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
#version 330 core
layout (location = 0) in vec2 aPos;
layout (location = 1) in vec3 aColor;
layout (location = 2) in vec2 aOffset;

out vec3 fColor;

void main()
{
gl_Position = vec4(aPos + aOffset, 0.0, 1.0);
fColor = aColor;

}

我们可以通过下面的API告诉OpenGL, 每画一个实例更新一下index=2这个属性,而不是默认的,每一个顶点更新一次属性。

1
2
3
4
5
glEnableVertexAttribArray(2);
glBindBuffer(GL_ARRAY_BUFFER, instanceVBO);
glVertexAttribPointer(2, 2, GL_FLOAT, GL_FALSE, 2 * sizeof(float), (void*)0);
glBindBuffer(GL_ARRAY_BUFFER, 0);
glVertexAttribDivisor(2, 1);

Draw*Indirect

Indirect Drawing是将Array/Indexed Drawing命令的参数存入专门的Buffer Object,也就是GPU Storage里,这里的Buffer Object的绑定类型是GL_DRAW_INDIRECT_BUFFER。之所以这样做,是为了能让GPU直接写回这些值,比方Compute Shader, 或者为Transform Feedback设计的Geometry Shader, 亦或是OpenCL/CUDA kernel函数。这样避免了这些参数在GPU和CPU之间来回地复制(round-trip)

DrawArraysIndirect

1
void glDrawArraysIndirect(GLenum mode, const void *indirect);

在OpenGL ES 3.1及以上,DrawArraysIndirect的Draw Parameters被定义成下面的结构体:

1
2
3
4
5
6
typedef struct {
uint count;
uint instanceCount;
uint first;
uint reservedMustBeZero;
} DrawArraysIndirectCommand;

在OpenGL 4.0及以上,DrawArraysIndirect的Draw Parameters被定义成下面的结构体:

1
2
3
4
5
6
typedef struct {
uint count;
uint instanceCount;
uint first;
uint baseInstance;
} DrawArraysIndirectCommand;

之所以 ES 的 DrawIndirectCommand 里没有 baseInstance,是因为 ES 没有下面的命令:

1
2
3
4
5
void glDrawArraysIntancedBaseInstance(GLenum mode,
GLint first,
GLsizei count,
GLsizei instancecount,
GLuint baseinstance);

因此在 ES 中,glDrawArraysIndirect() 可以分解成

1
2
DrawArraysIndirectCommand *cmd = (DrawArraysIndirectCommand *)indirect;
DrawArraysInstanced(mode, cmd->first, cmd->count, cmd->instanceCount);

而在OpenGL中,glDrawArraysIndirect() 可以分解成

1
2
3
DrawArraysIndirectCommand *cmd = (DrawArraysIndirectCommand *)indirect;
DrawArraysInstancedBaseInstance(mode, cmd->first, cmd->count,
cmd->instanceCount, cmd->baseInstance);

下面是 SuperBible7 multidrawindirect 中 MultiDraw 的实现 (GL_ARB_multi_draw_indirect 是 4.1 引入的新扩展):

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
if (mode == MODE_MULTIDRAW)
{
glMultiDrawArraysIndirect(GL_TRIANGLES, NULL, NUM_DRAWS, 0);
}
else if (mode == MODE_SEPARATE_DRAWS)
{
for (j = 0; j < NUM_DRAWS; j++)
{
GLuint first, count;
object.get_sub_object_info(j % object.get_sub_object_count(), first, count);
glDrawArraysInstancedBaseInstance(GL_TRIANGLES,
first,
count,
1, j);
}
}

DrawElementsIndirect

1
void glDrawElementsIndirect(GLenum mode, GLenum type, const void *indirect);

在ES 3.1中, DrawElementsIndirect的Draw Parameters被定义成下面这个结构体:

1
2
3
4
5
6
7
typedef struct {
uint count;
uint instanceCount;
uint firstIndex;
int baseVertex;
uint reservedMustBeZero;
} DrawElementsIndirectCommand;

而在OpenGL 4.0及以上, DrawElementsIndirect的indirect指向的Draw Parameters被定义成下面的结构体:

1
2
3
4
5
6
7
typedef struct {
uint count;
uint primCount;
uint firstIndex;
uint baseVertex;
uint baseInstance;
} DrawElementsIndirectCommand;

Mesa 实现 Indirect Draw

应该很少有直接支持 Indirect Draw 的硬件,Mesa 中提供一个 utility 函数 util_draw_indirect(), 它将 indirect buffer 中的参数分析后把 indirect draw 展开成普通的 gallium->draw_vbo(), 像 sb7code 中 multidrawindirect 这个 demo, 展开后的循环次数是 50000 次。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
/* This extracts the draw arguments from the indirect resource,
* puts them into a new instance of pipe_draw_info, and calls draw_vbo on it.
*/
void
util_draw_indirect(struct pipe_context *pipe,
const struct pipe_draw_info *info_in,
unsigned drawid_offset,
const struct pipe_draw_indirect_info *indirect)
{
...
for (unsigned i = 0; i < draw_count; i++) {
struct pipe_draw_start_count_bias draw;

draw.count = params[0];
info.instance_count = params[1];
draw.start = params[2];
draw.index_bias = info_in->index_size ? params[3] : 0;
info.start_instance = info_in->index_size ? params[4] : params[3];

pipe->draw_vbo(pipe, &info, i + drawid_offset, NULL, &draw, 1);

params += indirect->stride / 4;
}
...
}

References