nvtrisrip是NVIDIA提供的一个开源优化库,这个库可以将三角形顶点索引数组转换为三角形带索引数组。可以极大的提高渲染速度。
NVIDIA这个库的官方地址是:
http://www.nvidia.com/object/nvtristrip_library.html
不过这里代码不全也不够新,推荐从GitHub上下载:
https://github.com/turbulenz/NvTriStrip
下载完毕后,我们把下面文件夹中的源代码加入到项目中:
/NvTriStrip/include
/NvTriStrip/src
一共为6个文件
需要注意的是VertexCache类有个非常奇怪的设计,在.h和.cpp中同时有两套实现代码。这会导致重定义,我们可以把.h中的代码注释起来。另外还需要修改entries变量为unsign short类型。
|
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
|
#ifndef VERTEX_CACHE_H #define VERTEX_CACHE_H #include <string.h> class VertexCache
{ public:
VertexCache(int size);
// {// numEntries = size;// // entries = new int[numEntries];// // for(int i = 0; i < numEntries; i++)// entries[i] = -1;// } VertexCache();// { VertexCache(16); }
~VertexCache();// { delete[] entries; entries = 0; }
bool InCache(int entry);
// {// bool returnVal = false;// for(int i = 0; i < numEntries; i++)// {// if(entries[i] == entry)// {// returnVal = true;// break;// }// }// // return returnVal;// } int AddEntry(int entry);
// {// int removed;// // removed = entries[numEntries - 1];// // //push everything right one// for(int i = numEntries - 2; i >= 0; i--)// {// entries[i + 1] = entries[i];// }// // entries[0] = entry;// // return removed;// } void Clear();
// {// memset(entries, -1, sizeof(int) * numEntries);// } void Copy(VertexCache* inVcache) ;
// {// for(int i = 0; i < numEntries; i++)// {// inVcache->Set(i, entries[i]);// }// } int At(int index);// { return entries[index]; }
void Set(int index, int value);// { entries[index] = value; }
private:
// int *entries; //此处修改为unsigned short
unsigned short *entries;
int numEntries;
}; #endif |
我们看一下在SIO2中的使用,其他引擎中的用法,大同小异
|
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
|
void ObjMod::optimize_mesh(unsigned int mesh_index, unsigned int vertex_cache_size) {
ObjMesh *objmesh = &this->objmesh[ mesh_index ];
unsigned int i = 0,
s = 0;
unsigned short n_group = 0;
//设置顶点缓存大小,顶点缓存越大,优化时间越长,优化效果越好,但是成边界递减关系
if( vertex_cache_size )
SetCacheSize( vertex_cache_size );
while( i != objmesh->n_objtrianglelist )
{
PrimitiveGroup *primitivegroup;
//通过三角形索引创建
//四个参数依次:被优化的三角形索引数组,三角形索引元素数量,优化后的三角形带数组,优化后的三角形带元素个数
if( GenerateStrips( objmesh->objtrianglelist[ i ].indice_array,
objmesh->objtrianglelist[ i ].n_indice_array,
&primitivegroup,
&n_group,
true ) )
{
if( primitivegroup[ 0 ].numIndices < objmesh->objtrianglelist[ i ].n_indice_array )
{
objmesh->objtrianglelist[ i ].mode = GL_TRIANGLE_STRIP;//渲染模式修改为三角形带
objmesh->objtrianglelist[ i ].n_indice_array = primitivegroup[ 0 ].numIndices;//重置数据数量
//重新申请内存//
s = primitivegroup[ 0 ].numIndices * sizeof( unsigned short );
//这块使用realloc有点浪费空间,因为优化后的三角形带占用内存比原先的三角形索引要小
objmesh->objtrianglelist[ i ].indice_array = ( unsigned short * ) realloc( objmesh->objtrianglelist[ i ].indice_array,
s );
//复制数据
memcpy( &objmesh->objtrianglelist[ i ].indice_array[ 0 ],
&primitivegroup[ 0 ].indices[ 0 ],
s );
}
//删除优化后的临时数据
delete[] primitivegroup;
}
++i;
}
} |
我们这里调用库的函数有两个:
SetCacheSize为设置优化库使用的缓存大小并非越大越好。而是根据模型精细度来考量的。
GenerateStrips就是核心的三角形优化算法了。
然后保存输出的数据删掉临时数据即可。
下面是一个测试报告,画面数为4726个三角形的静态模型。重复绘制模型200次,在iPad mini2上面的结果是:
未开三角形带优化时的FPS:
开启三角形带优化之后的FPS:
FPS提高了70%,效果还是非常明显的。
在这里为了方便,我们使用的是在线优化方式(模型数据加载进内存后再优化)。而实际开发中,往往多使用离线优化,预先处理好模型数据,然后直接调用渲染就可以了,这样没有缓存和时间限制,效果更好。
这个库是平台无关,也没有第三方依赖,可以很方便的集成到自己的工具中去。
本文转自 老G 51CTO博客,原文链接:http://blog.51cto.com/goldlion/1539218,如需转载请自行联系原作者