【发布时间】:2011-03-12 15:00:31
【问题描述】:
我必须通过引用或指针将数组传递给其他函数,只要它工作得快,我不在乎。这就是我开始使用 boost 库的原因。我是通过以下方式做到的:
using namespace boost;
typedef multi_array<long double, 4> array_type;
typedef multi_array<long double, 2> twod_array_type;
typedef multi_array<long double, 1> vec_type;
作为函数:
void pde_3d_7_stencil_discretization(array_type& A, vec_type& b, vec_type& x,const int& xdim, const int& ydim,const int& zdim)
void gmressolver3d(array_type& A, vec_type& x, vec_type& rhs,const int& KrylovDim,const int& xdim,const int& ydim,const int& zdim,const int& COP, const int& threeDStencil)
在主函数中:
array_type A(extents[threeDimStencil][COP][COP][xdim*ydim*zdim]);
vec_type b(extents[xdim*ydim*zdim*COP]);
vec_type x(extents[xdim*ydim*zdim*COP]);
pde_3d_7_stencil_discretization(A,b,x,xdim,ydim,zdim);
gmressolver3d(A,x,b,KrylovDim,xdim,ydim,zdim,COP,threeDimStencil);
显然,我做错了,因为代码的运行速度比静态版本慢,静态版本不涉及任何引用/指针,只是将数组从一个函数传递到另一个函数。
我能做些什么来加速这个过程?
感谢您的任何帮助..
编辑:我正在发布这些代码的作用,来自 GMRES 求解器的序列:其中的所有数组也使用 Boost 进行了初始化,例如:
vec_type pp(extents[zdim*xdim*ydim*COP]);
vec_type ppp(extents[zdim*xdim*ydim*COP]);
vec_type w(extents[zdim*xdim*ydim*COP]);
vec_type y(extents[KrylovDim]);
vec_type vv(extents[zdim*xdim*ydim*COP]);
vec_type b(extents[KrylovDim+1]);
vec_type ro(extents[zdim*xdim*ydim*COP]);
vec_type out1(extents[xdim*zdim*ydim*COP]);
vec_type m_jac(extents[xdim*zdim*ydim*COP]);
twod_array_type h(extents[KrylovDim+1][KrylovDim]);
twod_array_type v(extents[zdim*xdim*ydim*COP][KrylovDim]);
twod_array_type hess(extents[KrylovDim+1][KrylovDim]);
array_type maa(extents[threeDStencil][COP][COP][zdim*xdim*ydim]);
array_type maaa(extents[threeDStencil][COP][COP][zdim*xdim*ydim]);
for (i=0;i<m+1;i++){
b[i] = 0;
for(k=0;k<m;k++){
h[i][k] = 0.0;
}
}
for (i=0;i<n;i++){
v[i][0] = ro[i]/r;
}
for(j=0;j<m;j++){
b[0] = r;
vector_zero_fill(n,ppp);
for(i=0;i<n;i++){
vv[i]=v[i][j];
}
//********************MATRIX FREE********************
matrix_vector_product_heptadiagonal_discret(A,vv,pp,xdim,ydim,zdim);
//two_vector_dot_product(n,pp,m_jac);
// if(isPrec)
// forback(A,pp);
//********************MATRIX FREE********************
//pretty fast**
for(i=0;i<=j;i++){
for(k=0;k<n;k++){
h[i][j] = h[i][j] + pp[k]*v[k][i];
}
}
for(i=0;i<=j;i++){
for(k=0;k<n;k++){
ppp[k] = ppp[k] + h[i][j]*v[k][i];
}
}
p=0.0;
for(i=0;i<n;i++){
w[i] = pp[i] - ppp[i];
p = p + pow(w[i],2);
}
h[j+1][j] = sqrt(p);
for(i=0;i<=j+1;i++){
for(k=0;k<=j;k++){
hess[i][k] = h[i][k];
}
}
for(i=0;i<j+1;i++){
c = hess[i][i]/sqrt(pow(hess[i][i],2)+pow(hess[i+1][i],2));
s = hess[i+1][i]/sqrt(pow(hess[i][i],2)+pow(hess[i+1][i],2));
for (k=0;k<=j;k++){
inner1=c*hess[i][k]+s*hess[i+1][k];
inner2=(-s)*hess[i][k]+c*hess[i+1][k];
hess[i][k] = inner1;
hess[i+1][k] = inner2;
}
b[i+1] = -s*b[i];
b[i] = c*b[i];
}
【问题讨论】:
-
您发布的所有内容都是声明。我们应该猜测
pde_3d_7_stencil_discretization和gmressolver3d做什么吗?请显示您访问 multi_arrays 的实际代码。显示循环和内部循环。您还应该尝试运行分析器以查看瓶颈在哪里。 -
愚蠢的问题:您是否在启用优化的情况下进行编译?如果禁用优化,那么
multi_array肯定会运行缓慢。 -
您如何分析这两个版本以得出 multi_array 的使用是瓶颈?
-
@Emilie Cormier - 我只是认为问题可能出在声明中,这就是我刚刚发布这些的原因
-
@Sam Miller - 我唯一的标准是速度。这太慢了。例程 gmressolver 和 pde-discretization 用于离散化和求解 PDE
标签: c++ visual-c++ optimization boost multidimensional-array