【发布时间】:2018-12-28 21:03:41
【问题描述】:
我正在尝试使用 Mersenne Twister 编写使用随机数的高性能代码。大约需要~5ns 来生成随机的unsigned long long。这用于生成double,但是,这些需要~40ns 在分发中生成。
查看STL代码doubles,由分发生成,是通过调用std::generate_canonical生成的,这涉及到std::ceil和std::log2的操作,我相信是这些成本很高。
这些操作是不必要的,因为它们用于计算调用任何 RNG 实现所需的位数。由于这是在编译时间之前就知道的,我已经编写了自己的实现,不会进行这些调用,生成double 的时间是~15ns。
是否可以专门化模板化的 STL 函数?如果是这样,这是如何实现的,到目前为止我的尝试导致原始功能仍在使用。我想专门研究这个 STL 函数,因为我仍然想使用 <random> 中的分布。
这是在 Visual C++ 中,不过一旦代码开发完成,它将在 Linux 上运行并使用 GCC 或 ICC。如果在 Linux 上生成双精度的方法不同,(而且更快),这个问题是无关紧要的。
编辑 1:
我相信所有需要对 std::generate_canonical 进行双重调用的分布,此函数在 [0,1) 范围内创建一个双重,并且通过迭代添加对 RNG operator() 的调用来创建正确的精度。 log2 和 ceil 用于计算迭代次数。
MSVCstd::generate_canonical
// FUNCTION TEMPLATE generate_canonical
template<class _Real,
size_t _Bits,
class _Gen>
_Real generate_canonical(_Gen& _Gx)
{ // build a floating-point value from random sequence
_RNG_REQUIRE_REALTYPE(generate_canonical, _Real);
const size_t _Digits = static_cast<size_t>(numeric_limits<_Real>::digits);
const size_t _Minbits = _Digits < _Bits ? _Digits : _Bits;
const _Real _Gxmin = static_cast<_Real>((_Gx.min)());
const _Real _Gxmax = static_cast<_Real>((_Gx.max)());
const _Real _Rx = (_Gxmax - _Gxmin) + static_cast<_Real>(1);
const int _Ceil = static_cast<int>(_STD ceil(
static_cast<_Real>(_Minbits) / _STD log2(_Rx)));
const int _Kx = _Ceil < 1 ? 1 : _Ceil;
_Real _Ans = static_cast<_Real>(0);
_Real _Factor = static_cast<_Real>(1);
for (int _Idx = 0; _Idx < _Kx; ++_Idx)
{ // add in another set of bits
_Ans += (static_cast<_Real>(_Gx()) - _Gxmin) * _Factor;
_Factor *= _Rx;
}
return (_Ans / _Factor);
}
我的简化版
template<size_t _Bits>
double generate_canonical(std::mt19937_64& _Gx)
{ // build a floating-point value from random sequence
const double _Gxmin = static_cast<double>((_Gx.min)());
const double _Gxmax = static_cast<double>((_Gx.max)());
const double _Rx = (_Gxmax - _Gxmin) + static_cast<double>(1);
double _Ans = (static_cast<double>(_Gx()) - _Gxmin);
return (_Ans / _Rx);
}
这个函数写在namespace std {}
编辑 2:
我找到了解决方案,请在下面查看我的答案。
【问题讨论】:
-
请提供最低代码以显示您的问题
-
为什么不把你的代码包装在一个新的distribution object中?
-
您可以专门化一个标准模板,但您只能针对您自己的自定义类型这样做,而不是内置的。
-
在 linux 中你不使用 Visual C++ 编译器,检查他的问题是否仍然存在,例如GCC 或 Clang
-
@JorgeBellón:为什么不呢? Visual C++ 现在以 Linux 为目标。
标签: c++ c++11 templates visual-c++ stl