【发布时间】:2019-02-28 01:28:10
【问题描述】:
我正在尝试在 Go 中为 gonum 密集向量实现我自己的绝对函数。如果有比平方然后平方根更好的方法来获取数组的绝对值,我在徘徊?
我的主要问题是我必须在这些向量上实现我自己的元素智能牛顿平方根函数,并且实现速度和准确性之间存在平衡。如果我可以避免使用这个平方根函数,我会很高兴。
【问题讨论】:
标签: numpy go implementation absolute
我正在尝试在 Go 中为 gonum 密集向量实现我自己的绝对函数。如果有比平方然后平方根更好的方法来获取数组的绝对值,我在徘徊?
我的主要问题是我必须在这些向量上实现我自己的元素智能牛顿平方根函数,并且实现速度和准确性之间存在平衡。如果我可以避免使用这个平方根函数,我会很高兴。
【问题讨论】:
标签: numpy go implementation absolute
NumPy 源代码可能很难导航,因为它针对如此多的数据类型提供了如此多的函数。您可以在文件scalarmath.c.src 中找到绝对值函数的 C 级源代码。这个文件实际上是一个带有函数定义的模板,稍后构建系统会为几种数据类型复制这些函数定义。请注意,每个函数都是为数组的每个元素运行的“内核”(遍历数组在其他地方完成)。这些函数始终称为<name of the type>_ctype_absolute,其中<name of the type> 是它应用的数据类型,并且通常是模板化的。让我们来看看它们。
/**begin repeat
* #name = ubyte, ushort, uint, ulong, ulonglong#
*/
#define @name@_ctype_absolute @name@_ctype_positive
/**end repeat**/
这个是针对无符号类型的。在这种情况下,绝对值与np.positive 相同,它只是复制值而不做任何事情(如果您有一个数组a 并且您执行+a,这就是您得到的)。
/**begin repeat
* #name = byte, short, int, long, longlong#
* #type = npy_byte, npy_short, npy_int, npy_long, npy_longlong#
*/
static void
@name@_ctype_absolute(@type@ a, @type@ *out)
{
*out = (a < 0 ? -a : a);
}
/**end repeat**/
这个是有符号整数。很简单。
/**begin repeat
* #name = float, double, longdouble#
* #type = npy_float, npy_double, npy_longdouble#
* #c = f,,l#
*/
static void
@name@_ctype_absolute(@type@ a, @type@ *out)
{
*out = npy_fabs@c@(a);
}
/**end repeat**/
这适用于浮点值。这里使用了npy_fabsf、npy_fabs 和npy_fabsl 函数。这些在npy_math.h 中声明,但通过npy_math_internal.h.src 中的模板化C 代码定义,本质上调用C/C99 counterparts(除非C99 不可用,in which case fabsf and fabsl are emulated with fabs)。你可能认为前面的代码应该也适用于浮点类型,但实际上这些更复杂,因为它们有 NaN、无穷大或有符号零之类的东西,所以最好使用处理所有内容的标准 C 函数可靠。
static void
half_ctype_absolute(npy_half a, npy_half *out)
{
*out = a&0x7fffu;
}
这其实不是模板化的,是half-precision floating-point values的绝对值函数。事实证明,您可以通过按位运算(将第一位设置为 0)来更改符号,因为半精度比其他浮点类型更简单(如果更受限制)(它们通常相同,但有特殊情况)。
/**begin repeat
* #name = cfloat, cdouble, clongdouble#
* #type = npy_cfloat, npy_cdouble, npy_clongdouble#
* #rtype = npy_float, npy_double, npy_longdouble#
* #c = f,,l#
*/
static void
@name@_ctype_absolute(@type@ a, @rtype@ *out)
{
*out = npy_cabs@c@(a);
}
/**end repeat**/
最后一个用于复杂类型。这些使用npy_cabsf、npycabs 和npy_cabsl 函数,再次在npy_math.h 中声明,但在这种情况下,模板在npy_math_complex.c.src 中使用C99 functions 实现(除非它不可用,在这种情况下它是@987654331 @)。
【讨论】: