创建随机字母数组：Python 3答案

【问题标题】：Create arrays of random letters: Python 3创建随机字母数组：Python 3
【发布时间】：2018-08-11 02:59:39
【问题描述】：

使用下面的函数可以更方便地创建一个随机整数数组。

def generate_random_strings(x, i, j):

    return np.random.randint(0, 2, size=[x, i, j]).astype(np.float32)

print (generate_random_strings(3, 5, 4))

[[[0. 0. 0. 0.]
[0. 1. 1. 0.]
[0. 1. 1. 0.]
[0. 0. 0. 1.]
[0. 1. 0. 1.]]

[[0. 1. 0. 0.]
[1. 0. 1. 1.]
[0. 1. 1. 0.]
[1. 0. 1. 0.]
[0. 0. 0. 0.]]

[[0. 0. 1. 0.]
[1. 0. 1. 1.]
[0. 0. 0. 1.]
[0. 1. 0. 0.]
[1. 1. 0. 0.]]]

我尝试为字母 (a-z) 而不是整数构建与上述类似的函数，但我无法从 numpy 或任何其他可用库中找到任何内置函数。

所以我使用了 3 - for 循环如下，

# Generate random letter
def randomword(len):
    return random.choice(string.ascii_lowercase)

x= 3
i= 5
j= 4

buf = []

for _ in range(x):
    bu = []
    for i in range(i):
        b = []
        for j in range(j):
            b.append(randomword(1))
        bu.append(b)
    buf.append(np.asarray(bu))

print(np.asarray(buf))

[[['u' 'w' 'w' 'x']
  ['b' 's' 'p' 'a']
  ['k' 'u' 'y' 'p']
  ['p' 'z' 'b' 'u']
  ['o' 'h' 'c' 'm']]

 [['t' 'y' 'b' 'r']
  ['e' 's' 'e' 't']
  ['p' 'n' 'd' 'w']
  ['h' 'f' 'i' 'e']
  ['o' 'b' 'q' 'r']]

 [['x' 'z' 'd' 'x']
  ['r' 'b' 'f' 'b']
  ['d' 'h' 'e' 'g']
  ['p' 'g' 'u' 'x']
  ['k' 'j' 'z' 'd']]]

所以，现在我的问题是，是否有任何函数作为 np.random.randint() 用于字符串/字母，如果没有，是否有任何 Python 方法来减少（for 循环）代码长度。

【问题讨论】：

chr(randint(97, 122))

标签： python python-3.x loops numpy

【解决方案1】：

如果你想坚持使用 numpy，你可以使用 'S1' 数据类型，它只是长度为 1 字节的字符串。因此，ord 对应于与 8 位无符号整数相同的数字。所以您可以使用numpy.random.randint 生成随机无符号8 位整数，然后将它们转换为字节串：

>>> ord('a'), ord('z')
(97, 122)
>>> np.random.randint(97, 123, (3, 5, 4), dtype=np.uint8).view('S1')
array([[[b'p', b'q', b'b', b'x'],
        [b'm', b'x', b'e', b'f'],
        [b'u', b'h', b'e', b'd'],
        [b'o', b'n', b'w', b'v'],
        [b'z', b'q', b'g', b'e']],

       [[b'f', b'o', b'c', b'j'],
        [b'z', b'x', b'l', b'x'],
        [b'u', b'f', b'w', b'r'],
        [b'q', b'z', b'm', b'o'],
        [b't', b'e', b'm', b'e']],

       [[b'f', b'i', b'x', b'k'],
        [b'z', b'w', b'm', b'g'],
        [b't', b'f', b'u', b'q'],
        [b'e', b'w', b'w', b'r'],
        [b'e', b'q', b'a', b'g']]],
      dtype='|S1')

注意，它的速度是原来的两倍，需要四分之一的内存：

In [8]: %timeit np.random.choice(list(string.ascii_lowercase),  size=(10, 10, 10))
24.8 µs ± 311 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)

In [9]: %timeit np.random.randint(97, 123, (10, 10, 10), dtype=np.uint8).view('S1')
7.45 µs ± 95.1 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)

In [10]: %timeit np.random.choice(list(string.ascii_lowercase),  size=(10, 100, 10))
116 µs ± 2.33 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)

In [11]: %timeit np.random.randint(97, 123, (10, 100, 10), dtype=np.uint8).view('S1')
53.4 µs ± 641 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)

In [12]: %timeit np.random.choice(list(string.ascii_lowercase),  size=(10, 100, 100))
993 µs ± 8.34 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)

In [13]: %timeit np.random.randint(97, 123, (10, 100, 100), dtype=np.uint8).view('S1')
503 µs ± 6.13 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)

In [14]: %timeit np.random.choice(list(string.ascii_lowercase),  size=(100, 100, 100))
9.99 ms ± 58.9 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)

In [15]: %timeit np.random.randint(97, 123, (100, 100, 100), dtype=np.uint8).view('S1')
5.06 ms ± 129 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)

【讨论】：

不太清楚，但这可能会更快。有什么理由用np.dtype包装？
@miradulo 不确定您的意思。你的意思是“np.dtype（'S1'）”？好吧，您需要精确定义 dtype。 np.str 不起作用，而且不是真的正确。
对不起，我的意思是删除np.dtype。 view('S1')... dtype 是第一个参数。
@miradulo 啊，没有理由，只是我的第一个倾向。
@miradulo 是的，速度真的不是我支持的主要优势，而是更有效地利用空间。 U1 dtype 需要 4 个字节，而 S1 需要 1 个字节。

【解决方案2】：

print [[[chr(randint(ord('a'), ord('z'))) for col in range(4)]for row in range(5)] for x in range(3)]

输出：

[
[
    ['e', 'y', 'y', 'a'],
    ['p', 'o', 'k', 'z'],
    ['j', 'p', 'n', 'p'],
    ['d', 'y', 'k', 's'],
    ['k', 'c', 'k', 'o']
],
[
    ['v', 'w', 't', 'a'],
    ['f', 'a', 't', 'm'],
    ['h', 'w', 'i', 'x'],
    ['a', 'w', 's', 'z'],
    ['x', 'f', 'b', 'b']
],
[
    ['x', 'f', 'm', 'y'],
    ['b', 'u', 'z', 's'],
    ['j', 'p', 'x', 'l'],
    ['a', 'p', 'b', 'i'],
    ['z', 's', 'v', 'k']
]
]

【讨论】：

因为 ord('a') 和 ord('z') 的魔力不如 97 和 122 - 魔数越少越好

【解决方案3】：

根据需要创建任意数量的随机字母并将它们重新整形为一个 numpy 数组：

import numpy as np
import string
import random

def randomLetters(amount:int):
    return random.choices(string.ascii_lowercase, k=amount)    

i=5
j=4
x=3

d =  np.array(randomLetters(x*i*j)).reshape((x,i,j))

【讨论】：

【解决方案4】：

您可以在所有 ascii 小写字母上使用numpy.choice：

import string
import numpy as np

np.random.choice(list(string.ascii_lowercase),  size=(3, 5,4))

【讨论】：

numpy 有所有“正常”的随机模块方法吗？ choice/choices 似乎合二为一，sample 或 randint 呢？
@PatrickArtner 见numpy.random。
注意，list(string.ascii_lowercase) 不是必须的，你只需要string.ascii_lowercase
必须停止懒惰并寻找一些好的 numpy tuts mumble 感谢@miradulo - 这个链接很棒。#
@juanpa.arrivillaga 不，应该是一个数组。