【问题标题】:Create arrays of random letters: Python 3创建随机字母数组:Python 3
【发布时间】:2018-08-11 02:59:39
【问题描述】:

使用下面的函数可以更方便地创建一个随机整数数组。

def generate_random_strings(x, i, j):

    return np.random.randint(0, 2, size=[x, i, j]).astype(np.float32)

print (generate_random_strings(3, 5, 4))

[[[0. 0. 0. 0.]
[0. 1. 1. 0.]
[0. 1. 1. 0.]
[0. 0. 0. 1.]
[0. 1. 0. 1.]]

[[0. 1. 0. 0.]
[1. 0. 1. 1.]
[0. 1. 1. 0.]
[1. 0. 1. 0.]
[0. 0. 0. 0.]]

[[0. 0. 1. 0.]
[1. 0. 1. 1.]
[0. 0. 0. 1.]
[0. 1. 0. 0.]
[1. 1. 0. 0.]]]

我尝试为字母 (a-z) 而不是整数构建与上述类似的函数,但我无法从 numpy 或任何其他可用库中找到任何内置函数。

所以我使用了 3 - for 循环如下,

# Generate random letter
def randomword(len):
    return random.choice(string.ascii_lowercase)

x= 3
i= 5
j= 4

buf = []

for _ in range(x):
    bu = []
    for i in range(i):
        b = []
        for j in range(j):
            b.append(randomword(1))
        bu.append(b)
    buf.append(np.asarray(bu))

print(np.asarray(buf))

[[['u' 'w' 'w' 'x']
  ['b' 's' 'p' 'a']
  ['k' 'u' 'y' 'p']
  ['p' 'z' 'b' 'u']
  ['o' 'h' 'c' 'm']]

 [['t' 'y' 'b' 'r']
  ['e' 's' 'e' 't']
  ['p' 'n' 'd' 'w']
  ['h' 'f' 'i' 'e']
  ['o' 'b' 'q' 'r']]

 [['x' 'z' 'd' 'x']
  ['r' 'b' 'f' 'b']
  ['d' 'h' 'e' 'g']
  ['p' 'g' 'u' 'x']
  ['k' 'j' 'z' 'd']]]

所以,现在我的问题是,是否有任何函数作为 np.random.randint() 用于字符串/字母,如果没有,是否有任何 Python 方法来减少(for 循环)代码长度。

【问题讨论】:

  • chr(randint(97, 122))

标签: python python-3.x loops numpy


【解决方案1】:

如果你想坚持使用 numpy,你可以使用 'S1' 数据类型,它只是长度为 1 字节的字符串。因此,ord 对应于与 8 位无符号整数相同的数字。所以您可以使用numpy.random.randint 生成随机无符号8 位整数,然后将它们转换为字节串

>>> ord('a'), ord('z')
(97, 122)
>>> np.random.randint(97, 123, (3, 5, 4), dtype=np.uint8).view('S1')
array([[[b'p', b'q', b'b', b'x'],
        [b'm', b'x', b'e', b'f'],
        [b'u', b'h', b'e', b'd'],
        [b'o', b'n', b'w', b'v'],
        [b'z', b'q', b'g', b'e']],

       [[b'f', b'o', b'c', b'j'],
        [b'z', b'x', b'l', b'x'],
        [b'u', b'f', b'w', b'r'],
        [b'q', b'z', b'm', b'o'],
        [b't', b'e', b'm', b'e']],

       [[b'f', b'i', b'x', b'k'],
        [b'z', b'w', b'm', b'g'],
        [b't', b'f', b'u', b'q'],
        [b'e', b'w', b'w', b'r'],
        [b'e', b'q', b'a', b'g']]],
      dtype='|S1')

注意,它的速度是原来的两倍,需要四分之一的内存:

In [8]: %timeit np.random.choice(list(string.ascii_lowercase),  size=(10, 10, 10))
24.8 µs ± 311 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)

In [9]: %timeit np.random.randint(97, 123, (10, 10, 10), dtype=np.uint8).view('S1')
7.45 µs ± 95.1 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)

In [10]: %timeit np.random.choice(list(string.ascii_lowercase),  size=(10, 100, 10))
116 µs ± 2.33 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)

In [11]: %timeit np.random.randint(97, 123, (10, 100, 10), dtype=np.uint8).view('S1')
53.4 µs ± 641 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)

In [12]: %timeit np.random.choice(list(string.ascii_lowercase),  size=(10, 100, 100))
993 µs ± 8.34 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)

In [13]: %timeit np.random.randint(97, 123, (10, 100, 100), dtype=np.uint8).view('S1')
503 µs ± 6.13 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)

In [14]: %timeit np.random.choice(list(string.ascii_lowercase),  size=(100, 100, 100))
9.99 ms ± 58.9 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)

In [15]: %timeit np.random.randint(97, 123, (100, 100, 100), dtype=np.uint8).view('S1')
5.06 ms ± 129 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)

【讨论】:

  • 不太清楚,但这可能会更快。有什么理由用np.dtype包装?
  • @miradulo 不确定您的意思。你的意思是“np.dtype('S1')”?好吧,您需要精确定义 dtype。 np.str 不起作用,而且不是真的正确。
  • 对不起,我的意思是删除np.dtypeview('S1')... dtype 是第一个参数。
  • @miradulo 啊,没有理由,只是我的第一个倾向。
  • @miradulo 是的,速度真的不是我支持的主要优势,而是更有效地利用空间。 U1 dtype 需要 4 个字节,而 S1 需要 1 个字节。
【解决方案2】:
print [[[chr(randint(ord('a'), ord('z'))) for col in range(4)]for row in range(5)] for x in range(3)]

输出:

[
[
    ['e', 'y', 'y', 'a'],
    ['p', 'o', 'k', 'z'],
    ['j', 'p', 'n', 'p'],
    ['d', 'y', 'k', 's'],
    ['k', 'c', 'k', 'o']
],
[
    ['v', 'w', 't', 'a'],
    ['f', 'a', 't', 'm'],
    ['h', 'w', 'i', 'x'],
    ['a', 'w', 's', 'z'],
    ['x', 'f', 'b', 'b']
],
[
    ['x', 'f', 'm', 'y'],
    ['b', 'u', 'z', 's'],
    ['j', 'p', 'x', 'l'],
    ['a', 'p', 'b', 'i'],
    ['z', 's', 'v', 'k']
]
]

【讨论】:

  • 因为 ord('a')ord('z') 的魔力不如 97 和 122 - 魔数越少越好
【解决方案3】:

根据需要创建任意数量的随机字母并将它们重新整形为一个 numpy 数组:

import numpy as np
import string
import random

def randomLetters(amount:int):
    return random.choices(string.ascii_lowercase, k=amount)    

i=5
j=4
x=3

d =  np.array(randomLetters(x*i*j)).reshape((x,i,j))

【讨论】:

    【解决方案4】:

    您可以在所有 ascii 小写字母上使用numpy.choice

    import string
    import numpy as np
    
    np.random.choice(list(string.ascii_lowercase),  size=(3, 5,4))
    

    【讨论】:

    • numpy 有所有“正常”的随机模块方法吗? choice/choices 似乎合二为一,sample 或 randint 呢?
    • @PatrickArtner 见numpy.random
    • 注意,list(string.ascii_lowercase) 不是必须的,你只需要string.ascii_lowercase
    • 必须停止懒惰并寻找一些好的 numpy tuts mumble 感谢@miradulo - 这个链接很棒。#
    • @juanpa.arrivillaga 不,应该是一个数组。
    猜你喜欢
    • 2017-05-22
    • 2014-07-31
    • 2023-03-15
    • 2017-03-18
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2010-10-01
    • 2021-04-11
    相关资源
    最近更新 更多