【发布时间】:2020-02-27 00:00:34
【问题描述】:
我有一个 1D 字符串数组 (gene_name_list)。我需要在另一个 2D 数组 (fully_split) 中找到第一个数组的每个字符串都存在的行。当然我可以像这样蛮力解决它:
longest_gene_name = len(max(gene_name_list, key=len))
ensembl_list = np.full((len(gene_name_list)), '', dtype='U{}'.format(longest_gene_name))
for idx, gene_name in enumerate(gene_name_list):
for row in fully_split:
if gene_name in row:
ensembl_list[idx] = row[0]
但这需要很长时间,我需要一个更快的解决方案。
row[0] 包含我要映射到的特殊符号。因此,如果找到一个字符串,它将在row[1:] 部分中找到,然后我将使用row[0]。不相关,但要澄清一下。
【问题讨论】:
标签: python arrays python-2.7 numpy