【发布时间】:2021-10-18 08:51:41
【问题描述】:
我正在尝试运行 RNA 速度分析,并正在使用我的 Seurat 元数据。我正在尝试关注 this tutorial 并拥有以下单元格 ID 数据集:
Cell IDs: columns labelled x, y, z
我想根据字符串包含的内容从 z 列中选择单元 ID:
cellID_obs_WT3 = cellID_obs[cellID_obs[z].str.contains("221929_WT3:")]
cellID_obs_WT4 = cellID_obs[cellID_obs[z].str.contains("222863_WT4:")]
cellID_obs_KO4 = cellID_obs[cellID_obs[z].str.contains("222862_KO4:")]
cellID_obs_KO5 = cellID_obs[cellID_obs[z].str.contains("222864_KO5:")]
当我尝试上面的代码时,我不断收到错误
NameError Traceback (most recent call last)
/tmp/ipykernel_2963/94098105.py in <module>
----> 1 cellID_obs[z]
NameError: name 'z' is not defined
在 z 周围添加引号会选择整个数据集。有谁知道该怎么做?
【问题讨论】:
-
试试 cellID_obs[cellID_obs['z'], z in quotes
-
或者试试
cellID_obs[cellID_obs.z.str.contains("221929_WT3:")]
标签: python-3.x pandas string bioinformatics seurat