【发布时间】:2022-01-23 16:16:39
【问题描述】:
我想从名为“filename”的字符串列中提取用户 ID,并创建一个新的 ID 列, 基于原始字符串中特定字符的索引。
“文件名”中字符串的两个示例,ID 为 2 位或 3 位数字:
-
文件名 = ID100session1neg_emotions_rating.csv ---> ID = 100
-
文件名 =ID21session2neu_emotions_rating.csv ---> ID = 21
我试过了-
df['ID '] = df.filename.str[2:**4**]
但我找不到每行切片的 ID 的结束索引(它是 3 或 4,取决于 ID 的长度为 2 位或 3 位)。
在数据框中的每一行之后找到“s”的索引将解决我的问题。 简单的选项对我不起作用 -
s_index = df.filename.str.index("s")
(我也尝试了一些拆分选项,但我没有逗号等特定字符来拆分)
非常感谢! 对不起,如果它与上一个问题重复
【问题讨论】:
标签: python pandas string indexing split