【发布时间】:2018-11-09 20:51:16
【问题描述】:
您好,我正在尝试通过 python 中的 pandas 数据框中的一列来完成类似于 excel 中的 mid 函数的操作。我有一列包含可变长度的药物名称+强度等。我只想提取名称的第一个“部分”并将结果放入数据框中的另一列。
例子:
数据框列
MEDICATION_NAME 对乙酰氨基酚 325 毫克 a-hydrocort 100 毫克/2 毫升期望的结果
MEDICATION_NAME GENERIC_NAME 对乙酰氨基酚 325 毫克对乙酰氨基酚 a-hydrocort 100 毫克/2 毫升我尝试过的
df['GENERIC_NAME'] = df['MEDICATION_NAME'].str[:df['MEDICATION_NAME'].apply(lambda x: x.find(' '))]
基本上我想应用
的行特定结果df['GENERIC_NAME'] = df['MEDICATION_NAME'].apply(lambda x: x.find(' '))
到
str[:]函数?
谢谢
【问题讨论】:
-
你能提供更多的例子吗?名称是否总是后跟空格和数字,然后是 mg?是否有一些带空格的通用名称?
标签: python python-3.x pandas dataframe