【发布时间】:2020-05-11 13:40:16
【问题描述】:
我在一个文件中有一些数据,其中包含一些用户详细信息,示例行如下
<User id="123" directoryId="122" userName="vik_username" lowerUserName="vik_username" active="1" createdDate="2013-12-01 08:25:34.451" updatedDate="2014-01-20 19:45:49.133" firstName="Vik" lowerFirstName="vik" lastName="GG" lowerLastName="gg" displayName="Vik GG" lowerDisplayName="vikgg" emailAddress="vikgg@vik.com" lowerEmailAddress="vikgg@vik.com">
我想用python写一个脚本并提取以下字段 1.用户名--userName="vik_username" 2. 邮箱地址——emailAddress="vikgg@vik.com" 3.显示名称——displayName="Vik GG" 4.活跃状态——active="1"
我写了一个这样的 python 脚本,我在 '" ' 上拆分双引号,后跟空格。
f = open("users.txt", "r")
user_array=[]
for x in f:
y=x.split('" ')
user_array.append(y)
这给了我一个名为 user_array 的数组,它将每个用户的详细信息作为一个数组。
print user_array[0]
返回
['<User id="123', 'directoryId="122', 'userName="vik_username', 'lowerUserName="vik_username', 'active="1', 'createdDate="2013-12-01 08:25:34.451', 'updatedDate="2014-01-20 19:45:49.133', 'firstName="Vik', 'lowerFirstName="vik', 'lastName="GG', 'lowerLastName="gg', 'displayName="Vik GG', 'lowerDisplayName="vikgg', 'emailAddress="vikgg@vik.com', 'lowerEmailAddress="vikgg@vik.com">\n']
现在获取我想要的字段 1.用户名--userName="vik_username" 2. 邮箱地址——emailAddress="vikgg@vik.com" 3.显示名称——displayName="Vik GG" 4.活跃状态——active="1"
我必须做类似的事情
print(user_array[0][<<index of my field>>])
然后再次拆分以删除字段标签
例如
userName="vik_username
我需要删除
userName="
有人可以帮助我在 python 中以更有效的方式做到这一点吗? 提前致谢。
【问题讨论】:
标签: python arrays string scripting