【发布时间】:2018-11-25 02:52:11
【问题描述】:
我有两个名为 master_registry.csv 和 master_reference.csv 的 CSV 文件。通过使用这些 CSV,我创建了一些名为“df”和“df2”的新数据框。通过组合这些“df”和“df2”数据框,我创建了一个名为“new_df”的新数据框。问题是我想在这个“new_df”数据框中找到一个值。但是当我试图得到结果时它给了我一个错误。
这是代码
# reading csv from the directory
df = pd.read_csv('application/master_registry.csv')
df2 = pd.read_csv('application/master_reference.csv')
# filtering some selected columns form the csv
df = df.filter(items=['Master_ID', 'Provider First Name', 'Provider Middle Name', 'Provider Last Name (Legal Name)', 'Provider Credential Text', 'Provider Gender Code','Provider License Number State Code_1',
'Provider Business Practice Location Address City Name'])
# creating new data frame with "full name" column
df['Full_Name'] = df[['Provider First Name', 'Provider Last Name (Legal Name)']].apply(lambda x: ' '.join(x), axis=1)
new_df = df.set_index('Master_ID').join(df2.set_index('Master_ID'))
# selecting rows according to the external values
main = new_df[(new_df['Master_ID']==master_id)]
print(main.values.tolist())
当我尝试上面的代码时,它给了我这个错误。
C:\Users\ChampsoftWK26\Envs\jerich_core\lib\site-packages\pandas\core\ops.py:1164: FutureWarning:元素比较失败;返回标量 相反,但将来会执行元素比较 结果 = 方法(y) [2018-06-15 14:36:07,148] 应用程序中的错误:/search/manual/results/by_npi [POST] 上的异常 回溯(最近一次通话最后): 文件 "C:\Users\ChampsoftWK26\Envs\jerich_core\lib\site-packages\flask\app.py", 第 2292 行,在 wsgi_app 中 响应 = self.full_dispatch_request() 文件 "C:\Users\ChampsoftWK26\Envs\jerich_core\lib\site-packages\flask\app.py", 第 1815 行,在 full_dispatch_request 中 rv = self.handle_user_exception(e) 文件 "C:\Users\ChampsoftWK26\Envs\jerich_core\lib\site-packages\flask\app.py", 第 1718 行,在 handle_user_exception 中 reraise(exc_type, exc_value, tb) 文件“C:\Users\ChampsoftWK26\Envs\jerich_core\lib\site-packages\flask_compat.py”, 第 35 行,在再加注中 升值 文件 "C:\Users\ChampsoftWK26\Envs\jerich_core\lib\site-packages\flask\app.py", 第 1813 行,在 full_dispatch_request 中 rv = self.dispatch_request() 文件 "C:\Users\ChampsoftWK26\Envs\jerich_core\lib\site-packages\flask\app.py", 第 1799 行,在 dispatch_request 中 返回 self.view_functionsrule.endpoint 文件“C:\Users\ChampsoftWK26\Desktop\Jericho_v0.0.7\application\routes.py”, 第 41 行,在 search_manual_results_by_npi 信息 = hub.process_search_by_npi(npi) 文件 "C:\Users\ChampsoftWK26\Desktop\Jericho_v0.0.7\application\hub.py", 第 152 行,在 process_search_by_npi 打印(new_df['Client_Reference_ID']==npi) 文件“C:\Users\ChampsoftWK26\Envs\jerich_core\lib\site-packages\pandas\core\ops.py”, 第 1253 行,在包装器中 res = na_op(值,其他) 文件“C:\Users\ChampsoftWK26\Envs\jerich_core\lib\site-packages\pandas\core\ops.py”, 第 1166 行,在 na_op raise TypeError("无效类型比较") TypeError:无效的类型比较 127.0.0.1 - - [15/Jun/2018 14:36:07] “POST /search/manual/results/by_npi HTTP/1.1”500 -
new_df是这样的
Provider First Name ... Client_Reference_ID
Master_ID ...
1 WILLIAM ... 1588667638
2 RICHARD ... 1114920261
3 FRANCISCO ... 1861495814
4 ERIC ... 1306849336
5 RICHARD ... 1326041476
6 GHAITH ... 1770586828
7 TREVOR ... 1124021274
【问题讨论】:
-
你能提供一个 new_df 的样本和预期的输出吗?
-
哪一行给出了错误?
-
我认为这是给我错误的行
-
main = new_df[(new_df['Master_ID']==master_id)] -
那么我如何将一些值与索引进行比较