【发布时间】:2016-04-10 17:45:20
【问题描述】:
由于是我的第一篇文章,我想向大家问好,我很高兴能加入这个很棒的社区!我想学习编程,我决定从 python 开始,我已经有 2 个月的时间在 python 中,所以我处于初学者水平。
我的第一个挑战是帮助有以下情况的朋友,我可以理解基本的python功能,但我需要的脚本对于我的lvl来说有点复杂。
所以我有 2 个 csv 文件(file1.csv、file2.csv),如果该索引在 file1 中,我需要根据每行 file2.csv 中的索引 [codfiscal] 检查.csv 在任何行中,如果它没有打印 file3.csv 中的所有行。 为了举例更好地理解我的问题,我将发布一些示例:
输入:
file2.csv
Denumire;codfiscal;jreg;adresaCOR;adresaNLC;judet1;localitate;tipclient;stare;nu plateste la soc:;Stare firma;an_jreg
"""ACNORD""-P SRL";15444630;J2/614/2003; NR 14; NR 14;ARAD;SANMARTIN;PJ;FUNCTIUNE;ENEL;active;2003
"""ARBU""- TOY SRL";12766886;J2/122/2000;求救。 CURTICI- DOROBAN?I NR F.N.;求救。 CURTICI- DOROBAN?I NR F.N.;ARAD;CURTICI;PJ;FUNCTIUNE;ENEL;active;2000
(IN.A.P.S) INARCH PRMO STRUCTURES SRL;16420906;J2/844/2004; B-DUL 普通 VASILE MILEA NR 3 ET 2 AP 11; B-DUL GENERAL VASILE MILEA NR 3 ET 2 AP 11;ARAD;ARAD;PJ;FUNCTIUNE;ENEL;active;2004
?IRU CONSTRUCT SRL;22802765;J35/4342/2007; STR。 TESATORILOR NR 8A ET 4 AP 10; STR。 TESATORILOR NR 8A ET 4 AP 10;TIMIS;LUGOJ;PJ;FUNCTIUNE;ENEL;active;2007
?OLEA INTER-COM SRL;16918200;J2/1887/2004; NR 276; NR 276;ARAD;格罗塞尼;PJ;FUNCTIUNE;ENEL;活性;2004
file1.csv
Denumire;codfiscal;jreg;adresaCOR;adresaNLC;judet1;localitate;tipclient;stare;nu plateste la soc:;Stare firma;an_jreg
"""ACNORD""-P SRL";15444630;J2/614/2003; NR 14; NR 14;ARAD;SANMARTIN;PJ;FUNCTIUNE;ENEL;active;2003
"""ARBU""- TOY SRL";12766886;J2/122/2000;求救。 CURTICI- DOROBAN?I NR F.N.;求救。 CURTICI- DOROBAN?I NR F.N.;ARAD;CURTICI;PJ;FUNCTIUNE;ENEL;active;2000
(IN.A.P.S) INARCH PRMO STRUCTURES SRL;16420906;J2/844/2004; B-DUL 普通 VASILE MILEA NR 3 ET 2 AP 11; B-DUL GENERAL VASILE MILEA NR 3 ET 2 AP 11;ARAD;ARAD;PJ;FUNCTIUNE;ENEL;active;2004
.A.S.A. SERVICII ECOLOGICE SRL;14822567;J2/648/2002; ZONA CET - SOSEAUA CENTURA NORD NR FN; ZONA CET - SOSEAUA CENTURA NORD NR FN;ARAD;ARAD;PJ;FUNCTIUNE;ENEL;active;2002
?AIZAR CONS SRL;23957563;J11/441/2008; B-杜尔共和国 NR 25 SC 3 ET 8 AP 29; B-DUL REPUBLICII NR 25 SC 3 ET 8 AP 29;CARAS-SEVERIN;RESITA;PJ;FUNCTIUNE;ENEL;active;2008
?ICA - STRONG SRL;15528110;J2/745/2003; STR。 OCSKO TEREZIA BL 11 SC B ET 2 AP 6; STR。 OCSKO TEREZIA BL 11 SC B ET 2 AP 6;ARAD;ARAD;PJ;FUNCTIUNE;ENEL;active;2003
?IGHERTU CONSTRUCT SRL;19298294;J2/2238/2006; STR。 CEZAR NR 5; STR。 CEZAR NR 5;ARAD;ARAD;PJ;FUNCTIUNE;ENEL;active;2006
想要的输出:
file3.csv
Denumire;codfiscal;jreg;adresaCOR;adresaNLC;judet1;localitate;tipclient;stare;nu plateste la soc:;Stare firma;an_jreg
?IRU CONSTRUCT SRL;22802765;J35/4342/2007; STR。 TESATORILOR NR 8A ET 4 AP 10; STR。 TESATORILOR NR 8A ET 4 AP 10;TIMIS;LUGOJ;PJ;FUNCTIUNE;ENEL;active;2007
?OLEA INTER-COM SRL;16918200;J2/1887/2004; NR 276; NR 276;ARAD;格罗塞尼;PJ;FUNCTIUNE;ENEL;活性;2004
这是我的 csv 示例,对它们进行了一些编辑,以便您可以更好地查看它们(忽略空格)。
重要的是,我的真实数据就像 file1.csv 上的 100k 行和 file2.csv 上的 50k 行。所以脚本必须处理大数据。我在 xcell 文件上有这些数据,我认为使用 cvs 会更容易,然后再转换回来!
非常感谢您的宝贵时间,我们将不胜感激所有的帮助!
【问题讨论】:
标签: python excel python-2.7 csv