【发布时间】:2021-01-20 02:17:35
【问题描述】:
两个文本文件分别是a.txt和b.txt,如何用第一个文件的第二列和第二个文件的第一列作为key列,用python合并两个文件,输出第三个文件格式?因为key列有重复值,如何保留所有可能?a.txtb.txtc.txt
【问题讨论】:
标签: python database data-processing
两个文本文件分别是a.txt和b.txt,如何用第一个文件的第二列和第二个文件的第一列作为key列,用python合并两个文件,输出第三个文件格式?因为key列有重复值,如何保留所有可能?a.txtb.txtc.txt
【问题讨论】:
标签: python database data-processing
你会用熊猫吗?
运行这个:
import pandas as pd;
a = pd.read_csv('a.txt',names=['chr','capletter','number'])
b = pd.read_csv('b.txt',names=['capletter','letter'])
c = a.merge(b,left_on='capletter',right_on='capletter')
c.to_csv('c.txt',header=False,index=False)
来自 a.txt:
chr1,A,1
chr2,B,2
chr3,B,3
CHR3,C,4
和 b.txt:
A,a
B,b
B,c
你会得到 c.txt:
chr1,A,1,a
chr2,B,2,b
chr2,B,2,c
chr3,B,3,b
chr3,B,3,c
【讨论】: