提问者:小点点

熊猫更有效地融合


我的代码中有多个需要合并的表,但是所有表都附加了大量的“fluff”列。 我当前合并表的过程如下:

df = pd.merge(df, df2, on=[key])
df = pd.drop([[insert not-needed columns], axis=1)
df = df.rename(columns={'column_x': 'column'})

我还见过人们先隔离新查找表中的列:

ref = df2['column1','key']
df = pd.merge(df, ref, on=[key])

有没有一种更快的方法在熊猫中做类似VLOOKUP(但是包含一个以上的列)的事情?


共1个答案

匿名用户

是您可以在merge之前筛选它,这样应该更快,然后在merge之后筛选

ref = df2[['col1','col2',...., 'coln','key']]
df = pd.merge(df, ref, on=[key])