python 比较两个excel A有b没有

xujunhui / 2023-07-31 / 原文

import pandas as pd

# 读取第一个Excel文件
df1 = pd.read_excel('excel_file1.xlsx')

# 读取第二个Excel文件
df2 = pd.read_excel('excel_file2.xlsx')

# 找出在df1中存在但不在df2中的行
missing_rows = df1[~df1['列名'].isin(df2['列名'])]

# 保存缺失的数据到新的Excel文件
missing_rows.to_excel('missing_data.xlsx', index=False)

在这个示例代码中,我们假设你要比较的两个Excel文件分别为excel_file1.xlsxexcel_file2.xlsx。首先,我们读取这两个Excel文件并将它们存储为数据框df1和df2。然后,我们使用~df1['列名'].isin(df2['列名'])来找出在df1中存在但不在df2中的行,其中'列名'需要替换为你要比较的列名。最后,我们将缺失的数据保存到一个名为missing_data.xlsx的新Excel文件中。

请确保将excel_file1.xlsxexcel_file2.xlsx替换为你要比较的两个Excel文件的文件名,以及将missing_data.xlsx替换为你想要保存缺失数据的文件名。同时,将代码中的'列名'替换为你希望根据哪一列进行比较

 

示例:

df1:

df2:

结果:data.xlsx