python 比较两个excel A有b没有
import pandas as pd # 读取第一个Excel文件 df1 = pd.read_excel('excel_file1.xlsx') # 读取第二个Excel文件 df2 = pd.read_excel('excel_file2.xlsx') # 找出在df1中存在但不在df2中的行 missing_rows = df1[~df1['列名'].isin(df2['列名'])] # 保存缺失的数据到新的Excel文件 missing_rows.to_excel('missing_data.xlsx', index=False)
在这个示例代码中,我们假设你要比较的两个Excel文件分别为excel_file1.xlsx
和excel_file2.xlsx
。首先,我们读取这两个Excel文件并将它们存储为数据框df1和df2。然后,我们使用~df1['列名'].isin(df2['列名'])
来找出在df1中存在但不在df2中的行,其中'列名'
需要替换为你要比较的列名。最后,我们将缺失的数据保存到一个名为missing_data.xlsx
的新Excel文件中。
请确保将excel_file1.xlsx
和excel_file2.xlsx
替换为你要比较的两个Excel文件的文件名,以及将missing_data.xlsx
替换为你想要保存缺失数据的文件名。同时,将代码中的'列名'
替换为你希望根据哪一列进行比较
示例:
df1:
df2:
结果:data.xlsx