DataFrame建立的五种不同的方式

佚名 / 2024-10-09 / 原文

目录
  • 1. 从列表构造
  • 2. 从字典构造
  • 3. 从NumPy数组构造
  • 4. 从Series对象构造
  • 5. 从文件加载

在Pandas中,可以通过多种方式创建DataFrame对象。以下是五种不同的创建DataFrame的方法:

1. 从列表构造

使用列表的列表(即嵌套列表)来创建DataFrame。

import pandas as pd

# 使用嵌套列表创建DataFrame
data = [
    [1, 2, 3],
    [4, 5, 6],
    [7, 8, 9]
]

df = pd.DataFrame(data, columns=['Column1', 'Column2', 'Column3'])
print(df)

2. 从字典构造

使用字典创建DataFrame,字典的键作为列名,值作为数据。


# 使用字典创建DataFrame
data = {
    'Column1': [1, 4, 7],
    'Column2': [2, 5, 8],
    'Column3': [3, 6, 9]
}

df = pd.DataFrame(data)
print(df)

3. 从NumPy数组构造

使用NumPy数组创建DataFrame。

import numpy as np

# 使用NumPy数组创建DataFrame
data = np.array([
    [1, 2, 3],
    [4, 5, 6],
    [7, 8, 9]
])

df = pd.DataFrame(data, columns=['Column1', 'Column2', 'Column3'])
print(df)


4. 从Series对象构造

# 使用Series对象创建DataFrame
s1 = pd.Series([1, 4, 7], name='Column1')
s2 = pd.Series([2, 5, 8], name='Column2')
s3 = pd.Series([3, 6, 9], name='Column3')

df = pd.DataFrame([s1, s2, s3])
print(df)

5. 从文件加载

直接从CSV、Excel、JSON等文件格式加载数据创建DataFrame。


# 从CSV文件加载数据创建DataFrame
df = pd.read_csv('data.csv')

# 从Excel文件加载数据创建DataFrame
df_excel = pd.read_excel('data.xlsx')

# 从JSON文件加载数据创建DataFrame
df_json = pd.read_json('data.json')