y=pd.DataFrame(list, column="something") - 需要解释答案

【问题标题】：y=pd.DataFrame(list, column="something") - need explainationy=pd.DataFrame(list, column="something") - 需要解释
【发布时间】：2021-10-18 04:42:32
【问题描述】：

所以我有如下代码：

Yb=pd.DataFrame(y, column='something')
df_merge = pd.merge(Yb, file, on='something', how='left')

我不太明白代码的作用是什么？ column= 和 on= 在这里做什么？

【问题讨论】：

DataFrame constructor 和 pd.merge 上的文档

标签： python python-3.x pandas dataframe numpy

【解决方案1】：

columnsIndex 或类似数组当数据没有它们时用于结果帧的列标签，默认为 RangeIndex(0, 1, 2, ..., n)。如果数据包含列标签，将改为执行列选择。

所以在yb 中，y 是正在访问的数据，而column 参数就是列。这是一个简单的例子。

# Import pandas library
import pandas as pd

# initialize list of lists
data = [['tom', 10], ['nick', 15], ['juli', 14]]

# Create the pandas DataFrame
df = pd.DataFrame(data, columns = ['Name', 'Age'])

# print dataframe.
df

这将输出如下内容：

至于df_merge，我们本质上是在合并数据。它需要两个参数，左侧 DataFrame 和右侧 DataFrame。所以Yb 和 'file' 是您正在合并的 2 个 DataFrame。以下是其他论点：

how：这定义了要进行什么样的合并。它默认为“内”，但其他可能的选项包括“外”、“左”和“右”。

on：使用它来告诉 merge() 您要加入哪些列或索引（也称为键列或键索引）。这是可选的。如果未指定，并且 left_index 和 right_index（如下所述）为 False，则共享名称的两个 DataFrame 中的列将用作连接键。如果您使用 on，那么您指定的列或索引必须同时存在于两个对象中。

在这种情况下，how 设置为 left。

使用左外连接将使新合并的 DataFrame 包含左侧 DataFrame 中的所有行，同时丢弃右侧 DataFrame 中在左侧 DataFrame 的键列中不匹配的行。

并且on 设置为something，因此它将专门合并something 列。

希望这会有所帮助。

【讨论】：