columnsIndex 或类似数组
当数据没有它们时用于结果帧的列标签,默认为 RangeIndex(0, 1, 2, ..., n)。如果数据包含列标签,将改为执行列选择。
所以在yb 中,y 是正在访问的数据,而column 参数就是列。这是一个简单的例子。
# Import pandas library
import pandas as pd
# initialize list of lists
data = [['tom', 10], ['nick', 15], ['juli', 14]]
# Create the pandas DataFrame
df = pd.DataFrame(data, columns = ['Name', 'Age'])
# print dataframe.
df
这将输出如下内容:
至于df_merge,我们本质上是在合并数据。它需要两个参数,左侧 DataFrame 和右侧 DataFrame。所以Yb 和 'file' 是您正在合并的 2 个 DataFrame。以下是其他论点:
how:这定义了要进行什么样的合并。它默认为“内”,但其他可能的选项包括“外”、“左”和“右”。
on:使用它来告诉 merge() 您要加入哪些列或索引(也称为键列或键索引)。这是可选的。如果未指定,并且 left_index 和 right_index(如下所述)为 False,则共享名称的两个 DataFrame 中的列将用作连接键。如果您使用 on,那么您指定的列或索引必须同时存在于两个对象中。
在这种情况下,how 设置为 left。
使用左外连接将使新合并的 DataFrame 包含左侧 DataFrame 中的所有行,同时丢弃右侧 DataFrame 中在左侧 DataFrame 的键列中不匹配的行。
并且on 设置为something,因此它将专门合并something 列。
希望这会有所帮助。