【发布时间】:2016-05-10 22:18:33
【问题描述】:
我是 Python 新手,我对所有这些数据类型(例如 Series、Array、List 等)感到非常困惑。这可能是一个非常开放的问题。我希望在使用 python 编码进行数据分析时对一般实践有所了解。
大量阅读表明 numpy 和 pandas 是我进行数据分析所需的两个模块。但是,我觉得这很难而且很奇怪,因为它们以两种不同的数据类型(即系列和数组)操作/生成数据。在进行任何类型的数据操作之前,需要将其中一种数据类型转换为另一种数据类型是否正常/自然?想知道你会做什么吗?非常感谢。
例如:
import pandas as pd
import numpy as np
# create some data
df = pd.DataFrame(np.random.randn(10, 3), columns=['a', 'b', 'c'])
x = np.random.randn(10, 1)
# data manipulation
A = df['a']
# Question 1:
# If I want to perform a element by element addition between x and A
# How should I do? Simple x + A doesn't work but it seems strange to
# me that if I have to convert the data type everytime
# Question 2:
# I'd like to combine to two columns together
# concatenate or hstack both don't work
【问题讨论】:
-
你想得到什么
numpy.arrays或pd.Series和pd.Dataframes? -
我想我会在最后想要数据框,因为我从数据框开始(因为我使用熊猫导入数据)。基本上,我发现它们彼此不兼容(两个模块),这很烦人,我想知道我的方向是否正确(几乎每个操作都需要额外的步骤/功能)。
标签: python arrays numpy pandas series