【发布时间】:2016-10-10 00:05:55
【问题描述】:
` 导入熊猫 导入numpy
#importing the dataset
data=pandas.read_csv('gapminder.csv',low_memory=False)
#setting variables to be worked with to numeric
data['urbanrate']=data['urbanrate'].convert_objects(convert_numeric=True)
data['femaleemployrate']=data['femaleemployrate'].convert_objects(convert_numeric=True)
data['lifeexpectancy']=data['lifeexpectancy'].convert_objects(convert_numeric=True)
print("Count for urbanrate")
chk8=data['urbanrate'].value_counts(sort=False,dropna=False)
print(chk8)
sub1=data[['urbanrate','femaleemployrate','lifeexpectancy']]
print (sub1.head(25))
===========================================================================
def urban (row):
if (row['urbanrate']<25.0):
return 1
if (data[['urbanrate']>=25.0 & data['urbanrate']<75.0]):
return 2
if (data['urbanrate']>75.0):
return 3
sub1['urban']=sub1.apply(lambda row: urban (row),axis=1)
print (sub1.head(25))
============================================================================`
我想将urbanrate 的所有值(都是浮点数,如24.56、88.98、77.65)分为 3 个不同的类别(一个是 <25 的值,另一个是 @ 987654327@ 和>=75 的最后一个)并将这些值存储在一个新变量中(比如urban)。我怎样才能做到这一点?我已经给出了我的代码。我执行了它,它给了我错误:
TypeError: ('无法将 dtyped [float64] 数组与 [bool] 类型的标量进行比较', '发生在索引 1'))
请帮帮我
【问题讨论】:
标签: python numpy pandas categories data-analysis