kehao

波士顿房价数据集

  • 卡内基梅隆大学,StatLib库,1978年
  • 涵盖了麻省波士顿的506个不同郊区的房屋数据
  • 404条训练数据集,102条测试数据集
  • 每条数据14个字段,包含13个属性,和1个房价的平均值

目标

将所有属性与房价之间的关系可视化

代码

import matplotlib.pyplot as plt 
import numpy as np 
import tensorflow as tf 

plt.rcParams[\'font.sans-serif\'] = [\'Microsoft YaHei\'] # 指定默认字体
plt.rcParams[\'axes.unicode_minus\'] = False # 解决保存图像是负号\'-\'显示为方块的问题

boston_housing = tf.keras.datasets.boston_housing

#数据集不需要测试,将所有的数据都加载到训练数据集用于显示,test_split为划分测试机的比例
(train_x,train_y),(test_x,test_y) = boston_housing.load_data(test_split = 0)

title_list = [\'CRIM\',\'ZN\',\'INDUS\',\'CHAS\',\'NOX\',\'RM\',\'AGE\',
                \'DIS\',\'RAD\',\'TAX\',\'PTRATIO\',\'B-1000\',\'LSTAT\',\'MEDV\']

plt.figure(figsize=(8,8))

for i in range(13):
    plt.subplot(4,4,i+1)
    plt.scatter(train_x[:,i],train_y,s=5)
    plt.xlabel(title_list[i])
    plt.ylabel(\'Price\')
    plt.title(str(i+1)+\'. \'+title_list[i]+\' - Price\')

plt.tight_layout(rect=[0,0,1,0.95])
plt.suptitle(\'各属性与房价之间的关系\')
plt.show()

效果

分类:

技术点:

相关文章: