项目背景
随着北京房价的日益增长,越来越少的人能够负担北京的房价,因此大多数人都会选择在北京租房或购买二手房居住。链家二手房网是我国知名的二手房交易平台,拥有大量的二手房屋信息。本项目通过爬虫收集了链家二手房交易平台在北京地区的二手房信息,包括地理位置、面积、户型、价格等;使用python数据分析的技术探究北京二手房的价格与各类因素的关联性并构建二手房房价的评估系统。
数据集说明
北京二手房数据集名称为bj.csv,共有23440条数据,包含11个字段,数据集的部分数据如下图所示:
数据集中包含的11个字段具体含义如下表所示:
实验环境
操作系统:macOS Big Sur
编译器:Jupyter Notebook 6.1.4
Python:3.6
Numpy:1.91.2
Pandas:1.1.3
Matplotlib:3.1.1
实验分析
在本次实验中,使用python对数据集进行分析,实验的主要步骤包括数据导入、数据的初步处理、数据的可视化分析、模型的建立和模型的测试,本次实验设计的流程如下图所示。