媳妇儿说:“XXX,你不爱我了~,你们公司有好吃的你都不问我要不要了~”
我:“~_~”

原文连接:http://blog.csdn.net/tomorrow13210073213/article/category/6931287

数据库构建

前文我们说过,数据库用mysql;具体的数据库下载、运行这里就不再详细说明,只介绍表结构。

基于前几篇文章对网页、源码、请求的分析,我就可以开始构建数据库了,下图是全部数据库表:
Python 边做边学 6 数据库构建
下面简单介绍一下这些表:

t_user_capture 待爬取用户

Python 边做边学 6 数据库构建
用于记录需要爬取数据的用户,由于后期处理数据库“datetime”格式字段遇到了些问题,这里,将时间全部设置成13位的“bigint”,存时间戳。其他表的时间也这么存。

另外,如前文所说,我们可以利用页面上用户的关注列表和被关注列表实现数据自增长,自增长数据就存在这张表里;即,获取某个用户的主页html之后,解析关注列表和被关注列表,将相关用户存到这张表里;

t_user_capture_log 爬取日志

Python 边做边学 6 数据库构建
用于记录用户信息爬取日志;

t_user 用户信息表

Python 边做边学 6 数据库构建
保存用户基本信息;

t_user_ccoin 用户C币数量

Python 边做边学 6 数据库构建

t_user_contact 用户联络信息

Python 边做边学 6 数据库构建

t_user_edu 用户教育经历

Python 边做边学 6 数据库构建

t_user_known_area 用户熟悉领域

Python 边做边学 6 数据库构建

t_user_medal 用户奖牌

Python 边做边学 6 数据库构建

t_user_relation 用户关系,关注与被关注

Python 边做边学 6 数据库构建
由于不能获取用户关注、粉丝的完整列表,这里只存储数量;

t_user_score 用户个模块分数

Python 边做边学 6 数据库构建

t_user_skill 用户专业技能

Python 边做边学 6 数据库构建

t_user_tag 用户标签

Python 边做边学 6 数据库构建

t_user_work 用户工作经历

Python 边做边学 6 数据库构建

以上就是全部数据表,表中的“UID”字段均指标“t_user”表中的“ID”;下篇我们将介绍项目整体设计。

以上内容仅供练习,学习使用;

相关文章:

  • 2022-01-13
  • 2021-08-06
  • 2021-11-30
  • 2022-03-07
  • 2022-12-23
  • 2021-07-27
  • 2021-06-16
猜你喜欢
  • 2021-07-19
  • 2022-12-23
  • 2021-07-08
  • 2021-09-17
  • 2021-10-16
  • 2021-10-24
  • 2022-02-03
相关资源
相似解决方案