8.1random模块
• 常用函数
| 函数 | 含义 |
|---|---|
| random() | 生成一个[0, 1.0)之间的随机浮点数(‘[)’表示包涵0,不包涵1) |
| uniform(a, b) | 生成一个a到b之间的随机浮点数 |
| randint(a, b) | 生成一个a到b之间的随机整数 |
| choice() | 从列表中随机返回一个元素 |
| shuffle() | 将列表中元素随机打乱 |
| sample(, k) | 从指定列表中随机获取k个元素 |
更多random模块的方法请参考:
https://docs.python.org/3/library/random.html
enumerate():
8.2 zip() 把2个元件打包成一个元组
• zip()函数用于将对应的元素打包成一个个元组
• 注意:元组中的元素是不可修改的,若要修改需要转换成字典或其他
• dict(zip(l1, l2))
8.3 可视化matplotlib模块
散点图
8.4 直方图
8.5 NumPy科学计算库
• 包括:
- 强大的N维数组对象array
- 成熟的科学函数库
- 实用的线性代数、随机数生成函数等
• NumPy的操作对象是多维数组ndarray
• ndarray.shape 数组的维度
• 创建数组:np.array(),np.arrange() …
• 改变数组形状 reshape()
9.2JSON格式
• JSON(JavaScript Object Notation)是一种轻量级数据交换格式
• 可以对复杂数据进行表达和存储,易于阅读和理解
只有符合以下规则的,才是JSON数据:
- 数据保存在键值对中
- 键值对之间由逗号分隔
- 花括号用于保存键值对数据组成的对象
- 方括号用于保存键值对数据组成的数组
• 两个过程:
• 编码(encoding),将Python数据类型转换成JSON格式的过程
• 解码(decoding),从JSON格式中解析数据对应到Python数据类型的过程
| 函数 | 含义 |
|---|---|
| dumps() | 将Python数据类型转换为JSON格式 |
| loads() | 将JSON格式字符串转换为Python数据类型 |
| dump() | 与dumps()功能一致,输出到文件 |
| load() | 与loads()功能一致,从文件读入 |
关于lambda请参考:https://blog.csdn.net/zjuxsl/article/details/79437563
9.3 CSV格式
• CSV(Comma-Separated Values)是一种通用的、相对简单的文件格式
• 在商业和科学领域上广泛使用
• 规则
- 以行为单位
- 每行表示一条记录
- 以英文逗号分割每列数据(如果数据为空,逗号也要保留)
- 列名通常放置在文件第一行
9.4 with语句
之前在处理文件的时候,都是 打开文件,操作文件,关闭文件 这三步。使用with语句,文件中在with中能使用,这样就不会忘记关闭文件了
9.4 网络爬虫
post()方法,
9.6 BeautifulSoup4解析网页
9.7 获取所有城市AQI
9.8 获取所有城市AQI,存到csv
9.9 pandas数据处理
1、Series 类似一维数组
2、DataFrame 多维数组