Pandas的基本属性

1.import pandas as pd #先导入数据pandas 库
import numpy as np #导入数据numpy 库
Pandas基础 - 自创

2.爬虫:
import requests
url =“http://…”
header={" "}
response = requests.get(url, headers=header)
html=response.text
pd.read_json(html)[[“列1,列2”]]
Pandas基础 - 自创

4.From pandas import Series,DataFrame #导入series及DataFrame
Pandas基础 - 自创

5.type(s) # 查看s 类型
Pandas基础 - 自创

Pandas中的索引与切片

我们以a = Series([4,5,6,7],index = [“a”,“b”,“c”,“d”]) 创造数组:

  1. a,b,c,d,为索引;
    Pandas基础 - 自创

  2. a[“b”] 指a的b列 ;a.b sql 也有这种方法 ;a.get(“b”) series 特有的get(); a[1] 切片第二个值;pandas中用索引找对应的值4种方式
    Pandas基础 - 自创

  3. 两种a[ ]切片对比: a[[“b”]] 2个括号是序列:索引+值,a[“b”] 一个中括号是索引切的值。
    Pandas基础 - 自创

  4. a[“b”:“d”] 与a[“b”,“d”] 与excel中的counta(a:b) 和counta(a,b) 相似,但是提多列时加[ ]。
    Pandas基础 - 自创

  5. 查看a中第一个索引; 查看a>3 所有的序列
    Pandas基础 - 自创

  6. 改变索引,也可以用a.index=[0,1,2,3] 直接在原数据上改。
    Pandas基础 - 自创

  7. 条件判断,筛选a中大于3 的值,返回的是布尔值 ,也可以对大于3的值求和。
    Pandas基础 - 自创
    Pandas基础 - 自创

  8. np中有exp 表示以e为底,的3,4,5,6次方。
    Pandas基础 - 自创

  9. 判断a中是否有空值,返回的是布尔值,是可以运算求和的。
    Pandas基础 - 自创

  10. 将a中的列表,改成dataframe 表格形式,如果在之前没有导入datafame,series ,可以用b = pd.Dateframe代替。
    Pandas基础 - 自创

DataFrame 的格式

  1. 原型由Series/列表构造,但是Series 是没有columns 的( 图1),只能用DataFrame里的(图2)。
    图1
    Pandas基础 - 自创
    图2
    Pandas基础 - 自创

  2. 另外一种书写方法:“c” 与 “a” 中表示列名= columns 。
    Pandas基础 - 自创

  3. {{ }} 2个花括号表示二维数组,[[ ]] 表示二维列表 ,2015,2016,2017表示行的序列;
    Pandas基础 - 自创

Pandas 的 查看与读写

  1. 把b 写入out1.csv 中,以"," 为分隔符,header 标题带不带进去 ,查看写进入之后的结果,用pd.read_csv查看。
    Pandas基础 - 自创

  2. 所有pd所支持查看的read 形式,主要有 csv,excel,html,json,sas,spss,sql,table 。
    Pandas基础 - 自创
    Pandas基础 - 自创

  3. 重置索引,只有在np 的格式下,将arange换成由1到N 的索引值,直接改变了原数据的索引。
    Pandas基础 - 自创

  4. pd.read_csv 直接读取数据,将在python 里的文件路径放进去,非本盘加r。

Pandas基础 - 自创

  1. json 格式读取html ,pd.read_json(html)。
    Pandas基础 - 自创

  2. 用json格式去爬虫,显示html 网页,pd.read_json(html)之后得到列表,要用list 去接。
    Pandas基础 - 自创

  3. list接住之后,找出源代码中的data 的"list" 列表,找出values,再转化为元组或者字典的格式,之后进行DataFrame转化为表格。
    Pandas基础 - 自创

  4. 可以从dataFrame 中查看from_records(e)的记录,此时的数据为2维,要加上[[ ]] 2个括号。
    Pandas基础 - 自创

  5. 爬html 表,直接放链接,之前是本地的表格,所以不用转化dataframe 格式。
    Pandas基础 - 自创

  6. pd.read_clipboard() 表示读取爬虫网页的html
    Pandas基础 - 自创

  7. txt 的读取,可以用scv, 自动修改columns 或者index,原数据发生改变。
    Pandas基础 - 自创

pandas 的数据查看

  1. data . head(2) 表示查看前2条数据。
    Pandas基础 - 自创
  2. data.tail(2) 表示查看后2条数据。
    Pandas基础 - 自创
    23.data.info()
    Pandas基础 - 自创
  3. dtypes 表示查看类型,object ,str ,bool, int
    Pandas基础 - 自创

PS:
撤销:Ctrl/Command + Z
重做:Ctrl/Command + Y
加粗:Ctrl/Command + B
斜体:Ctrl/Command + I
标题:Ctrl/Command + Shift + H
无序列表:Ctrl/Command + Shift + U
有序列表:Ctrl/Command + Shift + O
检查列表:Ctrl/Command + Shift + C
插入代码:Ctrl/Command + Shift + K
插入链接:Ctrl/Command + Shift + L
插入图片:Ctrl/Command + Shift + G
查找:Ctrl/Command + F
替换:Ctrl/Command + G

相关文章: