《Python数据分析与挖掘实战》学习笔记（一）

这是我的第一篇博客，我也料想这篇博客将非常长。学习过程中的感想和思考如有错误，欢迎各位指正，非常感谢！

2019.2.22开始学习-2019.2.24结束学习（第一章&第二章）

· 2019.2.22_第一章P1-P23
关于P16页中while循环的例子，我认为原文注释有误，原文如下：

s,k = 0
while k<101;#该循环过程就是求1+2+3+...+100
    k = k+1
    s = s+k
print s

很明显该语句是用2.x语句写的，若用3.x语句，则需要修改为：

s = k = 0
while k<101;#该循环过程就是求1+2+3+...+100
    k = k+1
    s = s+k
print（s）

我认为此循环过程应当是求1+2+3+…+101（也于实践求证了）
《Python数据分析与挖掘实战》学习笔记（一）
关于P23页的代码清单2-1，在安装好了Anaconda之后，打开Jupyter输入代码，无法运行出任何结果，也没有报错，我一直在想是不是Numpy包没有加载到Python中，于是我打开Anaconda Prompt进行查看
《Python数据分析与挖掘实战》学习笔记（一）
于是我稍微修改了一下网友的方法，打开Anaconda Prompt，**Jupyter环境，输入
activate base
pip install numpy
参照详情可见 https://bbs.csdn.net/topics/392336453?list=62476831
之后重启一下Jupyter，即可正常运行。这里给出的图是**Scipy的（之前**Numpy忘了截图）
《Python数据分析与挖掘实战》学习笔记（一）

· 2019.2.23-第二章P24-P28
关于P24页的代码清单2-2，我不太明白fsolve函数为什么需要一个输入初值，并且在输入初值变化的情况下，结果也变了。按照道理来讲，给定方程的函数解是一定的啊。（？？？问号标记一下我的困惑）

#求解非线性方程组2x1 - x2^2 = 1, x1^2 - x2 = 2
from scipy.optimize import fsolve #导入求解方程组的函数
def f(x): #定义要求解的方程组
   x1 = x[0]
   x2 = x[1]
   return [2*x1 - x2**2 - 1,x1**2 - x2 -2]
result = fsolve(f, [1,1]) #输入初值[1,1]并求解
print(result) #输出的结果为[1.963957, 1.68501606]，若输入变为[0,0]，输出则变为[1. -1.]

fsolve函数的用法详见 https://docs.scipy.org/doc/scipy/reference/generated/scipy.optimize.fsolve.html?highlight=fsolve#scipy.optimize.fsolve

（？？？）后面一段的代码我也不是很懂（输出结果为圆周率pi，得翻翻高数书了）

from scipy import integrate
def g(x):
    return (1-x**2)**0.5
pi_2,err = integrate.quad(g,-1,1)
print(pi_2*2)

关于P26页提到的Pandas，由于我之前完全不了解，所以借此机会做了一些工作。

结构化查询语言SQL（STRUCTURED QUERY LANGUAGE）是最重要的关系数据库操作语言，并且它的影响已经超出数据库领域，得到其他领域的重视和采用，如人工智能领域的数据检索，第四代软件开发工具中嵌入SQL的语言等。SQL语言是一种交互式查询语言，允许用户直接查询存储数据，但它不是完整的程序语言，如它没有DO或FOR 类似的循环语句，但它可以嵌入到另一种语言中，也可以借用VB、C、JAVA等语言，通过调用级接口（CALL LEVEL INTERFACE）直接发送到数据库管理系统。SQL基本上是域关系演算，但可以实现关系代数操作。
SQL概述可参见 https://www.cnblogs.com/renzp/p/7921972.html

关于P27页代码清单2-4，运行出来的有些参数我还不太明白其含义与如何计算得来，比如Count，25%，50%，75%。（学习之后的章节P36我知道了，Count是非空值数，std是标准差，25%，50%，75%分别代表1/4，1/2，3/4分位数）

《Python数据分析与挖掘实战》学习笔记（一）
对于利用Pandas读取Excel文件，我按照书中所说的pip了两下（如下），然后将Excel文件放入了我的‘ C:>User>用户名> ’的目录当中就可以顺利读取啦！

**·**2019.2.24_第二章P28-P32
关于P28页的鸢尾花分类实例，按照书中所写的代码，出现了如下未收敛警告（增加了迭代次数）：
《Python数据分析与挖掘实战》学习笔记（一）
（？？？）借鉴学习了一下 https://blog.csdn.net/IT_ER/article/details/82294079 函数了解太欠缺导致也没有读得懂，对警告如何修改也没有头绪。
章节的最后，我没有配置Keras环境和Genism环境。以上便是对第一章和第二章的学习。