这是我的第一篇博客,我也料想这篇博客将非常长。学习过程中的感想和思考如有错误,欢迎各位指正,非常感谢!

2019.2.22开始学习-2019.2.24结束学习(第一章&第二章)

· 2019.2.22_第一章P1-P23
关于P16页中while循环的例子,我认为原文注释有误,原文如下:

s,k = 0
while k<101;#该循环过程就是求1+2+3+...+100
    k = k+1
    s = s+k
print s

很明显该语句是用2.x语句写的,若用3.x语句,则需要修改为:

s = k = 0
while k<101;#该循环过程就是求1+2+3+...+100
    k = k+1
    s = s+k
print(s)

我认为此循环过程应当是求1+2+3+…+101(也于实践求证了)
《Python数据分析与挖掘实战》学习笔记(一)
关于P23页的代码清单2-1,在安装好了Anaconda之后,打开Jupyter输入代码,无法运行出任何结果,也没有报错,我一直在想是不是Numpy包没有加载到Python中,于是我打开Anaconda Prompt进行查看
《Python数据分析与挖掘实战》学习笔记(一)
于是我稍微修改了一下网友的方法,打开Anaconda Prompt,**Jupyter环境,输入
activate base
pip install numpy
参照详情可见 https://bbs.csdn.net/topics/392336453?list=62476831
之后重启一下Jupyter,即可正常运行。这里给出的图是**Scipy的(之前**Numpy忘了截图)
《Python数据分析与挖掘实战》学习笔记(一)

· 2019.2.23-第二章P24-P28
关于P24页的代码清单2-2,我不太明白fsolve函数为什么需要一个输入初值,并且在输入初值变化的情况下,结果也变了。按照道理来讲,给定方程的函数解是一定的啊。(???问号标记一下我的困惑)

#求解非线性方程组2x1 - x2^2 = 1, x1^2 - x2 = 2
from scipy.optimize import fsolve #导入求解方程组的函数
def f(x): #定义要求解的方程组
   x1 = x[0]
   x2 = x[1]
   return [2*x1 - x2**2 - 1,x1**2 - x2 -2]
result = fsolve(f, [1,1]) #输入初值[1,1]并求解
print(result) #输出的结果为[1.963957, 1.68501606],若输入变为[0,0],输出则变为[1. -1.]

fsolve函数的用法详见 https://docs.scipy.org/doc/scipy/reference/generated/scipy.optimize.fsolve.html?highlight=fsolve#scipy.optimize.fsolve

(???)后面一段的代码我也不是很懂(输出结果为圆周率pi,得翻翻高数书了)

from scipy import integrate
def g(x):
    return (1-x**2)**0.5
pi_2,err = integrate.quad(g,-1,1)
print(pi_2*2)

关于P26页提到的Pandas,由于我之前完全不了解,所以借此机会做了一些工作。

结构化查询语言SQL(STRUCTURED QUERY LANGUAGE)是最重要的关系数据库操作语言,并且它的影响已经超出数据库领域,得到其他领域的重视和采用,如人工智能领域的数据检索,第四代软件开发工具中嵌入SQL的语言等。SQL语言是一种交互式查询语言,允许用户直接查询存储数据,但它不是完整的程序语言,如它没有DO或FOR 类似的循环语句,但它可以嵌入到另一种语言中,也可以借用VB、C、JAVA等语言,通过调用级接口(CALL LEVEL INTERFACE)直接发送到数据库管理系统。SQL基本上是域关系演算,但可以实现关系代数操作。
SQL概述可参见 https://www.cnblogs.com/renzp/p/7921972.html

关于P27页代码清单2-4,运行出来的有些参数我还不太明白其含义与如何计算得来,比如Count,25%,50%,75%。(学习之后的章节P36我知道了,Count是非空值数,std是标准差,25%,50%,75%分别代表1/4,1/2,3/4分位数)

《Python数据分析与挖掘实战》学习笔记(一)
对于利用Pandas读取Excel文件,我按照书中所说的pip了两下(如下),然后将Excel文件放入了我的‘ C:>User>用户名> ’的目录当中就可以顺利读取啦!
《Python数据分析与挖掘实战》学习笔记(一)
《Python数据分析与挖掘实战》学习笔记(一)

**·**2019.2.24_第二章P28-P32
关于P28页的鸢尾花分类实例,按照书中所写的代码,出现了如下未收敛警告(增加了迭代次数):
《Python数据分析与挖掘实战》学习笔记(一)
(???)借鉴学习了一下 https://blog.csdn.net/IT_ER/article/details/82294079 函数了解太欠缺导致也没有读得懂,对警告如何修改也没有头绪。
章节的最后,我没有配置Keras环境和Genism环境。以上便是对第一章和第二章的学习。

相关文章: