第一个 scikit-learn例子

.....................................................................................................................................................

import sys

import scipy as sp

#到目标地址读取数据 web_traffic.tsv 包含我们需要的数据 

#Python是一个高度优化的解释性语言,在处理数值繁重的算法方面要比C等语言慢很多,

#那为什么依然有很多科学家和公司在计算密集的领域将赌注下在Python上呢?

#因为Python可以很容易地将数值计算任务分配给C或Fortran这些底层扩展。其中NumPy和SciPy就是其中代表。

#前者表示路径名,要注意在自己电脑上设置成相应的路径名,然后第二个参数是分隔符,由于原文件中使用的制表符隔开数据的,所以这里是\t


data=sp.genfromtxt("C:\Users\Administrator\Desktop\machine_learning\web_traffic.tsv",delimiter="\t")  

#打印10行数据出来
print(data[:10])

#data[:,a]  把a列的数据提取出来

x=data[:,0]

y=data[:,1]

#对不是有效的数据进行计算。

sp.sum(sp.isnan(y))

 

#x[sp.isnan(y)] 表示取无效的数据  ~sp.isnan(y) 表示相反,取有效的数据。

x=x[~sp.isnan(y)]

y=y[~sp.isnan(y)]

 

#可视化工具matplotlib

import matplotlib.pyplot as plt

 

plt.scatter(x,y)

plt.title("Web traffic over the last month")

plt.xlabel("Time")

plt.ylabel("Hits/hour")

plt.xticks([w*7*24 for w in range(10)],

['week %i'%w for w in range(10)])

plt.autoscale(tight=True)

plt.grid()

fp1,residuals,rank,sv,rcond=sp.polyfit(x,y,1,full=True)

f1=sp.poly1d(fp1)

fx=sp.linspace(0,x[-1],1000)

plt.plot(fx,f1(fx),linewidth=4)

plt.legend(["d=%i" %f1.order],loc="upper left")

plt.show()

input()

 

.................................................................................................................................................

1.import sys

  import scipy as sp

 

 

2.import matplotlib.pyplot as plt

plt.scatter(x,y)

先查scikit-learn安装在哪个python版本里面,查找之后就进入python根目录下

如  Python27\Lib\site-packages\matplotlib 目录下  这样就找到了那个pyplot文件

scatter(x,y) 就是文件里面的一个函数

 

3.SciPy是用子模块的形式来组织的,这些子模块涵括了不同科学计算领域的内容。下面这个表对他们进行了总结
 
 
子模块 描述
constans 物理和数学常数
cluster 聚类算法
fftpack 快速傅立叶变换程序
integrate 集成和常微分方程求解器
interpolate 拟合和平滑曲线
io 输入和输出
linalg 线性代数
maxentropy 最大熵法
ndimage N维图像处理
odr 正交距离回归
optimize 最优路径选择
signal 信号处理
sparse 稀疏矩阵和以及相关程序
spatial 空间数据结构和算法
special 特殊函数
stats 统计上的函数和分布
weave C/C++ 整合(integration)
 
 
Scipy的子模块也需要单独import
>>>from scipy import sparse

 

相关文章:

  • 2021-11-19
  • 2021-08-04
  • 2021-10-18
  • 2022-01-09
  • 2021-12-08
  • 2021-05-31
  • 2022-12-23
猜你喜欢
  • 2022-12-23
  • 2021-10-17
  • 2021-12-12
  • 2022-12-23
  • 2021-06-12
相关资源
相似解决方案