因为Anaconda 和 Jupyter notebook已成为数据分析的标准环境。
为了开始我的python数据分析之路,今天我将安装Anaconda 和Jupyter notebook,并展示其流程
简介:
Anaconda是包管理器和环境管理器
2. 安装Anaconda?
官网链接
如果官网地址网速太慢无法下载,可以通过我分享的百度云链接下载:
链接:https://pan.baidu.com/s/1ymdbbbkj2EzmhAlOeR-u2w
提取码:1tqr
如何管理包?
Jupyter notebook
简介
Jupyter notebook(jupyter) 是一种 Web 应用,能让用户将说明文本、数学方程、代码和可视化内容全部组合到一个易于共享的文档中。
Jupyter Notebook 已迅速成为数据分析,机器学习的必备工具。因为它可以让数据分析师集中精力向用户解释整个分析过程。
启动 Jupyter notebook
启动notebook 服务器后,在浏览器中会自动打开notebook页面地址:http://localhost:8888(其中localhost 表示你的计算机,而 8888 是服务器的默认端口)
顶部的3个选项卡
顶部的3个选项卡是:Files(文件)、Running(运行)和 Cluster(集群)。
【1】Files(文件)显示当前“notebook工作文件夹”中的所有文件和文件夹。
【2】点击 Running(运行)选项卡会列出所有正在运行的 notebook。可以在该选项卡中管理这些 notebook。
【3】Clusters一般不会用到。因为过去在 Clusters(集群)中创建多个用于并行计算的内核。现在,这项工作已经由 ipyparallel 接管。
创建一个新的notebook
写“Hello,world",并运行+ 按钮用于创建新的单元格
代码自动补全功能
刚开始第一次尝试使用补全功能失败了,后来看了猴子老师写的教程里的后续,知道了如果你定义的变量想出现在代码补全里,需要你先把定义该变量的cell运行以后,notebook才能识别它。
重命名notebook
你会看到刚才我建的notebook文件名是下面这样默认的,我想修改成自己喜欢的文件名如何办呢?
使用保存功能
重新运行所有单元格里的代码
关闭 notebook文件
共享你的notebook
点击File->Download as,你可以选择多种格式下载你的notebook。一般我都会根据下面的用途来选择不同的下载格式:
(1)如果我想和客户分享我的数据分析成果,我会选择将notebook下载为HTML文件。
(2)如果我希望将自己的数据分析成果和代码嵌入到项目中,我就会选择Python(.py)模块,这可以将我的代码融入项目中,成为子模块,方便和其他开发人员共同完成任务。
(3)如果要在博客或文档中使用 notebook,我就选择Markdown格式。
关闭Jupler notebook服务器
通过在终端中按两次 Ctrl + C,可以关闭整个服务器。再次提醒,这会立即关闭所有运行中的 notebook,因此,请确保你保存了工作!
关闭notebook服务器后,下次启动再打开notebook,当你继续在该notebook中写代码时,发现之前的变量无法访问了。需要你在该notebook的Kernerl选项卡中选择“Run All”重新编译下之前的代码。