【发布时间】:2019-01-05 10:50:24
【问题描述】:
我正在尝试使用 Julia 进行基本数据分析
我正在关注this tutorial 的火车数据集,可以使用以下代码找到here(名为train_u6lujuX_CVtuZ9i.csv):
using DataFrames, RDatasets, CSV, StatsBase
train = CSV.read("/Path/to/train_u6lujuX_CVtuZ9i.csv");
describe(train[:LoanAmount])
并得到这个输出:
Summary Stats:
Length: 614
Type: Union{Missing, Int64}
Number Unique: 204
代替教程的输出:
Summary Stats:
Mean: 146.412162
Minimum: 9.000000
1st Quartile: 100.000000
Median: 128.000000
3rd Quartile: 168.000000
Maximum: 700.000000
Length: 592
Type: Int64
% Missing: 3.583062
这也对应于describe()函数应该给出的StatsBase.jl的输出
【问题讨论】:
标签: statistics julia summary