【问题标题】:How to get specific quantiles using R while connecting to Greenplum database?如何在连接到 Greenplum 数据库时使用 R 获取特定的分位数?
【发布时间】:2015-09-04 18:34:02
【问题描述】:

我正在尝试从我的数据中获取分位数 - 让我们说 (0.25, 0.5 和 0.75 ) 的变量。我可以从数据框中弄清楚如何做到这一点

分位数 % summarise(quantile(variable_name,c(.25,0.5,0.75)))

但是,当我尝试从表中获取分位数时(连接到 greenplum 后),它似乎不起作用,而不是数据框。

关于如何实现这一点的任何想法?我的猜测是分位数函数的 PostgreSQL 查询翻译不可用。

【问题讨论】:

    标签: r dplyr greenplum


    【解决方案1】:

    为了从 postgreSQL 中获取分位数,您可以使用 percentile_cont 函数。

    percentile_cont(fraction) WITHIN GROUP (ORDER BY sort_expression)
    

    http://www.postgresql.org/docs/9.4/static/functions-aggregate.html

    【讨论】:

    • 感谢您的回复。我使用 percentile_cont 从 greenplum 获取分位数。但是,在这种情况下,我通过 R 连接到 Greenplum 并编写 R 函数以进行数据操作。有没有办法做百分位 _cont 从 R 做的事情? dpylr 无论如何都可以这样做吗?
    • 该函数从数据库端获取百分位数......在R端做同样的事情也许你可以使用R的分位数函数? r-tutor.com/elementary-statistics/numerical-measures/percentile
    • 分位数函数适用于数据帧。当我直接使用数据库(而不是创建数据框)时,它给了我错误
    • 在小提琴中设置一个示例数据库来显示问题,也许我们可以在那里确定它。 :)
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2015-03-17
    • 1970-01-01
    • 2012-08-12
    相关资源
    最近更新 更多