Teradata Vantage - Vantage 分析库这是 [截至 2022 年 9 月 22 日] 的翻译。
(发布号:2.1.1 | 发布日期:2022 年 1 月)
本文是 Vantage Analytics Library 系列的一部分。
概述
bincode 转换可用于将连续数值列替换为分类列。 bincode 转换产生序数值(即顺序重要的数字分类值,如数据列)。
先决条件
• 访问 Teradata Vantage 实例。
- 必须安装 Vantage 分析库。如果您已经安装了 Vantage,请联系 Teradata 支持服务以安装 Vantage 分析库。
如果您使用 Vantage Express(评估版)或云服务 DIY太数据下载可供下载。
按照“安装 Vantage Analytics 库”一文安装 Vantage Analytics 库。数据准备
如何获取样本数据并将其存储在数据库中
请参阅此处的“为教程准备示例数据”。
执行方式
从 SQL 执行时的示例
call td_analyze ( 'vartran', /* 分析手法 */ ' database = qid; /* データベース名 */ tablename = Superstore; /* テーブル名 */ bincode = {binstyle (bins, 5), columns (quantity/q1)} /* ビンを5つ作成 */ {binstyle (binswithboundaries, 5, 3, 7), columns (quantity/q2)} /* 3~7の範囲でビンを5つ作成 */ {binstyle (boundaries, 3,5,7), columns (quantity/q3)} /* ~3,4~5,6~7,8~のビン */ {binstyle (quantiles, 5), columns (quantity/q4)} /* ビンの数を均等にビンを5つ作成 */ {binstyle (width, 3), columns (quantity/q5)} /* 幅3でビン作成 */ ; ' );将输出结果写入表时可以指定以下选项。
outputdatabase = 输出数据库名称;
outputtablename = 输出表名;
overwrite = {true | false}; --- 如果未指定,则用 true 覆盖选项说明
选项 解释 垃圾箱 创建具有指定编号 (n) 的 bin
均衡箱宽度有边界的箱子 创建具有指定编号 (n) 的 bin
指定范围以创建 bin
均衡箱宽度
下面的范围是用 0 个 bin 创建的,上面的范围是用 n+1 个 bin 创建的边界 通过指定边界创建 bin 分位数 创建具有指定编号 (n) 的 bin
甚至出垃圾箱的数量宽度 创建指定宽度的箱 输出结果
仅显示前 10 个。
结果数字是 bin 编号。
q1 q2 q3 第四季度 q5 1 0 0 1 1 1 0 0 1 1 1 0 0 1 1 1 0 0 1 1 1 0 0 1 1 1 0 0 1 1 1 0 0 1 1 1 0 0 1 1 1 0 0 1 1 1 0 0 1 1 ~ ~ ~ ~ ~ 综上所述
示例代码将以SQL函数开头,Python代码依次发布。
警告
这本书是Teradata Vantage 文档它是该主题所需信息的摘录。我们不保证所发布内容的准确性、完整性、可靠性或最新性。具体内容请参考原文。
另外,如果您有任何需要或更正的要求或更正,请发表评论。联系 Teradata Vantage
原创声明:本文系作者授权爱码网发表,未经许可,不得转载;
原文地址:https://www.likecs.com/show-308631910.html