Teradata Vantage - Vantage 分析库这是 [截至 2022 年 9 月 22 日] 的翻译。
(发布号:2.1.1 | 发布日期:2022 年 1 月)
本文是 Vantage Analytics Library 系列的一部分。
概述
文本字段解析检查字符数据以确定它是否可以作为数字、日期、时间、时间戳或字符数据存储在数据库中。
先决条件
• 访问 Teradata Vantage 实例。
- 必须安装 Vantage 分析库。如果您已经安装了 Vantage,请联系 Teradata 支持服务以安装 Vantage 分析库。
如果您使用 Vantage Express(评估版)或云服务 DIY太数据下载可供下载。
按照“安装 Vantage Analytics 库”一文安装 Vantage Analytics 库。数据准备
如何获取样本数据并将其存储在数据库中
请参阅此处的“为教程准备示例数据”。
执行方式
从 SQL 执行时的示例
CALL td_analyze ( 'textfieldanalyzer', /* 分析手法 */ ' database = QID; /* データベース名 */ tablename = Superstore; /* テーブル名 */ columns = Category,Sub_Category; /* カラムリスト */ outputdatabase = QID; /* 出力データベース名 */ outputtablename = out_table; /* 出力テーブル名 */ ' );结果表1(数据组合模式)
out_tableselect * from out_table sample 10;输出结果
类别 子类别 办公用品 纸 技术 配件 技术 配件 家具 陈设 办公用品 信封 办公用品 粘合剂 办公用品 纸 家具 陈设 办公用品 纸 办公用品 粘合剂 输出结果说明
指定的列值存储在输出结果中
结果表2(分析结果报告)
out_table_rptselect * from out_table_rpt;输出结果
列名 初始数据库类型 最小最大类型 样品类型 数值测试类型 可翻译成拉丁语 Unicode 总数 类别 VARCHAR(128) 字符集 UNICODE VARCHAR(15) 字符集 UNICODE VARCHAR(15) 字符集 UNICODE VARCHAR(15) 字符集 UNICODE 呐 呐 子类别 VARCHAR(128) 字符集 UNICODE VARCHAR(11) 字符集 UNICODE VARCHAR(11) 字符集 UNICODE VARCHAR(11) 字符集 UNICODE 呐 呐 输出结果说明
列名 数据类型 解释 列名 VARCHAR(128) 列名 初始数据库类型 VARCHAR(128) 源数据类型 最小最大类型 VARCHAR(128) 最小值/最大值的估计数据类型 样品类型 VARCHAR(128) 样本值的推断数据类型 数值测试类型 VARCHAR(128) 数字类型的推断数据类型 可翻译成拉丁语 VARCHAR(20) 可转换为 LAIN 字符的字符数 Unicode 总数 VARCHAR(20) 可转换为 UNICODE 字符的字符数 综上所述
示例代码将以SQL函数开头,Python代码依次发布。
警告
这本书是Teradata Vantage 文档它是该主题所需信息的摘录。我们不保证所发布内容的准确性、完整性、可靠性或最新性。具体内容请参考原文。
另外,如果您有任何需要或更正的要求或更正,请发表评论。联系 Teradata Vantage
原创声明:本文系作者授权爱码网发表,未经许可,不得转载;
原文地址:https://www.likecs.com/show-308630537.html