介绍
我不太擅长在Alteryx中使用正则表达式,所以我会在提醒的情况下介绍它。
什么是正则表达式
一种以单一格式表示具有不同内容的字符串的方法。
“字符串中的 5 位数字”或“包含字母和空格的字符串”等。
具有一定规则的多个字符串模式可以在一个字符串中表示。
基本正则表达式列表
仅参考以下站点描述了在 Alteryx 中按预期工作的那些。
https://www-creators.com/tool/regex-checker
在上面的网址中,
您可以检查您想用正则表达式表达的字符串是否可以用创建的正则表达式表达。
当你不能用正则表达式替换它时推荐。
| 常用表达 | 正则表达式指向的字符串的内容 | 常用表达 | 正则表达式指向的字符串的内容 |
|---|---|---|---|
| . | 除换行符以外的任何字符 | - | - |
| * | 之前指定的 0 个或多个连续正则表达式 | + | 之前指定的正则表达式连续出现一次或多次 |
| (右) | 正则表达式分组 | [ABC] | 括号中的任何一个字符 |
| [交流] | 括号中的任何字符 | [^abc] | 除括号中的字符外的 1 个字符 |
| {N} | 前面的正则表达式模式连续出现 N 次 | {N,} | 前面的正则表达式模式连续出现 N 次或更多次 |
| {,M} | 前面的正则表达式模式的连续出现不超过 M | {N,M} | 至少 N 次且小于 M 次连续前面的正则表达式模式 |
| ^ | 正文开始 | $ | 文本结束 |
| ¥ | 标签 | ¥0 | 空字符 |
| ¥ | 任何空白字符(与 \t、\n、\r、\f 同义) | \S | 除空格外的所有字符 |
| \d | 任何单个数字字符 | ¥ D | 任何单个非数字字符 |
| ¥w | 字母表中的任何一个字符,“_” | ¥ W | 字母,除“_”之外的任何单个字符 |
| 元升 | 半角小写字母的任意一个字符 | ¥L | 半角小写字母以外的任何单个字符 |
| ¥ U | 任何单个单字节大写字母 | ¥ U | 半角大写字母以外的任何单个字符 |
如何在 Alteryx 中使用正则表达式
可以在 Alteryx 中使用正则表达式的节点是常用表达・筛选・公式系统・动态重命名等等
*链接是官方的
正则表达式本身对于任何节点都可以相同,
正则表达式工具允许您直接输入正则表达式,
过滤器、公式和动态重命名的不同之处在于它们使用正则表达式的函数。
这次,我将使用以下数据介绍正则表达式节点中的处理。
让我们尝试使用正则表达式对第 3 行和第 5 行中的数字进行各种处理。
由于你想用正则表达式指定的是一个数字,\d 代表一个数字,
由于我们希望支持具有不同位数的两个值,因此我们使用重复一次或多次的表达式+。
结合起来,“98”和“7”对应的正则表达式是\d+。
如何处理正则表达式节点
正则表达式节点可以执行四个过程:1)替换,2)标记,3)解析,4)匹配。
(1) 更换
将匹配正则表达式的字符串替换为指定的字符串。
这次我们用空格替换数字。
正则表达式可以分组,分组的正则表达式从头开始依次编号。
可以用$番号指定,
也可以执行“在匹配正则表达式的第一个字符串之前添加 0”之类的操作。
② 代币化
将匹配正则表达式的字符串拆分为列或行。
这次我们将数字部分分成列。
③ 分析
使用与正则表达式匹配的字符串创建一个新列。您可以指定新列的数据类型。
这一次,数字部分被创建为字符串类型。
④比赛
确定字符串是否与使用布尔类型的正则表达式匹配。
这次判断是否是包含数字的字符串(.*(\d+))。
综上所述
我将总结如何编写除正则表达式节点之外的其他内容。
原创声明:本文系作者授权爱码网发表,未经许可,不得转载;
原文地址:https://www.likecs.com/show-308622435.html