【发布时间】:2013-08-01 13:21:20
【问题描述】:
如何在Scala中修剪字符串的开始和结束字符
对于",hello" 或"hello," 等输入,我需要"hello" 的输出。
Scala 中是否有任何内置方法可以做到这一点?
【问题讨论】:
如何在Scala中修剪字符串的开始和结束字符
对于",hello" 或"hello," 等输入,我需要"hello" 的输出。
Scala 中是否有任何内置方法可以做到这一点?
【问题讨论】:
试试
val str = " foo "
str.trim
看看the documentation。如果您也需要删除 , 字符,您可以尝试以下操作:
str.stripPrefix(",").stripSuffix(",").trim
清理字符串前端的另一种方法是
val ignoreable = ", \t\r\n"
str.dropWhile(c => ignorable.indexOf(c) >= 0)
它也会处理像",,, ,,hello"这样的字符串
为了更好地衡量,这里有一个小函数,它从左到右一次扫描字符串:
def stripAll(s: String, bad: String): String = {
@scala.annotation.tailrec def start(n: Int): String =
if (n == s.length) ""
else if (bad.indexOf(s.charAt(n)) < 0) end(n, s.length)
else start(1 + n)
@scala.annotation.tailrec def end(a: Int, n: Int): String =
if (n <= a) s.substring(a, n)
else if (bad.indexOf(s.charAt(n - 1)) < 0) s.substring(a, n)
else end(a, n - 1)
start(0)
}
使用喜欢
stripAll(stringToCleanUp, charactersToRemove)
例如,
stripAll(" , , , hello , ,,,, ", " ,") => "hello"
【讨论】:
tailrec 魔法不能用一些简单的正则表达式代码替换吗?此外,ignorable contains c 可能被认为更具可读性。
tailrec 注释会导致编译器给我一个错误,如果它不能将代码重写为普通循环。我发现这很有帮助,因为我倾向于使用尾递归和 Java VM 的限制,以便在(例如)函数调用中正确支持它们。
trim 并没有真正记录在提供的文档链接中。你需要一些扎实的 scala-literate 挖掘(或只是实验)才能得到它的作用。
要修剪字符串中的开始和结束字符,请混合使用 drop 和 dropRight:
scala> "你好,".drop(1).dropRight(1)
res4: 字符串 = 你好
drop 调用删除第一个字符,dropRight 删除最后一个字符。请注意,这不像 trim 那样“智能”。如果“hello”的开头没有任何多余的字符,则将其修剪为“ello”。如果您需要更复杂的东西,正则表达式替换可能就是答案。
【讨论】:
如果您只想修剪逗号并且两端可能有多个逗号,您可以这样做:
str.dropWhile(_ == ',').reverse.dropWhile(_ == ',').reverse
这里使用reverse是因为没有dropRightWhile。
如果您正在查看单个可能的逗号,stripPrefix 和 stripSuffix 是最好的选择,正如 Dirk 所指出的那样。
【讨论】:
假设您只想从给定字符串的 前缀 和 后缀 中去除无效字符(不扫描整个字符串),这里有一个很小的trimPrefixSuffixChars 函数可以快速执行所需的效果:
def trimPrefixSuffixChars(
string: String
, invalidCharsFunction: (Char) => Boolean = (c) => c == ' '
): String =
if (string.nonEmpty)
string
.dropWhile(char => invalidCharsFunction(char)) //trim prefix
.reverse
.dropWhile(char => invalidCharsFunction(char)) //trim suffix
.reverse
else
string
此函数为invalidCharsFunction 提供默认值,仅将空格 (" ") 字符定义为无效。以下是以下输入字符串的转换结果:
trimPrefixSuffixChars(" Tx ") //returns "Tx"
trimPrefixSuffixChars(" . Tx . ") //returns ". Tx ."
trimPrefixSuffixChars(" T x ") //returns "T x"
trimPrefixSuffixChars(" . T x . ") //returns ". T x ."
如果你愿意指定你自己的invalidCharsFunction 函数,然后像这样在调用中传递它:
trimPrefixSuffixChars(",Tx. ", (c) => !c.isLetterOrDigit) //returns "Tx"
trimPrefixSuffixChars(" ! Tx # ", (c) => !c.isLetterOrDigit) //returns "Tx"
trimPrefixSuffixChars(",T x. ", (c) => !c.isLetterOrDigit) //returns "T x"
trimPrefixSuffixChars(" ! T x # ", (c) => !c.isLetterOrDigit) //returns "T x"
这试图简化其他答案中提供的一些示例解决方案。
【讨论】:
有人请求了一个正则表达式版本,应该是这样的:
val result = " , ,, hello, ,,".replaceAll("""[,\s]+(|.*[^,\s])[,\s]+""", "'$1'")
结果是:result: String = hello
正则表达式的缺点(不仅在这种情况下,而且总是如此)是对于尚未熟悉语法的人来说很难阅读。不过,代码简洁明了。
【讨论】:
" , ,, hello, ,,".replaceAll("""[,\s]+""", "")
val result = " , ,, hello, ,,".replaceAll("""[,\s]+""", "") 输出 result: String = hello ```
",he,llo,".replaceAll("""[,\s]+""", "") 和",he,llo,".replaceAll("""[,\s]+(|.*[^,\s])[,\s]+""", "'$1'") 之间的区别。
replaceAll 写了它。