【问题标题】:How do I parse a key-value string without a clear delimiter?如何解析没有明确分隔符的键值字符串?
【发布时间】:2016-04-17 21:16:32
【问题描述】:

我正在编写一个控制 3D 打印机的小程序。当我给它发送一些东西时,它通常会回复ok,但如果有什么不好的,它会发送如下内容:

 T:221.0 /220.0 @:0 W:1

如果它有适当的分隔符,我可以很容易地解析它,但由于字符串221.0 /220.0,使用空格并不可靠。因此,如果我使用空格作为分隔符,/220.0 可能会被视为键值对,但没有键,因为它在 T 之下。我计划获取每个冒号的索引和它后面的简单开始 1 字符,但密钥长度也是可变的。例如:

 T:221.0 /220.0 B@:127 @:0 W:1

B@ 现在是两个字符长。

我做了一些研究,但我发现的所有内容都有适当的分隔符,例如 URL with data

http://www.niederschlagsradar.de/images.aspx?jaar=-6&type=europa.cld&datum=201311161500&cultuur=en-GB&continent=europa

我计划获取每个冒号的索引,然后在找到一个冒号时向后搜索一个空格作为起点。同样,下一个键值对的开始点将作为前一个键值对的结束点。但是,我不确定这是否是正确的方法。

主要问题: 如何解析没有适当分隔符的字符串? 我真的没有具体要求。无论是数组还是列表,为键和值单独变量,或者只是将所有内容都塞入一个数组中

string[] data = {key1,value1,key2,value2,key3,value3};

更新:以下是第二个示例中的键值对:

Key:Value
  T:221.0 /220.0
 B@:127
  @:0
  W:1

更多示例:

 T:221.0 /220.0 B:85.7 /120 B@:30W @:0 W:8

Key:Value
T:221.0 /220.0
B:85.7 /120
B@:30W
@:0
W:8

这是另一个更复杂的:

 T:171.4 /220.0 B:90.3 /120 T1:171.4 /220.0 B@:30 @:12W W:6

Key:Value
T:171.4 /220.0   // Temperature of first nozzle heater
B:90.3 /120      // Temperature of the hot plate it's printing on
T1:171.4 /220.0  // Temperature of the second nozzle heater if it exists
B@:30            // Raw power consumption of hotbed (unit depends on config)
@:12W            // Power of of nozzle in Watts (unit depends on config)
W:6              // Waiting time (in seconds). If the optimal conditions are met and this counts down to zero, printing resumes. Else, reset to 10.

示例字符串开头的空格是有意的。它确实以空格开头。对于那些感兴趣的人,这些是运行 Marlin 3D 打印固件的 Arduino Mega 的回复。这些是打印机加热器还不够热而无法挤出时的回复。

相关:How to parse a string to find key-value pairs in it

【问题讨论】:

  • 这里的键/值是什么: T:221.0 /220.0 B@:127 @:0 W:1 ?我打算在这里建议使用正则表达式。请添加几个输入样本,以便我们更清楚地了解您的输入内容。

标签: c# string parsing delimiter key-value


【解决方案1】:

我会遵循这个逻辑:

  1. 用冒号分隔。
  2. 第一项始终是第一个键。
  3. 最后一项始终是最后一个值。
  4. 对于每个中间项(从第二项开始)检查最后一个空格的索引。直到最后一个空格的所有内容都是最新键的值,右边的所有内容都是下一个键。

代码:

private List<KeyValuePair<string, string>> ParsePrinterResponse(string rawResponse)
{
    List<KeyValuePair<string, string>> pairs = new List<KeyValuePair<string, string>>();
    string[] colonItems = rawResponse.Trim().Split(new char[] { ':' }, StringSplitOptions.RemoveEmptyEntries);
    if (colonItems.Length > 1)
    {
        string currentKey = colonItems[0], currentValue = "";
        for (int i = 1; i < colonItems.Length; i++)
        {
            string currentItem = colonItems[i];
            int spaceIndex = currentItem.LastIndexOf(" ");
            if (spaceIndex < 0)
            {
                //end of string, whole item is the value
                currentValue = currentItem;
            }
            else
            {
                //middle of string, left part is value, right part is next key
                currentValue = currentItem.Substring(0, spaceIndex);
            }
            pairs.Add(new KeyValuePair<string, string>(currentKey, currentValue));
            currentKey = currentItem.Substring(spaceIndex + 1);
        }
    }
    return pairs;
}

使用示例:

errorBox.Lines = ParsePrinterResponse("T:171.4 /220.0 B:90.3 /120 T1:171.4 /220.0 B@:30 @:12W W:6").ConvertAll(p =>
{
    return string.Format("{0}:{1}", p.Key, p.Value);
}).ToArray();

【讨论】:

  • 太棒了!我实际上想到了这一点,但因为我认为它不起作用而将其驳回。您的示例另有说明
  • 干杯,每个项目既是价值又是关键的部分是令人困惑的部分,不能怪你。我花了一段时间才弄清楚这一点,然后把它翻译成代码就是东部。 :)
【解决方案2】:
From each colon position found,
    search backwards until a whitespace character is found
    search forward until a whitespace character is found

我不会将下一个键值对的起点与前一个结束点相关联,因为键值对之间可能有多个空格。我将仅从冒号位置开始确定键和值。

【讨论】:

    猜你喜欢
    • 2020-01-30
    • 1970-01-01
    • 2018-07-31
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多