【问题标题】:Windows Batch File : Convert Structures into Single Lines StringsWindows 批处理文件:将结构转换为单行字符串
【发布时间】:2016-10-05 20:03:05
【问题描述】:

我需要以批处理文件的形式完成这项艰巨的任务,它不是用 C 做的最困难的任务,但在 DOS 中是一个地狱(至少对我来说!)我需要将结构转换为单个 var(字符串)能够在我的程序中再次将它们转换为该结构。复出不用担心,已经完成了。

该结构的大小会有所不同,并且在 [0] 内有一个索引,该索引必须是我的 var 中的第一项。

这里是这些结构的一个例子(只有 3 个):

level.waypoints[0] = spawnstruct();
level.waypoints[0].origin = (1774.5,834.7,67.6);
level.waypoints[0].type = "stand";
level.waypoints[0].childCount = 2;
level.waypoints[0].children[0] = 1;
level.waypoints[0].children[1] = 6;
level.waypoints[1] = spawnstruct();
level.waypoints[1].origin = (1780.6,639.1,65.5);
level.waypoints[1].type = "stand";
level.waypoints[1].childCount = 2;
level.waypoints[1].children[0] = 7;
level.waypoints[1].children[1] = 0;
level.waypoints[2] = spawnstruct();
level.waypoints[2].origin = (1902.2,-345.2,74.2);
level.waypoints[2].type = "stand";
level.waypoints[2].childCount = 2;
level.waypoints[2].children[0] = 3;
level.waypoints[2].children[1] = 97;
level.waypoints[3] = spawnstruct();
level.waypoints[3].origin = ... (goes on...)

所以第一个结构:

level.waypoints[0] = spawnstruct();
level.waypoints[0].origin = (1774.5,834.7,67.6);
level.waypoints[0].type = "stand";
level.waypoints[0].childCount = 2;
level.waypoints[0].children[0] = 1;
level.waypoints[0].children[1] = 6;

我需要把这个结构转换成这一行:

set flwp_0 "0,1774.5,834.7,67.6,stand,2,1,6"

其中 0 (flwp_) 是索引,也是 "" 中的第一项。

所以这个例子中的另外两个将是:

set flwp_1 "1,1780.6,639.1,65.5,3,7,0,30"
set flwp_2 "2,1902.2,-345.2,74.2,2,3,97"

childCount 可以是任何值,但我认为不会超过 9。 所以,我们有多少 childCount,下一行会有更多的孩子。

但我只需要 childCount 值之后的值,所以我知道该字符串中还有多少可用的项目,所以没问题。

我正在考虑先删除我不需要的所有内容,例如(按顺序):

level.waypoints[
] = spawnstruct();
].origin = (
);
].type = "
";
].childCount = 
].children[0] = 
].children[1] = 
].children[2] = 
].children[3] = 
].children[4] = 
].children[5] = 
].children[6] = 
].children[7] = 
].children[8] = 
].children[9] = 
;

这将在第一个结构中留下类似的内容:

0
01774.5,834.7,67.6
0stand
02
01
06

现在我需要阅读它并转换成我的单行字符串。但是我很难知道正确的索引,因为可能是第一个值,但是如果索引有 2 或 3 个字符?

我也在考虑用一些信息替换来跟踪我,所以不会替换文件的“]”,所以我会知道之前是什么是索引,之后是值。

我也尝试循环但没有成功创建如下索引:

level.waypoints[X]

X 是从 0 到 1000(我不相信会通过那个数字)

它不起作用,也许我的第一个想法更好......:\

我需要一个(或多个)批处理文件来将内部具有类似结构的多个文件转换为新文件,并将值作为我在上面详细描述的字符串。

有什么想法吗?

谢谢!


@Squashman 此外,如您所见,结果的顺序有点混乱:

set flwp_0 "0,1774.5,834.7,67.6,stand,2,1,6"
set flwp_100 "100,1636.76,371.924,240.125,stand,2,101,99"
set flwp_101 "101,1861.45,437.846,240.125,stand,2,102,100"
set flwp_102 "102,1843.93,557.03,240.125,stand,2,103,101"
set flwp_103 "103,1504.58,553.357,64.125,stand,2,8,102"
set flwp_104 "104,653.17,1675.32,64.125,stand,2,26,105"
set flwp_105 "105,338.784,1680.49,232.125,stand,2,104,133"
set flwp_106 "106,-919.398,1537.7,80.125,stand,3,107,109,150"
set flwp_107 "107,-928.311,1111.47,80.125,stand,3,108,106,149"
set flwp_108 "108,-696.488,1095.93,80.125,stand,2,36,107"
set flwp_109 "109,-787.781,1566.87,80.125,stand,2,106,110"
set flwp_10 "10,1423.3,-403.8,64.3,stand,4,11,12,15,3"
set flwp_110 "110,-754.274,1716.71,80.125,stand,2,109,34"
set flwp_111 "111,-736.201,1887.87,64.125,stand,4,112,34,151,152"
set flwp_112 "112,-454.293,1879.4,64.125,stand,4,111,33,34,152"
set flwp_113 "113,125.395,-451.579,58.6958,stand,3,51,114,142"
set flwp_114 "114,282.593,-447.87,68.125,stand,2,115,113"
set flwp_115 "115,304.311,-271.206,68.125,stand,2,116,114"
set flwp_116 "116,447.128,-292.167,68.125,stand,3,118,115,117"
set flwp_117 "117,437.415,-443.822,68.125,stand,2,67,116"
set flwp_118 "118,582.932,-297.811,126.125,stand,2,119,116"
set flwp_119 "119,561.586,-485.701,204.125,stand,2,120,118"
set flwp_11 "11,1240.1,-249.7,74.1,stand,5,9,16,10,12,15"
set flwp_120 "120,423.422,-470.754,204.125,stand,2,119,135"
set flwp_121 "121,1164.82,-1203.64,72.125,stand,4,123,14,126,122"
set flwp_122 "122,1064.12,-1299.76,72.125,stand,3,123,125,121"
set flwp_123 "123,1117.59,-1476.49,72.125,stand,3,124,122,121"
set flwp_124 "124,861.878,-1497.7,72.125,stand,2,125,123"
set flwp_125 "125,878.58,-1294.38,72.125,stand,2,124,122"

是否可以按正确的顺序写入文件?

再次非常感谢@Squashman 的帮助

干杯


好的,顺序真的无关紧要,但是我很难将每个文件都变成一个新文件...我尝试了这个但没有成功:

@echo off
 setlocal enabledelayedexpansion

for %%f in (*.gsc) do ( 

 FOR /F "tokens=1-2 delims==;^(^) " %%G IN (%%f) do set %%~G=%%~H
 FOR /F "tokens=2 delims=[]" %%G IN ('set level.waypoints ^|find /I "spawnstruct"') do (
    SET waypoints=!waypoints! %%G
 )

 FOR %%G IN (%waypoints%) do (
    set line=%%G,!level.waypoints[%%G].origin!,!level.waypoints[%%G].type!,!level.waypoints[%%G].childCount!
    FOR /F "tokens=2 delims==" %%H IN ('set level.waypoints[%%G].children') DO set line=!line!,%%H
    set line=set flwp_%%G "!line!"
    echo !line! >> %%f.cfg
 )

)
 pause

有什么线索吗?

========================================

好的,现在我们非常接近了!只需要处理带有level.waypoints[ 的行,其余的必须忽略,并添加一个我已经成功完成的最终关闭变量:

@echo off
setlocal enableDelayedExpansion

set findtext="level.waypoints["
for %%F in (*.gsc) do (
  set "out="
  set "i=x"
  > "%%~nF.cfg" (
    for /f usebackq^ tokens^=2^,4^,5^ delims^=[]^=(^)^;^"^  %%A in ("%%F") do (
      if %%A neq !i! (
        if defined out echo !out!"
        set /a "i=%%A, j=0"
        set "out=set flwp_!i! "!i!"

      ) else (
        set /a j+=1
        if !j! leq 3 (set "out=!out!,%%B") else set "out=!out!,%%C"
      )

    )
    if defined out echo !out!"
    set /a "fim=i+1"
    echo set flwp_!fim! "eof"
  )
)

现在如何将findstr %findtext% 添加到这些循环中?我尝试了许多不同的方式,但语法错误......你能帮帮我吗? :D

非常感谢 @Squashman 和 @dbenham 迄今为止提供的所有帮助。

干杯

【问题讨论】:

  • “DOS”是指 Windows 命令提示符cmd,对吧?
  • 是的!对不起!在 windows 下运行的批处理文件。 :D
  • 根据您的输入示例,航路点 1 和 2 的输出示例看起来不正确。
  • 在提问时提供准确的数据示例真的很有帮助。
  • @Squashman 文件的其余部分是每行带有// 的cmets,或者/* ... */ 内的多行块。还有所有结构都在里面的函数名称......就像function() { -structures like I posted- }. It's a gsc file (C#). We are VERY close, just need to process lines with the string level.waypoints[. I tryed for %%F in (findstr %findtext% *.gsc) do (..`but没用。你能帮我吗?请看一下我上次编辑的代码。谢谢!

标签: windows batch-file replace copy remove-if


【解决方案1】:

这是一个相对快速的纯批处理解决方案,它对每个文件使用单个 FOR /F 循环。它比Squashman's solution 快得多。

我将 DELIMS 和 TOKENS 设置为解析出所有需要的数据元素,无论我在解析哪一行。我不担心 childCount 的值。相反,我只是检测路点索引的变化来表示新记录的开始,并且使用递增的路点行号(j 变量)来识别每行需要哪些标记。每行都会向 out 变量添加新文本。

@echo off
setlocal enableDelayedExpansion
for %%F in (*.gsc) do (
  set "out="
  set "i=x"
  > "%%~nF.cfg" (
    for /f usebackq^ tokens^=2^,4^,5^ delims^=[]^=(^)^;^"^  %%A in ("%%F") do (
      if %%A neq !i! (
        if defined out echo !out!"
        set /a "i=%%A, j=0"
        set "out=set flwp_!i! "!i!"
      ) else (
        set /a j+=1
        if !j! leq 3 (set "out=!out!,%%B") else set "out=!out!,%%C"
      )
    )
    if defined out echo !out!"
  )
)

上面能够在 70 秒内在我的机器上处理一个 23 MB 的文件。


但是,如果您允许自己超出纯批处理的范围,我可以做得更好。这是一个高效的JREPL.BAT 解决方案,它利用了刚刚发布的 6.0 版新功能。

JREPL.BAT is a regular expression text processing utility for Windows。它是纯脚本(混合批处理/Jscript),可以在从 XP 开始的任何 Windows 机器上本地运行。不需要第三方 exe 文件。

通过jrepl /?jrepl /?? 可从命令行获取大量文档以获取分页帮助。

此解决方案应该能够处理大小接近 1 GB 的文件。通过对 JREPL.BAT 的一次调用完全处理每个文件。它应该非常有效,因为所需的回溯最少。对于小文件,由于 CSCRIPT 引擎的启动时间,它会比纯批处理方法慢。但对于大文件,它比纯批处理要快得多。

下面的代码只需 11 秒即可处理相同的 23 MB 文件 :-)

第一个版本将复杂的正则表达式术语的构造分解为多个步骤,并在每个捕获的组上方包含注释数字,让您有机会了解它的工作原理。特别是,请阅读 /T 和 /P 选项的文档。还要加强你的正则表达式技能!

@echo off
setlocal

set "filter=(.*?\[\d+])[\s\S]*?(?:\n(?!\1)|(?![\s\S]))"

::   1           2                3                  4
set "find1=l.*?\[(\d+)\][\s\S]*?\((\d.*?)\)[\s\S]*?\q(.*?)\q"
set "repl1=set flwp_$2 \q$2,$3,$4"

::   5                 6
set "find2=;[\s\S]*? = (\d+)"
set "repl2=,$6"

::   7
set "find3=[\s\S]+"
set "repl3=\q\n"

set "find=%find1%|%find2%|%find3%"
set "repl=%repl1%|%repl2%|%repl3%"

for %%F in (*.gsc) do (
  call jrepl.bat "%find%" "%repl%" /t "|" /p "%filter%" /x /m /f "%%F" /o "%%~nF.cfg"
)

这里是完全相同的解决方案,但没有显示任何中间步骤。我确实包含了续行以提高可读性。

@echo off
for %%F in (*.gsc) do (
  call jrepl.bat "l.*?\[(\d+)\][\s\S]*?\((\d.*?)\)[\s\S]*?\q(.*?)\q|;[\s\S]*? = (\d+)|[\s\S]+"^
                 "set flwp_$2 \q$2,$3,$4|,$6|\q\n"^
                 /p "(.*?\[\d+])[\s\S]*?(?:\n(?!\1)|(?![\s\S]))"^
                 /t "|" /x /m /f "%%F" /o "%%~nF.cfg"
)

我想最快的脚本解决方案是自定义构建的 JScript 或 VBS 脚本。但我喜欢使用 JREPL :-)

更新:这是一个小红利 - 一个将 *.cfg 转换回 *.gsc 的 JREPL 脚本

@echo off
setlocal

set "beg=var pre,i,q='\x22',n='\r\n'"

::        1     2     3             4     5     67
set "find=^.*?\q(\d+),(.*?,.*?,.*?),(.*?),(.*?),|(.*?)[,\q]"

set "repl=i=0;pre='level.waypoints['+$2+']';$txt=pre+' = spawnstruct();'"
set "repl=%repl%+n+pre+'.origin = ('+$3+');'"
set "repl=%repl%+n+pre+'.type = '+q+$4+q+';'"
set "repl=%repl%+n+pre+'.childCount = '+$5+';'"
set "repl=%repl%|$txt=n+pre+'.children['+(i++)+'] = '+$7+';'"

for %%F in (*.cfg) do (
  call jrepl.bat "%find%" "%repl%" /x /t "|" /jq /jbeg "%beg%" /f "%%F" /o "%%~nF.gsc"
)

【讨论】:

  • 哇!那太棒了!是否可以添加最终结束线?例如最后一个索引是 150,所以将最后一行添加为set flwp_151 "eof"?我现在就试试 JREPL。非常感谢@dbenham! :D
  • 另一件事,不是这种格式的文件中的每一行(没用)在他们的行上打印set flwp_0 "0",只有在行中找到level.waypoints[时才能处理/打印以避免垃圾文件生成?再次感谢您!
  • 尝试了 JREPL,只有在我事先从所有行中删除缩进时才有效。我只对level.waypoints[ 的行感兴趣,所有其他的都必须忽略。再次感谢您的帮助。
  • 好的,用我现在所拥有的更新了问题......只需要知道如何输入findstr %findtext% 介绍该循环(或另一种仅处理具有字符串@的行的解决方案) 987654336@。缩进也必须忽略。再次非常感谢!
【解决方案2】:

使用您的新请求编辑了代码。

 @echo off

 FOR %%F IN (*.gsc) DO (
    setlocal enabledelayedexpansion
    FOR /F "usebackq tokens=1-2 delims==;^(^) " %%G IN (`find /I "level.waypoints["^<"%%F"`) do set %%~G=%%~H
    (FOR /F "tokens=2 delims=[]" %%G IN ('find /I "spawnstruct" ^<"%%F"') do (
        set line=%%G,!level.waypoints[%%G].origin!,!level.waypoints[%%G].type!,!level.waypoints[%%G].childCount!
        FOR /F "tokens=2 delims==" %%H IN ('set level.waypoints[%%G].children') DO set line=!line!,%%H
        set line=set flwp_%%G "!line!"
        echo !line!
    ))>"%%~nF.cfg"
    endlocal
 )
 pause

【讨论】:

  • 但我需要在批处理所在目录的所有文件中执行此操作。是否可以更改为 *.txt 而不是文件名?我还需要创建一个与 *.cfg 不同扩展名的文件名称相同的文件
  • 如果您需要它来处理多个文件,然后在所有代码周围包装另一个 FOR 命令。如果您需要将其输出到另一个文件,则将 echo !line 重定向到文件而不是屏幕。
  • 查看添加的有关订单@Squashman 的信息
  • 好吧,别担心顺序,真的不会有太大区别。您能否帮助获取所有文件并将每个文件保存在基于原始名称的新名称下?我刚刚更新了我到目前为止所做的事情。再次感谢@Squashman
  • @FreddyHajas,根据您的最新请求更新了代码。周末去了。所以没有更多的更新。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2014-05-30
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2021-07-05
  • 2023-04-09
  • 1970-01-01
相关资源
最近更新 更多