【发布时间】:2009-06-30 07:11:37
【问题描述】:
好吧,伙计们/女孩们再次坚持简单的事情
我有一个文本文件,每个条目有多行,数据格式如下
第一个单词单词单词
wordx word word word interesting1 word word word word
字字字字字字句
wordz word word word interesting2 word word word lastword
这个序列重复了一百次左右,除了interesting1和interesting2之外,所有其他单词都相同,没有空行。有趣的 2 与有趣的 1 相关,但与其他任何东西无关,我想将这两个有趣的项目链接在一起,丢弃其余的,例如
有趣1 = 有趣2
有趣1 = 有趣2
有趣1 = 有趣2
等等,每个序列 1 个 lne
每一行都以不同的单词开头
我的尝试是读取文件并执行“if wordx in line”语句来识别第一个有趣的行,切出值,找到第二行,(“if wordz in line)切出值并将第二个与第一个。
不过这很笨拙,我不得不使用全局变量、临时变量等,而且我确信必须有一种方法可以识别 firstword 和 lastword 之间的范围并将其放入一个列表中,然后将两个值切分在一起。
感谢您的任何建议,感谢您的宝贵时间
【问题讨论】:
-
如果您有一些示例代码可能会有所帮助。很难说你期望如何确定什么是“有趣的”。它总是在索引 4 中吗?
-
正如蒙库特所说,您试图过度简化问题的内容,不幸的是,这使得您很难理解您想要做什么或为什么要这样做。不要害怕包含一些真实数据,以便我们了解正在发生的事情。
-
对不起。有趣的词是单个文本词,总是在相同的位置,用空格分隔。措辞可能被视为敏感,因此用香草词代替。如果interest1 是一个国家保险号码,而interest2 是一个状态,那么剩下的就是个人数据,这样就清楚了吗?
-
@Household:请不要评论您自己的问题。请通过包含示例代码和预期输出来更新您的问题。