【发布时间】:2020-06-29 02:40:05
【问题描述】:
我基本上有两个相关的问题。
首先,我在下面有这个数据集。
['Dividingpolynomials', 'Categoricaldataandprobabilities', 'Systemsoflinearequations', 'Scatterplotsandgraphs', 'Dividingpolynomials', 'Dividingpolynomials', 'Dividingpolynomials', 'Categoricaldataandprobabilities', 'Dividingpolynomials', 'Scatterplotsandgraphs', 'Scatterplotsandgraphs', 'Scatterplotsandgraphs', 'Dividingpolynomials', 'Scatterplotsandgraphs', 'Dividingpolynomials', 'Dividingpolynomials', 'Dividingpolynomials', 'Manipulatingpolynomials', 'Dividingpolynomials', 'Scatterplotsandgraphs']
我想知道如何编辑数组以更好地格式化它。
期望的结果就像["Dividing Polynomials", "Categorical Data and Probabilities", "Systems of Linear Equations", "Scatterplots and Graphs", "Manipulating Polynomials"]。
这是在 Python 中,结果也应该是一个数组。
第二个问题要简单得多:
对于不同的部分,我的代码格式化了不同的数据集,它工作正常。
唯一的问题是 And 是大写的,我似乎无法修改它以使其成为小写。
代码写好了,稍微调整一下就好了。
temptopiclist = [re.sub(r"and([A-Z])", r"And\1", element) for element in temptopiclist]
topiclist = [re.sub(r"(\w)([A-Z])", r"\1 \2", element).title() for element in temptopiclist]
print(topiclist, "<br>", "<br>")
需要修复的结果数据集:
['Advanced Algebra', 'Problem Solving And Data Analysis', 'Basic Algebra', 'Problem Solving And Data Analysis', 'Advanced Algebra', 'Advanced Algebra', 'Advanced Algebra', 'Problem Solving And Data Analysis', 'Advanced Algebra', 'Problem Solving And Data Analysis', 'Problem Solving And Data Analysis', 'Problem Solving And Data Analysis', 'Advanced Algebra', 'Problem Solving And Data Analysis', 'Advanced Algebra', 'Advanced Algebra', 'Advanced Algebra', 'Advanced Algebra', 'Advanced Algebra', 'Problem Solving And Data Analysis']
【问题讨论】:
-
对于你的第一个问题:把单词放在一起是微不足道的,把它们分开是很困难的。
-
“我想知道如何编辑数组以更好地格式化它。”告诉您在哪里进行拆分的规则是什么?为什么数据首先看起来像这样?最好从一开始就确保空间存在。
-
“唯一的问题是 And 是大写的,我似乎无法修改它来使 and 小写。”告诉您
And应该是小写的规则是什么?其他应该是小写的吗? -
@KarlKnechtel 我想要 And 小写。仅在我的数据集中并且需要小写
-
text.replace(" And ", " and ")
标签: python string algorithm recursion dynamic-programming