【发布时间】:2018-12-20 17:12:21
【问题描述】:
我正在尝试执行一项人类很容易完成的任务:检测两行中的第一行是否是标题行。以下是示例输入示例:
示例 1:是的
name,age
bob,12
示例 2:是的
first,last
bob,jones
示例 3:否
1,2
8,hi
示例 4:否
bob,jones
tom,smith
我有点不知道从哪里开始进行有根据的猜测。它不一定是完美的(80% 就可以了),但是什么是确定上述情况的好的速记算法呢?我正在考虑的一些事情:
# header is usually always strings (wrong in case 4)
for val in header:
is val.replace(',','').replace('.','').replace('-','').isdigit():
header = False
else:
header = True
【问题讨论】:
-
测试每个值的第一个字符是否是字母就足够了吗?我在想
is_header = all(str(v)[0].isalpha() for v in header) -
@JoeHalliwell 这是个好主意,是的。您是否认为还有其他好的标准来测试某些内容是否也是标题行?
标签: python python-3.x algorithm nlp