【发布时间】:2020-12-18 16:10:20
【问题描述】:
下面的代码是扫描文件夹中的所有markdown文件,并在2个单独的列表中收集文件名和修改日期。之后,我将两个列表合并为 Panada 对象。我的想法是在 Pandas 中我可以根据天对数据进行分组,但不幸的是我被困在了这个地方。我不知道如何处理熊猫对象来存档:
这是下面的脚本生成的:
modification date file
datetime
2020-07-26 13:33:37 2020-07-26 13:33:37 File1
2020-07-26 10:15:50 2020-08-03 10:15:50 File2
2020-07-25 22:30:01 2020-08-20 22:30:01 File3
2020-07-25 10:01:02 2020-07-30 10:01:02 File4
2020-07-25 10:34:53 2020-08-19 10:34:53 File5
这就是我想要得到的
(同一天的文件在相同的“标题”下,并为每一行插入带有时间的文件列表。所有(日期和时间)从晚到最后排序。
## 26.7 (Sunday)
13:33 | File1
10:15 | File2
## 25.7 (Saturday)
22:30 | File3
10:34 | File5
10:01 | File4
当前代码(直到熊猫对象)
import pandas as pd
from datetime import datetime as dt
from pathlib import Path
from dateutil import parser
File_vault = "any folder path"
File_ext = "*.md"
List_names = []
List_dates = []
# RECURSIVE UNSORTED LOOP OF MARKDOWN FILES
for file in Path(File_vault).rglob(File_ext):
file_stamp = os.path.getctime(file)
# FILL LISTS WITH DATA
List_names.append((file.name).replace(File_ext,""))
List_dates.append(parser.parse(time.ctime(file_stamp)))
# CONVERT TO PANDA OBJECT
df = pd.DataFrame()
df['datetime'] = List_dates
df.index = df['datetime']
df['file'] = List_names
df.head()
谁能帮忙?
【问题讨论】:
标签: python pandas markdown pandas-groupby