【发布时间】:2020-03-06 12:39:19
【问题描述】:
我有来自较大的dataset 的Pandas DataFrame 和missing dataframes。 web_id 列包含 larger dataframe 中缺少的 ids。
我正在尝试以较大的dataset 中缺少的方式找到一种模式。
例如,以下代码可在您的本地计算机上重现。以下是我目前的数据集示例:
pd.DataFrame({
"web_id": [43291, 43300, 43313, 43316, 43335, 43345, 43346, 43353, 43361, 43373, 43383, 43387, 43416],
"date": "12/17/2019"
})
我相信缺失中存在某种模式。如何找到web_id 的序列以进一步了解较大的dataset 中的数据是如何丢失的?
在此先感谢
【问题讨论】:
-
“我相信缺失中存在某种模式。” 是什么让你这么认为?这不是关于特定编程问题的问题,充其量只是某种谜题。
-
我投票决定将此问题作为离题结束,因为它与特定的编程问题无关。
标签: python pandas dataframe mathematical-optimization missing-data