【发布时间】:2021-09-26 04:30:18
【问题描述】:
我在他们的主要 git 上关注 xgboost 示例 - https://github.com/dmlc/xgboost/blob/master/demo/guide-python/basic_walkthrough.py#L64
在此示例中,他们正在读取直接放入 dMatrix 的文件 -
dtrain = xgb.DMatrix('../data/agaricus.txt.train')
dtest = xgb.DMatrix('../data/agaricus.txt.test')
我查看了dMatrix 代码,似乎无法简要了解数据的结构 - 就像我们通常在 pandas 中使用 pandas.DataFrame.head() 所做的那样
在 xgboost 文档中提到我们可以将 numpy.ndarray 转换为 xgboost.dMatrix - 我们可以以某种方式将其转换回来 - 从 xgboost.dMatrix 到 numpy.ndarray,或者可能是 pandas dataFrame?我从他们的代码中看不到可能的方法 - 但也许有人知道方法?
或者有没有办法简要地查看xgboost.dMatrix 中的数据是什么样的?
提前致谢, 霍华德
【问题讨论】:
-
可以通过dmatrix2np包实现,代码可以看这里:github.com/aporia-ai/dmatrix2np
标签: python numpy pandas xgboost