【发布时间】:2015-12-17 10:53:40
【问题描述】:
我正在尝试将一个大型数据集导入我的本地 Neo4j 实例。我正在尝试使用导入工具,但到目前为止没有成功。
由于我的数据量大,我不能使用 Cypher 或“LOAD CSV WITH HEADERS”方法(我的数据也没有标题)。
我正在尝试使用带有以下语句的导入工具:
neo4jimport --into C:\...\my_database --nodes C:\...\Authors_header.csv,C:\...\Authors.csv --stacktrace --delimeter TAB
我的文件是 .CSV 文件,但值是 TAB 分隔的。我的头文件格式为:
authorID author_name
我的主文件(示例中的虚拟文件)如下所示:
1 Banana
2 Apple
3 Pear
4 Potato
5 Tomato
我尝试了使用逗号和分号的虚拟文件,该方法工作正常,但使用 TAB 两个属性合并为一个,因此导入后我的节点只有一个名为:
authorID author_name
由于文件的大小,我不能只用逗号替换 TABS。我尝试将分隔符更改为 '\t' 和其他组合,但没有成功。
我还想知道是否可以在创建每个节点时为其添加一个静态标签,即使该标签不是从数据文件中读取的。
我正在考虑使用不同的方法,使用 Python 和 py2neo,如果导入工具无法拉取它。
我在普通便携式机器上使用 Neo4j 2.2.3 社区版。
任何帮助将不胜感激。
【问题讨论】:
标签: neo4j graph-databases py2neo tsv data-import