【问题标题】:Import TSV data into Neo4j using import tool使用导入工具将 TSV 数据导入 Neo4j
【发布时间】:2015-12-17 10:53:40
【问题描述】:

我正在尝试将一个大型数据集导入我的本地 Neo4j 实例。我正在尝试使用导入工具,但到目前为止没有成功。

由于我的数据量大,我不能使用 Cypher 或“LOAD CSV WITH HEADERS”方法(我的数据也没有标题)。

我正在尝试使用带有以下语句的导入工具:

neo4jimport --into C:\...\my_database --nodes    C:\...\Authors_header.csv,C:\...\Authors.csv --stacktrace --delimeter TAB

我的文件是 .CSV 文件,但值是 TAB 分隔的。我的头文件格式为:

authorID    author_name

我的主文件(示例中的虚拟文件)如下所示:

1   Banana
2   Apple   
3   Pear
4   Potato
5   Tomato 

我尝试了使用逗号和分号的虚拟文件,该方法工作正常,但使用 TAB 两个属性合并为一个,因此导入后我的节点只有一个名为:

authorID author_name 

由于文件的大小,我不能只用逗号替换 TABS。我尝试将分隔符更改为 '\t' 和其他组合,但没有成功。

我还想知道是否可以在创建每个节点时为其添加一个静态标签,即使该标签不是从数据文件中读取的。

我正在考虑使用不同的方法,使用 Python 和 py2neo,如果导入工具无法拉取它。

我在普通便携式机器上使用 Neo4j 2.2.3 社区版。

任何帮助将不胜感激。

【问题讨论】:

    标签: neo4j graph-databases py2neo tsv data-import


    【解决方案1】:

    你打错了:不是delimeter,而是delimiter,见neo4jimport --help

    更新到 2.2.5 以获得具有最高性能的最新版本。

    你的标题应该是:

    authorID:ID author_name

    您还应该提供--id-type integer

    您可以在命令行上为所有节点提供标签:--nodes:Author

    【讨论】:

    • 我讨厌这种情况发生(错字),整个下午都在这上面。感谢您的快速回复 - 就像一个魅力。
    • 我们可以为LOAD CSV 命令使用不同的分隔符吗?更新:似乎是的,我们可以stackoverflow.com/q/23701507/3209523
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2015-04-10
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2016-04-20
    • 1970-01-01
    相关资源
    最近更新 更多