【问题标题】:Errors during downloading data from Google App Engine using bulkloader使用 bulkloader 从 Google App Engine 下载数据时出错
【发布时间】:2011-03-10 17:53:25
【问题描述】:

我正在尝试使用以下命令从数据存储区下载一些数据 命令:

appcfg.py download_data --config_file=bulkloader.yaml --application=myappname 
                        --kind=mykindname --filename=myappname_mykindname.csv
                        --url=http://myappname.appspot.com/_ah/remote_api 

当我在这种特定类型/表格中没有太多数据时,我可以 一次性下载数据 - 偶尔会遇到 以下错误:

.................................[ERROR   ] [Thread-11]
ExportProgressThread:
Traceback (most recent call last):
  File "C:\Program Files\Google\google_appengine\google\appengine\tools
\bulkload
er.py", line 1448, in run
    self.PerformWork()
  File "C:\Program Files\Google\google_appengine\google\appengine\tools
\bulkload
er.py", line 2216, in PerformWork
    item.key_end)
  File "C:\Program Files\Google\google_appengine\google\appengine\tools
\bulkload
er.py", line 2011, in StoreKeys
    (STATE_READ, unicode(kind), unicode(key_start), unicode(key_end)))
OperationalError: unable to open database file

这是我在服务器日志中看到的:

Traceback (most recent call last):
  File "/base/python_runtime/python_lib/versions/1/google/appengine/
ext/remote_api/handler.py", line 277, in post
    response_data = self.ExecuteRequest(request)
  File "/base/python_runtime/python_lib/versions/1/google/appengine/
ext/remote_api/handler.py", line 308, in ExecuteRequest
    response_data)
  File "/base/python_runtime/python_lib/versions/1/google/appengine/
api/apiproxy_stub_map.py", line 86, in MakeSyncCall
    return stubmap.MakeSyncCall(service, call, request, response)
  File "/base/python_runtime/python_lib/versions/1/google/appengine/
api/apiproxy_stub_map.py", line 286, in MakeSyncCall
    rpc.CheckSuccess()
  File "/base/python_runtime/python_lib/versions/1/google/appengine/
api/apiproxy_rpc.py", line 126, in CheckSuccess
    raise self.exception
ApplicationError: ApplicationError: 4 no matching index found. 

当出现该错误时,我只需重新运行下载和操作 效果会很好。

最近,我注意到随着我同类的规模越来越大, 下载工具经常失败。例如,使用一种 ~3500 个实体我必须运行 5 次命令 - 只有最后一个 成功了。有没有办法解决这个错误?以前,我唯一的 担心我无法在脚本中自动下载,因为 偶尔的失败——现在我害怕我无法得到我的 完全没有数据。

这个问题之前讨论过here 但是帖子很旧,我不确定建议的标志是做什么的- 因此再次发布我的类似查询。


一些额外的细节。 正如here 提到的,我尝试了继续中断下载的建议(在 从 App Engine 下载数据部分)。当我在中断后恢复时,我没有收到任何错误,但下载的行数少于数据存储管理员向我显示的实体计数。这是我收到的消息:

[INFO    ] Have 3220 entities, 3220 previously transferred
[INFO    ] 3220 entities (1003 bytes) transferred in 2.9 seconds

数据存储区管理员告诉我这种特殊类型有大约 4300 个实体。为什么没有下载剩余的实体?

谢谢!

【问题讨论】:

    标签: python google-app-engine bulkloader


    【解决方案1】:

    我将根据我在第一个错误中看到“unicode”这个词这一事实做出一个完全没有受过教育的猜测;我遇到了一个问题,这与我的数据是用户从网络生成的有关。一个用户输入了几个 unicode 字符,然后一大堆东西开始崩溃——可能是我的错——因为我实现了漂亮的 repr 函数和一堆其他的东西。如果可以,请通过实时应用程序中的控制台实用程序快速扫描您的数据,也许(如果它只有 4k 条记录),尝试将所有数据转换为 ascii 字符串以查找任何不符合要求的数据。

    然后,我开始“清理”用户输入(抱歉,我的“公共句柄”字段必须是仅 ascii 播放器!)

    【讨论】:

    • 您好,感谢您的回复。我目前正在使用在页面中显示报告的处理程序进行管理,并从那里保存它。我知道这很可悲,但是...... :) 给我几天时间来试试你的建议——我目前正在其他地方工作。会告诉你这件事的进展的。再次感谢!
    猜你喜欢
    • 1970-01-01
    • 2014-03-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-02-22
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多