【问题标题】:How to read from a file that is on github (with python)?如何读取 github 上的文件(使用 python)?
【发布时间】:2020-01-16 15:29:24
【问题描述】:

我需要从这里读取,例如:https://github.com/Kevinjareczek/CSCI490/blob/master/traininglabels.txt 最好放入一个 numpy 数组,以便能够处理数据。我只想将单个数字存储在一个数组中,以便我可以使用它们。我已经尝试了几次,但也不断得到 \n 字符等。这是我现在正在尝试的,但我只是得到空白字符:

filename =  "https://github.com/Kevinjareczek/CSCI490/blob/master/traininglabels.txt"
r = np.array
r = requests.get(filename)
arr = np.array([c for c in r.text])
print(arr[5])

我还需要在二维 numpy 数组中执行此操作,但要使用字符(来自这里:https://raw.githubusercontent.com/Kevinjareczek/CSCI490/master/trainingimages)。我对 python 完全陌生,只是为了我的计算机视觉课程而被投入其中,所以任何帮助都将不胜感激。我在很大程度上了解 numpy 数组/切片/操作是如何工作的,但我不太确定如何获取我需要的这些数据。

【问题讨论】:

  • 对于python中的调试,通常使用大量的打印语句。我自己经常这样做,以确保我的变量包含我认为它们应该包含的内容。对于这个任务,您可以尝试首先使用str.split()r.text 转换为python 列表,然后将列表转换为numpy 数组。您可能还必须使用numpy.reshape 来获取您想要的二维数组。

标签: python file numpy github request


【解决方案1】:
filename = "https://raw.githubusercontent.com/Kevinjareczek/CSCI490/master/traininglabels.txt"
r = requests.get(filename)
arr = np.array([c.strip() for c in r.text.splitlines()])
print(arr[5])

.strip() 将删除任何空白字符——包括空格以及制表符和换行符之类的东西。在这种情况下只是空格,因为我们已经在使用.splitlines()

【讨论】:

    猜你喜欢
    • 2019-08-09
    • 2015-10-23
    • 2021-04-17
    • 1970-01-01
    • 2020-07-17
    • 2017-08-17
    • 2010-12-08
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多