【发布时间】:2018-07-18 06:24:39
【问题描述】:
有没有一种方法可以读取 Excel 表中的所有可用数值并找到最大/最大值?
从 50 x 50 的数据集中,我试图找到最大数据点。所以基本上,一个可以分析整个excel文件的函数,不管列和行。
我写了一个函数来找到每列的最大值,然后再次找到它们之间的最大值。
但我正在寻找一种更有效的方法。我将使用非常大的文件。
谢谢
【问题讨论】:
-
df.max().max()?
有没有一种方法可以读取 Excel 表中的所有可用数值并找到最大/最大值?
从 50 x 50 的数据集中,我试图找到最大数据点。所以基本上,一个可以分析整个excel文件的函数,不管列和行。
我写了一个函数来找到每列的最大值,然后再次找到它们之间的最大值。
但我正在寻找一种更有效的方法。我将使用非常大的文件。
谢谢
【问题讨论】:
df.max().max() ?
pd.read_csv('.../data.csv').select_dtypes(include=[np.number]).max().max()
返回整个数据框的最大数值。
【讨论】:
以下将起作用。检查 cmets 以获取更多详细信息。 Pandas 是一个很好的库来处理这个问题。
import pandas as pd
# file_path should be the full path of wherever your csv file is located
# this loads the csv into a pandas data frame
# a convenient table-like data structure
df = pd.read_csv(file_path)
# get the max values in every column
column_maxes_series = df.max()
# get the max value of the Series
overall_max = column_maxes_series.max()
检查您的数据以确保它是所有数字。它将使用字符串进行处理,但是对于您正在执行的任何分析都可能会很奇怪。此外,显然 pd.read_csv() 仅适用于 csv 文件。
【讨论】: