【问题标题】:How to see actual memory used by variables in MATLAB?如何查看 MATLAB 中变量使用的实际内存?
【发布时间】:2018-10-08 23:24:54
【问题描述】:

我想知道在尝试使用 MATLAB 的写时复制(延迟复制)机制来链接来自单元格数组中多个单元格的相同大矩阵时,是否有办法查看我是否做对了.

例如:

img = randn(500);
[dx,dy] = gradient(img);
S = cell(2,2);
S{1,1} = dx.^2;
S{2,2} = dy.^2;
S{1,2} = dx.*dy;
S{2,1} = S{1,2};  % should be a reference, as long as not modified

但是看看whos的输出:

>> whos
  Name        Size               Bytes  Class     Attributes

  S           2x2              8000448  cell                
  dx        500x500            2000000  double              
  dy        500x500            2000000  double              
  img       500x500            2000000  double              

我希望S 占用 6 MB,而不是 8 MB。

有没有办法验证程序中没有错误,并且这两个单元格最后仍然引用同一个数组?

我知道函数memory,但遗憾的是它只适用于 Windows 平台(我在 MacOS 上)。

【问题讨论】:

  • 推测:由于cell没有分配任何内存,分配强制分配并在进程中创建一个新数组。
  • 作为memory 的替代品,您可以使用top,但两者都不能准确显示实际内存使用情况。相反,使用一些 undocumented mex 函数可以创建访问者,可能是分层的 mxArray s,并检查每个元素的共享状态和相关元素的 get size
  • @TroyHaskin:是的,创建了一个数组,但它的数据指针指向另一个数组的数据。他们共享数据。
  • @rahnema1:这是一个解决方案,是的。感谢您的想法!
  • 一个简单的解决方案是,如果函数 feature('MemStats') 对您有用,但它不适用于在 Mac 上使用 Matlab 2018a 的我。 undocumentedmatlab.com/blog/undocumented-feature-function

标签: matlab memory


【解决方案1】:

验证两个特定数组是否实际共享数据的一种可能解决方案是使用以下从 Yair's Undocumented MATLAB Blog 修改的 MEX 文件:

#include "mex.h"
#include <cstdint>
void mexFunction( int /*nlhs*/, mxArray* plhs[], int nrhs, mxArray const* prhs[]) {
   if (nrhs < 1) mexErrMsgTxt("One input required.");
   plhs[0] = mxCreateNumericMatrix(1, 1, mxUINT64_CLASS, mxREAL);
   std::uint64_t* out = static_cast<std::uint64_t*>(mxGetData(plhs[0]));
   out[0] = reinterpret_cast<std::uint64_t>(mxGetData(prhs[0]));
}

将其保存为 getaddr.cpp 并使用编译

mex getaddr.cpp

允许以下测试:

img = randn(500);
[dx,dy] = gradient(img);
S = cell(2,2);
S{1,1} = dx.^2;
S{2,2} = dy.^2;
S{1,2} = dx.*dy;
S{2,1} = S{1,2};  % should be a reference, as long as not modified

assert(getaddr(S{1,2}) == getaddr(S{2,1}))

这与获取结构 S 实际使用的内存的摘要不同(我仍然认为这很有用),但它确实允许验证内存是否共享。

【讨论】:

  • 我在尝试编译7:46: error: cast from 'void*' to 'long unsigned int' loses precision [-fpermissive]时收到此错误
  • 可以用mex CXXFLAGS='$CXXFLAGS -fpermissive' getaddr.cpp编译
  • @Gelliant:啊,对,那个演员应该是unsigned long long(或者更好的std::size_t。这是我从网上复制代码得到的... :) -- 谢谢抬头!
【解决方案2】:

编辑:

在编辑答案之前,我使用了一个未记录的函数,该函数具有意外行为,并且其签名在不同版本的 MATLAB 之间不稳定,因此在这里我提供了@CrisLuengo 答案的扩展版本。

我们可以使用哈希映射将数据元素的唯一地址及其关联的mxArrays 存储在递归函数check_shared 中,并获取数据的大小。请注意,这里我们可以检查单元格中的共享状态,我们不能检查单元格外部且与单元格元素具有相同地址的元素。*

#include "mex.h"
#include <unordered_map>
typedef std::unordered_map<void *,const mxArray *> TableType;

TableType check_shared(const mxArray* arr, TableType table = TableType())
{
    switch (mxGetClassID(arr)) {
        case mxCELL_CLASS:
            for(int i = 0; i < mxGetNumberOfElements (arr); i++) {
                table  = check_shared(mxGetCell (arr,i), std::move(table));
            }
            break;
        case mxSTRUCT_CLASS:
            for (int i = 0; i < mxGetNumberOfFields (arr); i++) {
                for (int j = 0; j < mxGetNumberOfElements (arr); j++) {
                    table = check_shared(mxGetFieldByNumber (arr, j, i), std::move(table));
                }
            }
            break;
        case mxVOID_CLASS:
        case mxFUNCTION_CLASS:
        case mxUNKNOWN_CLASS:
            return table;
    }
    if (!mxIsEmpty (arr)) {
        void* data = mxGetData(arr);
        table[data] = arr;
    }
    return table;
}
uint64_t actual_size(const TableType& table)
{
    uint64_t sz = 0;
    for (const auto& entry : table) {
        const mxArray * arr = entry.second;
        sz += mxGetElementSize (arr) * mxGetNumberOfElements (arr);
    }
    return sz;
}

void mexFunction(int nlhs, mxArray *plhs[],
                 int nrhs, const mxArray *prhs[])
{
    TableType table = check_shared(prhs[0]);
    plhs[0] = mxCreateNumericMatrix(1,1, mxUINT64_CLASS, mxREAL );
    uint64_t* result = static_cast<uint64_t*>(mxGetData (plhs[0]));
    result[0] = actual_size(table);
}

(*) 支持cellstruct 和数值数组等基本数据类型。对于未知的数据结构和 classdef 对象,该函数返回零。

【讨论】:

  • 给我错误undefined reference to 'mxGetReferenceCount(mxArray_tag const*)' collect2.exe: error: ld returned 1 exit status我使用MinGW64编译器(c++)
  • Gelliant 和 @CrisLuengo 。答案已更新。请测试一下。
  • Creating library check_shared.lib and object check_shared.exp check_shared.obj : error LNK2019: unresolved external symbol "int __cdecl matrix::detail::noninlined::mx_array_api::mxGetReferenceCount(struct mxArray_tag const *)"
  • @Gelliant 您可以使用dependency walker 并打开libmx.dll 并搜索mxGetReferenceCount。如果找不到,可能是您的 MATLAB 版本不支持该功能。如果您发现类似 _ZN6matrix6detail10noninlined12mx_array_api19mxGetReferenceCountEPK11mxArray 的内容,则该函数将放置在嵌套命名空间中,如答案所述。请试一试,告诉我你发现了什么。
  • @Gelliant:在 R2018a 中,他们删除了 mxCreateSharedDataCopy 函数(请参阅 mathworks.com/matlabcentral/answers/…)。 mxGetReferenceCount 很可能也已被删除。此代码使用 R2017a 为我编译。
【解决方案3】:

“有没有办法验证程序没有错误,并且这两个单元格最后仍然引用同一个数组?”

我会尝试衡量需要多少时间。由于复制指针比复制数据更快,因此它的缩放比例应该不同。

这显示了区别:

i=500:500:5000;
t=zeros(2,length(i));
for ct=1:length(i)
    img = randn(i(ct));
    [dx,dy] = gradient(img);
    S = cell(2,2);
    S{1,1} = dx.^2;
    S{2,2} = dy.^2;
    S{1,2} = dx.*dy;
    tic;
    S{2,1} = S{1,2};  % should be a reference, as long as not modified
    t(1,ct)=toc;
    tic
    S{2,1} = S{1,2}+1; 
    t(2,ct)=toc;
end
B=(i.^2)*8;
figure(1);clf
subplot(1,2,1);
plot(t(1,:),B,'.')
xlabel('time(s)');ylabel('Bytes');
title(sprintf('reference: no relation'))

subplot(1,2,2);
a=sum(B.*t(2,:))/sum(t(2,:).^2);
plot(t(2,:),B,'.',t(2,:),a*t(2,:))
xlabel('time(s)');ylabel('Bytes');
title(sprintf('datacopy: %.2f GB/s',a/1E9))

所以程序中没有错误。 Matlab 给出了错误的单元格内存使用情况。

mex 文件和内存

所以我读了这篇文章:http://undocumentedmatlab.com/blog/matlabs-internal-memory-representation

在 matlab 2018a 中,我无法复制结果。 printmem 适用于您从 format debug 获得的指针,但 getaddrprintaddr 似乎不再提供相同的指针。

A=1:10
>Structure address = 7d9a3eb0
>m = 1
>n = 10
>pr = 74ed5f20
printaddr(A)
>000000007D894640

将此作为 printaddr:

/* printaddr.cpp */
#include "mex.h"
void mexFunction( int nlhs, mxArray *plhs[], int nrhs, const mxArray *prhs[]) {
   if (nrhs < 1) mexErrMsgTxt("One input required.");
   printf("%p\n", prhs[0]);
}

【讨论】:

  • 这是一个有趣的想法。它可以验证在创建时没有复制(尽管我在这方面信任 MATLAB),但它不会验证在程序结束时两个单元仍然共享数据。不过,仍然值得一票。 :)
  • 你的意思是如果程序有空闲时间它会复制数据,即使没有进行编辑。使用 mex-functions 似乎确实可行。理想情况下,我会说您希望获得指向元胞数组不同元胞的指针。
  • 不,我不认为 MATLAB 会因为有空闲时间而制作副本。但我只是不相信我的用户不会做出改变。 :) -- 实际上,元胞数组(该示例只是一个更复杂对象的代理)将由函数转换,我想验证这些函数是否正确,并且不会两次转换相等的元素.特别是如果我不总是自己编写这些函数。
  • 我明白了。昨天晚上我在 matlab 2017b 中尝试了 Yair 的脚本。大小似乎从 104 变为 112。此外,内存地址位置通常只有 1。 (ff-ff-ff-ff-ff-ff-ff-ff)
猜你喜欢
  • 2020-04-13
  • 1970-01-01
  • 2023-04-06
  • 1970-01-01
  • 2017-02-11
  • 1970-01-01
  • 1970-01-01
  • 2018-01-25
  • 2023-02-24
相关资源
最近更新 更多