【发布时间】:2014-02-18 02:55:42
【问题描述】:
我需要针对整数 ID 和字符串名称存储一个长度约为 1000 的整数数组。这种元组的数量几乎是160000。
我将选择一个数组并计算所有其他数组的均方根偏差 (RMSD),并将 (ID1,ID2,RMSD) 元组存储在另一个表中。
您能建议最好的方法吗?我目前正在将 MySQL 用于同一项目中的其他数据表,但如有必要,我会切换。
【问题讨论】:
-
RMSD 计算是在数据库中完成还是通过外部脚本完成?如果它会在外部发生,并且这是该数组的唯一用途,我想知道将其存储为二进制 blob 是否可行?
-
@LindsayWinkler ,我需要它用于 Web 服务,用户将使用字符串名称请求,我将计算具有请求名称的数组的 RMSD 到所有其他数组,并回复 10-50 个名称最小 RMSD。一旦存储的名称数组值很少更新,新的数组会偶尔添加。
-
会在 SQL 中使用一些内置或用户定义的函数来完成计算吗?或者当时是否会有一些外部逻辑计算 RMSD 值?如果要将数组提取到其他代码中并在那里完成计算,您可以只存储数据库不必理解或操作的二进制数据?
-
@LindsayWinkler,感谢您的建议。我只计算2个数组的RMSD,即sum=0;对于 i=0 到 n-1 总和+=(arr1(i)-arr2(i))^2; RMSD=sqrt(总和);我认为如果这是在 sql 中完成的,计算可能会更快,或者我可能只是检索数组并在服务器脚本中计算 RMSD。再次感谢您的建议。我会试试这个。如果有任何更好的方法可以做到这一点,请指导我。我正在为我的生物信息学研究项目开发一个工具,因此将来可能需要更复杂的计算。因此,在服务器脚本中进行计算可能比在 sql 中更好。