分析频谱特征的大范围时空框架
 

 
摘要
 
        如果在缺少先验知识的情况下想了解频谱特性,需要在频率、空间和时间域中获得精确的频谱数据; 采集这样一组不同维度的测量数据会产生巨大的数据量。 并且,分析这样庞大的数据集是一项挑战,在现实中,与频谱相关的应用需要定制特别的方法,并且往往很难处理如此规模的数据。
 
        在本文中,我们设计了BigSpec(大序列),一种能够快速处理应用的通用框架。
 
  • 该模型的关键思想是通过计算保留了信号特征的压缩数据,来降低计算成本。 
  • 根据这一思想,我们为三个应用构建了解决方案,即能量检测、时空频谱估计和异常检测。
  • 选择这些应用是为了突出BigSpec的效率、可测量性和可扩展性。 为了评估 BigSpec的性能,我们收集了超过1兆字节的频谱数据,跨越300MHz-4GHz,覆盖400平方公里。
  • 与对照和先前的工作相比,我们实现了17倍运行时间效率,亚线性而不是线性运行时间可伸缩性,并将异常的定义扩展到不同的域(频率和时空)。
 
  • 我们还从数据中获得高水平的预见,可以为未来的频谱测量和数据分析提供有价值的建议。
 
论文分类: 信息系统;时空系统;数据分析;网络测量。
 
关键词: 频谱测量;时空数据分析;
 

 
1 介绍
 
       联邦通信委员会(FCC)认为,频谱几乎很快就不足以满足移动宽带服务[9]日益增长的需求。 因此,更加深入理解频谱特征是一项迫切的需求。 先前的工作目标主要是了解频谱利用率,主要涉及大型纵向(时间)研究[6,7,40,53,57]或在特定(空间)环境[14,39,46,59,61]进行测量。这些努力忽略了分析跨越空间和时间域的频谱特性。 然而,了解大范围的频谱特征;例如,跨越一个城市或国家以及在长时间内多个月或几年是至关重要的。 例如,当局希望查明哪些频带在大面积长期无活跃信号,并考虑为二次用户开放这些频带。
 
        我们通过在公共汽车上安装频谱分析仪来填补这一关键空白,并让公共汽车在城市中行驶一年收集数据。 与固定频谱分析仪相比,例如 微软频谱天文台(MSO)[6],移动性不会带来额外的金钱成本,但是覆盖了更多的位置,它们的频谱特性可以大大不同。 因此,我们的方法在成本和空间覆盖之间实现了更好的权衡。
 
        然而,分析由此产生的数据更具挑战性。 现在的商用频谱分析仪可以在几秒钟内完成以kHz分辨率对100MHz带宽的扫描,并记录;用于记录空间和时间变化的传感器可以在覆盖城市区域或更大的许多地点连续产生测量数据几个月。 因此,收集的数据量往往按TB计算甚至更多。 与此对比,先前的频谱数据分析方法[14,39,58,61]经常在记录信道级别信息( channel level information?)的大概1gb或者更少的数据集上操作。因此,它们不适合在这样大小的数据上操作,例如,它们在TB尺度的高维数据上效率低下或难以扩展。
 
  • 以往的模型处理的数据量,和当前模型的数据量往往不是一个等级的;
 
       基于MSO[50,66]的两个项目试图从大量频谱数据中推断出高层次的insights。SpecInsight[50]分析每个波段的信号模式,TX Miner[66]识别活动信号的发射机。 虽然,这些系统通过递归地聚合来自频谱数据的小片段的观测结果,产生了准确的结果,但它们往往是根据特定的任务定制的,因为,它们并不总是设计成可扩展的。
 
  • 50,56  虽然也是处理大量数据,但是它们是根据特定任务生成的,不可以扩展。
 
       为了解决这些限制,我们的目标是设计一个通用的频谱数据分析框架,通过该框架,用户可以有效地启用各种应用来做自己想要的频谱相关查询,即使用户可能不太熟悉复杂的大数据分析。  BigSpec通过 分布式数据存储之间的交互、可升级的引擎和可扩展数据管道(由几个模块组成)之间的交互来实现其期望的性能。
 
  • 设计BigSpec背后的关键思想是,除了利用标准的大数据技术外,将原始数据转换为一个维度缩小的空间,该空间保留了应用可以利用的有用信号特征,并在该空间中执行广泛的计算。————压缩数据
 
BigSpec很容易扩展,并可以启用各种与频谱相关的应用,以下为例子:
 
  • 应用1(能量检测):在不同的频谱带中,哪些频率范围通常是活跃的? 在大的时空尺度上的没有活跃信号的波段是次要用户的理想选择。
 
  • 应用2(时空频谱估计): 系统能否在未测量的时间/位置估计频谱活动在有限的传感平台预算下,我们不可能测量每个位置和时间!!!
 
  • 应用3(异常检测):是否有任何明显的违规行为,这些频谱被用来做什么 ? 我们希望查出影响了合法用户的使用的非法频谱使用者,例如,在电视频道 51[2]和军用信道。
 
        在本文中,我们讨论了为这些应用实现的解决方案。 这些应用被专门选择来突出BigSpec的效率、可测量性( scalability)和可扩展性(extensibility)。
 
        为了评估Bigspec的性能,我们收集了一年多的频谱数据,并获得了超过1兆字节的数据,测量跨越宽范围的频谱(300MHz至4GHz),并覆盖了400平方公里的面积。
 
        与对照和先前的工作相比,我们实现了17倍运行时间效率(时间倍数为亚线性而不是线性),并将异常的定义扩展到不同的域(频率和时空)。
 
       我们还从数据中获得了高层次的insights,为未来的频谱测量和数据分析提供了宝贵的建议。 
 
数据和代码可在 https://wings.cs.wisc.edu/projects/获得,以便将来进行扩展和分析。

 
综上,本文的关键技术贡献如下:
 
  • 这是第一项分析长期宽带频谱测量数据与由移动频谱分析仪捕获的大规模空间变化的研究。
 
  • 对于应用1(能量检测),BigSpec提出了第一种可以在大容量频谱数据中快速检测不同频谱带中活跃的频率,而不是逐渐聚集来自单点的观测值的方法。 提出了在压缩数据上工作的有效算法,以检测在时空中长期存在和短期存在的能量。 与对照方法(K-Means)相比,我们在频谱利用率(精确度)方面提供了更细粒度的信息,并在运行时间效率方面有了了17倍的改进(§7.1.2)。
 
  • 对于应用2(时空频谱估计),给定包含时间和地点的频谱带和GPS信息,BigSpec提供了第一种使用神经网络,同时考虑具有原始频率分辨率的空域和时域的频谱估计方法。 它的精度与最先进的方法(Kriging,它只能用于空间或时间)相媲美,但在高维频谱数据(亚线性而不是线性)的运行时间的可测量性方面明显优于Kriging。 此外,在GPS噪声的干扰下,它的鲁棒性GPS噪声更强(§7.1.3)。
 
  • 对于应用3(异常检测),BigSpec是第一个通过扩展App1和App2的分析来检测两种异常-频域异常和时空域异常。来自我们真实世界数据集的示例表明,频域异常有将异常用户与很少使用波段的合法用户区分开来的潜能,而时空域异常有可能检测由于特殊事件而产生的异常使用模式,这对于以前的工作是不可能的(§7.1.4)。
 
        我们通过分析收集的这三个使用BigSpec模型的应用,得出了以下新的见解:
 
  • 观察到的常见的频谱利用模式可能不符合先前的知识。 (§7.2)。
 
  • 大时空尺度下的细粒度(高精度)频谱估计可能很困难;为了提高估计精度,我们需要一个更大的静态和移动宽带传感设备传感平台。 (§7.2.2)。
 
  • 异常可能是由零星(使用率低)的合法用户造成的;需要一个成体系的平台,包括精确和细粒度数据库、频谱测量和数据分析,以进行非法用户检测。 (§7.2.3)。
 
 

 
2  动机和挑战
 
        动机:
 
  • 先前工作基于的假设——“频谱的使用有 丰富的先验知识 ”[14,39,46,57,59,61]。 根据监管部门制定的信道分配和一些其他的规则,对于 给定信道, 可以简略地记录信道的总功率和,并对其利用模式进行简单的假设。
 
  • 例如,通常假设在预定义的距离内,两个位置具有相似的信道利用率模式。此外 ,先前工作所需的测量是按几G或更少的数据进行的——一个相对较小的数据集。
 
  • 本文的不同——然而,我们不能保证每个频谱用户都遵守这些规则。 因此,所收集的测量结果可能与任何先前的假设不一致。 此外,所作的假设并不普遍适用。例如,在预定距离内的两个位置实际上可能由于路径丢失或建筑物遮挡而不能保持类似的信道利用模式。因此,在我们的操作生态系统中,我们基于关于如何使用频谱的先验知识很少的假设。
 
                                  A Framework for Analyzing Spectrum Characteristics in Large Spatio-temporal Scales(part1)
              
数据收集:
 
        为了弥补上述限制,我们生态系统中的频谱测量记录了一个非常宽的波段,具有高分辨率,并涵盖了时间和空间变化。 类似于V-Scope[61],我们在一个公共汽车部署了一个商业频谱分析仪, 来自 ThinkRF的 WSA4000(频谱分析仪)[11],穿梭在中等规模的美国城市。
 
  • 频谱每100MHz的测量定义为单个测量,从300MHz到4GHz,总共37个100MHz频段,每次全频谱测量,定义为单个扫描。 单次测量需要3秒,单次扫描需要2分钟。对于单次测量,我们用26215( frequency bins)记录功率谱密度(PSD)数据。
 

电子工程术语定义: Frequency-Bin

  • 定义

     

    频谱(FFT)图中频率轴的频率间隔或分辨率,通常取决于采样速率和数据记录的数量(采样点)。功率谱中的频率点或线为NRECORD/2,其中NRECORD是信号在时域的采样点数。

     

    功率谱中的第一个频点始终为直流(频率 = 0),最后一个频点为fSAMPLE/2 - fSAMPLE/NRECORD。频点采用相等的间隔fSAMPLE/NRECORD,通常用频率窗口或FFT窗口表示。窗口(Bin)可以由数据转换器的采样周期计算:

    Bin = f SAMPLE /N RECORD  = 1/(N RECORD  x Δt SAMPLE )

    例如:我们可以作用82MHz的采样频率,取得8192个数据记录,频率间隔为10kHz。

 
  • 我们还使用GPS模块记录每次测量的时间和位置信息。 由于公共汽车定期改变路线,城市很大一部分室外城市道路被我们覆盖。 图一说明了每个测量的位置,每个点在地图上表示 单个测量,我们可以看到两个位置之间的空间距离可以任意小,以保持相似的信道利用模式。 我们部署了一年多的频谱分析仪,表1总结了我们在本文中收集和使用的数据集。
  •                                                                       A Framework for Analyzing Spectrum Characteristics in Large Spatio-temporal Scales(part1)
 
          ID
         单次测量的次数
           时间长度
      原始数据大小
   数据集1
                 50k
              10个月
            1.1tb
   数据集2
                 20k
              4个月
            470gb
                                                                                                                                                         表1:本文使用的数据集摘要
 
  • 与常规检测相比,例如[61]的检测,我们记录了长时间的细粒度宽带测量,而不是短期的信道级别信息( channel level information), 或者对于至少覆盖一个数量级的频谱的特定技术。为了简单起见,我们用每个100MHz频带的起始频率来表示,即以后300MHz-400MHz作为300MHz频段。
 
挑战:
        在大的时空尺度上分析宽带频谱数据有以下挑战。
 
  • 大尺寸的高维数据。 正如人们所看到的,我们收集的频谱数据是高维(?)的(26215)和大尺寸的(TB)。 此属性使以前的方法无法有效地分析数据。
 
  • 时域的间隙性和空域的不均匀性。 虽然我们可以通过增加更多的传感器来获得更密集的数据,但使用移动传感器捕获的测量在时域上总是突发的,在空域上是不均匀的。 在我们的例子中,这是因为测量只有在巴士运行时才被捕获(例如。 几乎没有测量12AM-6AM)和拥挤路线沿线的位置(例如。 市中心地区)被更频繁地覆盖。因此,它需要考虑整个时空域。
 
  • 缺乏先验知识。 对于一些应用来说,很难得到基本的对照结果。 这使得应用监督学习技术具有挑战性,无监督/半监督学习技术更可取。

 
BIGSPEC overview
 
                                                                              A Framework for Analyzing Spectrum Characteristics in Large Spatio-temporal Scales(part1)
        我们的目标是设计一个通用框架,BigSpec,它是高效、可升级的和可扩展的,用于分析大时空尺度下的频谱数据。由于 相对较少的内存和CPU核心,TB级的数据往往难以在单台计算机上进行计算;
 
        先前的工作,电感[40]利用并发运行和标准大数据技术持标准大数据技术的集群技术也可以处理,但仅限于处理来自静态传感器的数据。 Bigspec从类似的体系结构开始,如图2所示。
 
  • 在底层,我们利用分布式和容错的文件系统来存储原始数据。(HDFS)
  • 在中间,我们利用高效和可升级的执行引擎来执行对原始数据的计算。(Spark)
  • 在顶层,用户通过APIs(?)提交代码,并形成一个可扩展和灵活的数据分析管道。(APIs)
 
        然而,数据分析管道设计没有标准,并且数据管道设计的不佳会导致计算缓慢。
 
        我们的数据分析管道设计的关键思想是对原始数据进行降维,将其转换为一个较不复杂的空间,并且保留信号特征,并在该空间中广泛执行计算。例如,如图3所示,为了启用§1中的三个应用,BigSpec的数据分析管道依赖于5个模块:
 
(1)频域奇异值分解(SVD)(§4.1)
  (2)数据压缩(§4.2)
  (3)能量检测(§5.1)
  (4)时空结构学习(&估计)(§5.2)
  (5)异常检测(§5.3)
 
        前两个模块(蓝色)用于预处理以降低维数,其余模块用于在降维空间(黄色块)或同时在降维空间和原始空间(绿色块)中执行APP特定计算。 每个APP的数据分析管道是预处理模块和APP特定模块的组合。
                                  A Framework for Analyzing Spectrum Characteristics in Large Spatio-temporal Scales(part1)
 
 
        我们在§4和§5中详细描述了这些模块,遵循关键思想的新模块总是可以添加到管道中,以有效地支持其他应用程序。 此外,虽然APP特定的模块可以受到传感器是移动的还是静态的影响,但APP预处理模块不受影响。 原因是预处理模块在保持几乎所有有用信息的同时降低了维数,无论传感器是移动的还是静态的,尽管每个降维的含义都可以改变。 
 
  • 而一些模块,例如,数据压缩,支持实时流数据,并可以迁移到传感器,我们在本文中关注的是批处理数据,因为我们想知道在整个时空空间而不是在短时间窗口内,频谱是如何使用的。 然而,我们仍然有一个要求, 由于几乎没有在12AM到6AM之间收集测量,我们希望计算在几个小时内完成,这样就不会建立数据积压。
 
  • 此外,由于在集群中运行计算的金钱成本通常与机器的配置(内存和CPU核)、机器数量和使用时间有关,我们认为利用我们关键想法来降低计算成本是一个很好的方向。
 
 

4 BIGSPEC PREPROCESSING MODULES Bigspec的处理模块
 
         预处理是数据挖掘的关键步骤。 由于我们的频谱数据是高维的,降维作为一种特征提取形式,对于实现快速分析是必不可少的。
 
我们的主要贡献是
 
  • (I)与基于信道分配的压缩和无损压缩相比作比,如何确定应该保留维度的数量,与基于信道分配的压缩和无损压缩相比作比较,在压缩比和信息损失达到良好平衡;
 
  • (ll)如何解释被保留的维度;
 
4.1 频域的特征值分解
 
       我们希望有一个与应用无关的降维技术,以便各种应用程序特定的模块可以利用它的结果。 这需要特征(保留的维度)以某种方式反映数据中的无线信号,以便大多数应用特定模块可以共同利用它们。 
 
  • 在已知的降维方法中,我们发现( truncated singular value decomposition (SVD) )截断奇异值分解唯一地满足了我们的要求。
 
  • 它输出数据变化最大的正交方向,大的变化实际上是由信号强度在不同时间和位置的变化引起的。 因此,这些特征以多种方式描述无线信号,这些信号是经常被感知的。
 
       这可以从图4中观察到,我们将在本节的末尾更详细地解释这些特征的含义。
A Framework for Analyzing Spectrum Characteristics in Large Spatio-temporal Scales(part1)
 
     图4:Bigspec预处理的说明。 PC包含时空上 长存的能量、短存的能量、能量形状变化和多个能量模式之间的能量差异。 每个测量都被压缩为PC上的投影。
 
 
       虽然( truncated SVD)截断SVD是相当标准( fairly standard)的,但据我们所知,BigSpec是第一个将其应用于细粒度测量而不是信道占用[33]的系统,这要归功于允许快速计算的分布式实现。 
 
        注意,基于信道分配计算总功率也是一种降维方法。 然而,它有 缺陷
 
  • (I)它无法区分占用同一信道的不同信号,例如。 电视频道的主要用户和次要用户
  • (Il)必须假设信道分配方案是事先知道的,每个用户都遵循这个方案,但是,假设并不总是正确的。
 

 
  • 截断SVD: Truncated SVD
 
将每个100MHz波段的PSD数据, 作为具有m行和n列的真实矩阵Dm×n,其中m是测量数量,n是 frequency bins数(有数据急提供下载,可以看上面的数据集)。 它的k维截短SVD是
                                      A Framework for Analyzing Spectrum Characteristics in Large Spatio-temporal Scales(part1)
看到 A Framework for Analyzing Spectrum Characteristics in Large Spatio-temporal Scales(part1),假设有前k个左奇异向量,因为它们包含关于频谱使用的信息(?)。 我们将这k个向量称为矩阵Dm×n²的前k个主要成分 PCs。 如果k≪m和n,并且有一个特定应用的算法在这些PCs 或它们对应的投影上工作,可以实现快速计算。
 
 

 
 
  • 如何确定保留的k:
 
        使用截断SVD和一般的降维技术的挑战是如何确定合适的k值。 如果k太小,就会丢失重要的频谱利用信息;如果k很大,则会严重增加计算时间,而不会获得任何额外的有用信息。 我们在这里的贡献是如何确定合适的k,具体如下:
 
  • 第一步:基于 历史的正向估计。
 
考 虑最优k,这里记为k0,作为测量数m的函数k0(m)。 假设直到时间t1时有m个测量数, 最优值k(由下面的步骤2确定)是k0(m1) 。 然后,对于 直到时间t2>t1(包括t1的测量)测量数为m2,在时间t2处,截断SVD的最优维数k保守估计为(k0(m1)·m2)/m1。 由于k0(m)是一个子线性函数(有关更多细节,请参阅第7.1.5节),这种估计是保守的。 当m1为0,m2较小(<1000)时,可以直接设置k=m2 ,计算出完全分解,因为在这种情况下,计算不会消耗太多的时间。
 
  • 第二步:向后估计校正;(在没有测量过的基础上)
 
以找到应该使用的最优维k0(m2)。 虽然在前一步中确定截短的SVD的维数k,但我们那些有意义信息的PCs其数目小于k。我们发现存在一个k0(m2)≥1,使得[(k0(m2)+1),k]的 的主成分(PC) 都非常类似于高斯白噪声,这些pc不含有对我们有用的信息。 图5(a)显示此种PC的例子。
 
A Framework for Analyzing Spectrum Characteristics in Large Spatio-temporal Scales(part1)
  • 为了检查主成分是否是噪声,我们计算了主成分n个元素的 夏皮罗-威尔克检验可信度(Shapiro–Wilk test) [43,48]。 这决定了PC是否可以很好地用高斯分布建模。 一个较高的 显著性检验 (范围为0到1)意味着样本更有可能来自正态分布( 正态分布(Normal distribution),也称“常态分布”,又名 高斯分布 (Gaussian distribution) )。
 
 
 
高斯白噪声(White Gaussian Noise)中的高斯是指 概率分布 是正态函数,而白噪声是指它的二阶矩不相关,一阶矩为常数,是指先后信号在时间上的相关性。高斯白噪声是分析信道加性噪声的理想模型,通信中的主要噪声源—— 热噪声 就属于这类噪声。
 
  • 我们从大到小的顺序计算 检验可信度,即k,k-1,...,2。我们过滤掉前面PC,直到我们找到第一个 显著性检验值小于0.99的主成分。我们选择这个阈值是因为我们观察到PC 的 显著性检验超过此值不包含明显的信号。 图5(b)显示使用我们的数据筛选出的具有最低 检验可信度的pc。 在遇到第一个显著性检验小于阈值的PC后,我们停止计算显著性检验,并保留所有剩余的k0(m2)个PC。 这种后向估计校正为未来的前向估计提供了基础。
 
——计算主成分的检验可信度(确信为高斯分布),以此作为pc是否保留的依据;
 
  • 最先进的SVD相关工作通常使用以下两种方法之一来确定k:(一)做一个完整的SVD,并检查保留多少个维度,以便顶部k个奇异值保留了能量矩阵大于预定义阈值[18],(二)直接使用预先定好的k[33,47]。
  • 与这两种方法相比,我们的方法更适合于有噪声的细粒度光谱测量,因为它只保留了统计上不是噪声的PC。(因为去除了高斯分布极度相关的分量,剩下的更能够描述真正的信号)
 
解释: 
 
从图4中,我们观察到第一PC反映了相应的100MHz频段的平均利用率,因此可以用来检测时空长寿命能量。 对于第二到第k0个主成分,它们通常捕获三个特征:
 
  • (i)如果在100MHz波段没有长寿命能量,则能反映没有显著形状变化或时空短寿命能量的,时空长寿命能量的变化;
  • (ii)时空能量的形态变化;
  • (iii)如果在100MHz频段内存在占用不同频率的多个时空能量模式,PC机也可以捕获多个能量模式之间的能量差异,这对于检测到能量的波段是常见的。
 
 
A Framework for Analyzing Spectrum Characteristics in Large Spatio-temporal Scales(part1)
 
我们提供了我们的方法,以检测显着的时空能量从PC在第5.1节。
 

 
4.2  数据压缩
 
        我们的压缩模块的目的不是只有效地减小频谱数据的大小。 更重要的是,它能够将数据转换为一个不那么复杂的空间,在那里我们可以有效地获得insights。注意,由于测量中的噪声,传统的无损压缩在我们的数据集上不能很好地工作。 此外,可视化和一些应用也需要解压缩,例如,基于重建误差的异常检测。
 
压缩:

 
        在频域SVD和§4.1中描述的步骤之后,对于每个100MHz波段,我们得到了一个矩阵V(n×k0),它由所有保留的主成分(pc)组成。然后,我们可以压缩数据集和减小其维数通过计算 Dm×n(真实数据矩阵)在每个PC上的投影来并减小其维数:
 
                                                        降维计算公式:          A Framework for Analyzing Spectrum Characteristics in Large Spatio-temporal Scales(part1)
 
 
        在理想情况下,保持C(m×k0)和V(n×k0) 的压缩比为mn/((m+n)k0)。然而,我们不能在实践中实现这一点,因为我们需要精确保留每个测量中GPS信息。     
 

解压:
 
        为了解压,我们计算
                                                   A Framework for Analyzing Spectrum Characteristics in Large Spatio-temporal Scales(part1)
        由于压缩是损耗的,D‘m×n仅近似等于Dm×n
 
        事实上,它是Dm×n的最佳秩k0近似。 重建误差Em×n定义为
                                                    A Framework for Analyzing Spectrum Characteristics in Large Spatio-temporal Scales(part1)
 

BIGSPEC APP SPECIFIC MODULES 特别的应用模块
 
        在本节中,我们将介绍我们在§1中提出的三个应用的算法。 虽然算法是特定于应用程序的,但它们遵循相同的关键思想,即。 在降维空间中执行大部分计算。
 
5.1    能源检测
 
       从单频谱测量中检测无线发射机的能量在以往的工作中得到了广泛的研究。 然而,在从大量测量中直接检测能量方面所做的工作很少。 遵循BigSpec的关键思想,我们的技术直接从PCs中推断出了每个100MHz频段的能量存在,并且在运行时效率上显著优于在未压缩空间中工作的算法。 
 
我们将无线发射机的能量分为两类:
 
  • 时空长寿的能量( Long-lived energies :):是那些无论时间或地点的如何变化,其能量都没有变化
  • 时空短命能量( Short-lived energies):是那些可以经常观察到的能量,但不是在每个位置/时间。 请注意,“长寿命”和“短命”不仅仅是指时域,而是指的是时空域。
 

 
长寿命能量
 
       我们首先移除由传感装置引入的任何人工影响,即先执行噪声基准形状( noise floor shape)提取, 在我们基于所有100MHz频段的第一个主成分(PC)检测长寿命能量之前。
 
  • 计算噪声基准
 
        正如我们将在第7.1.2节中所示,这对检测低功率长寿命能量的有源频率范围有很大的影响。 
 
噪声基准形状(noise floor shape)提取的方法总结:
 
 
  • 首先,我们识别了只保留了一个主成分(PC)的100MHz频段(这意味着没有观察到频谱活动),并使用这些100Mhz的第一个主成分组建一个具有n列向量的矩阵。
  • 然后,我们使用SVD计算该矩阵的第一个主成分(PC),类似于§4.1中的方法( 截断SVD),以获得传感设备的基准噪声。
  • 最终通过从所有100MHz频段中的第一个主成分(PC)中减去它的投影来消除它对每个100MHz频段的影响。(因为这个噪声是长期存在的,使用会在第一主成分中存在,因为第一主成分反映了 Long-lived energies
 
 

 
 
我们现在解释如何获得包含长寿命能量的100MHz波段
 
  • 设v300、v400、...、v3900分别代表噪声基准形状提取后300MHz、400MHz、...、3900MHz的第一主成分。 
  • 集合N为所有仅保留第一主成分(pc)的100MHz频段。(这意味着没有观察到频谱活动 )
  • 集合L为通过算法1得到的所有 具有长寿命能量的100MHz频段。 
 
算法1的根据是,在对具有长寿命能量的100MHz频段进行提取噪声基准形状后的第一主成分(PC)应该与没有观察到频谱活动的100MHz频段的第一主成分(PC)显著不同。 我们使用K-Means算法来捕获差异,并且当在所有100MHz波段的集合中,没有观察到频谱活动的相似性分解时 ,停止增加质心( centroids )的数量。
 
                                       A Framework for Analyzing Spectrum Characteristics in Large Spatio-temporal Scales(part1)

  • 短命能量计算
 
        对于短命能量计算,我们关注的是那些没有检测到长寿命的能量并且保留了多个主成分(PC)的 100MHz频段。 设C(m×k0)=[c1,c2,...,ck0],其中ci表示对Dm×n在第i的主成分上的投影。设ci中的m个元素作为随机变量Ci的m个样本。
 
  • 我们观察到,如果第i个主成分捕获短期能量,则Ci(i>1)与C1之间的相关性相对较强(绝对值不小于0.1,定义为相对较强)。 否则,相关性相对较弱(绝对值小于0.1)。
  • 这是因为捕捉时空能量形状变化的PCs(主成分)的投影,与第一个主成分(PC)的投影只有弱相关。 然而,如果第i个PC捕获短命能量,那么更大的第i个PC投影需要一个更小的第一主成分(PC),以弥补稳定的噪声基准值。
 
  • 这也意味着更强的相关性是负的。
 
        请注意,上述算法只输出包含时空长寿命和短寿命能量模式的PCs。目前,我们只能 手动从PC获得这些模式占用的活跃频率范围。自动获得活跃的频率范围需要进一步的分析,我们将其作为未来的工作;由于缺乏先验知识,很难找到一种适用于各种能量模式的一般方法,例如,窄带或宽带、低功率或高功率等。

相关文章:

  • 2021-06-21
  • 2021-06-03
  • 2021-08-09
  • 2021-04-21
  • 2021-12-22
  • 2021-04-04
  • 2021-12-28
  • 2021-09-24
猜你喜欢
  • 2022-01-08
  • 2021-06-30
  • 2021-11-15
  • 2021-04-25
  • 2022-01-23
  • 2021-09-15
  • 2021-09-17
相关资源
相似解决方案