基于低秩与全变分的WSN数据采集-CSDN博客

基于低秩和改进的二阶水平全变分的无线传感器网络多时隙数据采集

摘要

减少采集的数据量是降低无线传感器网络功耗最有效的方法。众所周知，压缩数据收集是一种在无线传感器网络中的数据收集方法，但由于在大多数实际应用中需要感知并传输所有数据，因此无法实现稀疏感知。同时，全变分和低秩约束在数据恢复中的有效性已被证明。为了提高无线传感器网络中数据恢复的准确性和降低能量消耗，我们提出了一种多时隙数据采集方案，该方案包含两个方面：结构化随机稀疏采样方法和具有低秩与改进的二阶水平全变分约束的数据恢复算法。通过采用所提采样方法，显著减少了数据感知和传输的数量，从而延长了网络生命周期。我们充分挖掘无线传感器网络数据的时间稳定性和低秩特性，构建了基于时间稳定性的核范数正则化最小化模型。同时，采用交替方向法求解该问题。仿真结果表明，所提采样方法对基于矩阵补全的数据恢复算法具有相应的增强效果。在恢复精度方面，所提方案在网络中不同类型数据上的表现优于现有先进方法。此外，随着压缩比的增加，所提方案仍能精确恢复丢失的数据，其优势愈发明显。

索引词 低秩，改进的二阶水平全变分，多时隙数据收集，无线传感器网络。

一、引言

通过无线传感器网络（WSNs）监测和采集环境参数已广泛应用于农业和环境领域[1]–[3]。传感器节点通常由电池供电，需要长期监测周围环境，因此能耗控制变得极为重要。如何降低传感器节点的能耗以延长网络寿命，已成为无线传感器网络中亟待解决的经典问题之一。

为了解决这一问题，最直接的方法是减少采集的数据量，但这将增加数据恢复的难度。考虑到相邻传感器所采集数据的冗余性和相关性，压缩感知数据收集（CDG）[4]被提出，该方法将压缩感知（CS）[5]理论应用于多时隙无线传感器网络的传感器数据收集。与传统数据采集方法[6],不同，CDG在传输过程中对数据进行压缩，从而降低了通信量和感知开销。然而，CDG无法保证更高的恢复精度。尽管CDG已证明其在降低无线传感器网络能耗以及准确恢复数据方面的有效性[4],[7]–[9],，但为了进一步最小化网络中的数据通信量和可感知开销，数据收集

第9卷，2021年这w ork在知识共享署名4.0许可证下授权。有关更多信息，请参见htt p s://creativecommons.or g /licenses/b y /4.0 / 7921

本文档由funstory.ai的开源PDF翻译库BabelDOCv0.5.10(http://yadt.io)翻译，本仓库正在积极的建设当中，欢迎star和关注。

刘X等：面向无线传感器网络的基于LRMSHTV的多时隙数据收集

基于压缩感知的解决方案需要对原始数据使用最佳的稀疏变换来获取传感器观测数据。因此，不同形式的传感器网络导致变换形式不断变化，严重影响了上述解决方案的适应性[10]。此外，在大多数实际应用中，由于所有数据都需要被感知并传输，CDG无法实现稀疏感知 [4],[7],[8]。

随着矩阵补全（Matrix Completion, MC）[11],的快速发展，一些研究人员发现了传感器数据的低秩特征。他们利用这一特征，同时将矩阵补全理论应用于无线传感器网络 [10],[12]–[14]。根据矩阵补全理论，当采样方法为均匀采样时，低秩矩阵可以被精确重构 [11],[15],[16],，这意味着只需在传感器节点采集部分数据并传输至汇聚节点，从而为无线传感器网络的数据收集提供了一种节能的解决方案。

实现矩阵补全（MC）的条件之一是原始数据经过均匀采样并满足非相干特性[11]。目前，大多数基于矩阵补全的采样模型被设置为伯努利模型，即每个传感器节点独立于其他节点，根据预设概率将读数转发给汇聚节点。在多时隙无线传感器网络中，如果被选中的随机点对应的传感器节点处于休眠状态，由于通信限制，汇聚节点可能无法获取感知数据；而未被选中的传感器节点若处于唤醒状态，也会造成能量浪费。当活跃节点发生变化时，尽管无线传感器网络的拓扑结构可以自适应调整，但拓扑重构过程将消耗大量能量和时间。

Candes et al.已证明均匀采样模型与伯努利模型具有相同的性能[15]。随着采样率的降低，观测矩阵中出现全零行或全零列的概率增加，这对恢复算法提出了巨大挑战。许多基于矩阵补全的采样方法和恢复算法忽略了上述问题，导致能耗不均，从而缩短了网络生命周期。

Y. Chen[17]已证明，以往所有研究施加的联合非相干条件实际上对矩阵补全并非必要。因此，在满足恢复精度的前提下，有必要寻找一种不同于均匀采样的采样策略。

由于矩阵补全（MC）理论可应用于无线传感器网络（WSNs），一些用于求解矩阵补全问题的算法也适用于无线传感器网络。起初，Jie Cheng et al. 提出了高效数据收集方法（EDCA）[12],，该方法利用传感器数据的空间相关性，并应用[18]中的技术来恢复丢失的数据。随后，提出了利用传感器数据的短期稳定性和低秩特性的时空压缩数据收集（STCDG）方法[10] 。STCDG首先删除空列并仅恢复非空列，然后基于时间稳定性使用优化技术填充空列，从而避免了复杂的优化问题。

包含空列。上述方法假设传感器数据矩阵的秩是已知且固定的，这在实际系统中很难满足。因此，He etal. 提出了联合矩阵补全与稀疏约束的数据恢复方法（DRMCSC）[13]。该方法将稀疏性约束与矩阵补全相结合，并采用半二次正则化方法（HQ）[19]来恢复丢失的数据。我们注意到，大多数传感器数据恢复方法都是以矩阵分解的形式求解，因此在数学模型构建和恢复算法优化方面变得非常复杂，且随着数据量增加，恢复效率也会迅速下降 [20]。为了解决这一问题，Liu et al. 提出了基于低秩与短期稳定性的数据恢复方法（DRLRSS）[14]，并应用加速近端梯度（APG）[21]来恢复缺失数据。

研究表明，全变分约束可用于有效恢复传感器数据 [8],[9]。然而，由于使用线性全变分，这些方法可能会产生阶梯效应。为了克服这一问题，Wang et al.提出了一种新方法，该方法融合了低秩性和底层矩阵的平滑先验以处理矩阵补全问题[22]。在此方法中，底层矩阵的低秩特征通过核范数来刻画，而改进的二阶全变分（MSTV）则用于刻画底层矩阵的平滑先验。我们假设无线传感器网络由多个时隙组成，同时监测的环境信息随时间变化缓慢，例如光照、温度和湿度。这种情况通常存在于环境和农业领域。基于这些假设，我们提出了一种多时隙数据收集（MTDC）方案，该方案包含两个方面：结构化随机稀疏采样（SRSS）方法以及具有低秩和改进的二阶水平全变分约束的数据恢复算法（LRMSHTV）。本文的主要贡献总结如下：

我们提出了一种无线传感器网络中的多时隙数据收集方案，该方案包含两个方面：结构化随机稀疏采样方法和基于低秩与改进的二阶水平全变分约束的数据恢复算法。该方案能够准确恢复丢失的数据并降低能耗。
通过分析数据感知实验室和英特尔伯克利实验室获得的数据集，我们得出环境数据具有低秩和时间稳定性的特征。随后，我们充分利用上述特性设计了一种结构化随机稀疏采样方法。该采样方法仅感知、压缩部分数据并将其传输至接收端，从而降低了网络的能量消耗。值得注意的是，该方法可与其他基于矩阵补全的恢复算法结合使用，且其他算法的恢复效果也相应得到提升。
我们构建了一个具有修正二阶水平全变分约束的核范数正则化最小化模型。采用交替方向法（ADM）对模型进行数学推导和优化。
我们对所提的多时隙数据收集方案与STCDG、DRMCSC和DRLRSS进行了全面评估。实验结果表明，所提方案在恢复精度方面优于其他方法。此外，随着压缩比的增加，所提MTDC在恢复精度方面的优势越来越明显。

本文的其余部分安排如下。第2节介绍了基于矩阵补全的数据收集过程。第3节详细阐述了所提的MTDC方案，包括无线传感器网络数据的特征、结构化随机稀疏采样方法以及数据恢复算法。第4节展示了所提方案与最先进的方法在恢复精度方面的仿真结果，并对结果进行了分析。最后，第5节对本文进行了总结。

II. 基于矩阵补全的数据收集

在无线传感器网络中，通过监测环境获得的数据通常可以以矩阵形式表示。我们考虑一个包含一个汇聚节点和N个传感器节点的时变无线传感器网络系统。传感器节点周期性地将传感器数据传输到汇聚节点，每个周期包含T个时隙。因此，每个周期可形成一个矩阵M(M ∈ RN×T)，其中矩阵的行数和列数分别对应于传感器节点ID和时隙编号。

在无线传感器网络中，已开发出许多基于矩阵补全的数据收集方法[10],[14],[20]。对于这些方法，每个传感器节点根据预设的采样率在每个时隙将其感知数据传输至汇聚节点。因此，仅有部分感知数据被传送到汇聚节点。经过T个时隙后，汇聚节点获得一个不完整观测矩阵。通常只有被选中的传感器节点对应的位置提供有效数据，其他位置的数值通常设为零。该采样过程可用线性算子 ϑ(·) 表示：

$$
ϑ(M)= B \quad (1)
$$

其中M ∈ RN×T和B ∈ RN×T分别为原始数据矩阵和观测数据矩阵。

为了清晰和更好地理解，算子 ϑ(·)可以表示为逐元素矩阵产品如下[11]：

$$
ϑ(M)= Q◦ M \quad (2)
$$

其中 ◦表示两个矩阵的哈达玛积。即，B(n,t) = Q(n,t)M(n, t)。Q ∈ RN×T是采样矩阵。Q ∈ RN×T定义如下:

$$
Q(n, t)=
\begin{cases}
1, & \text{if the nth node has effective sensing data at the tth time slot} \
0, & \text{otherwise}
\end{cases}
\quad (3)
$$

目前研究表明，从无线传感器网络收集的数据具有高度的时空相关性[26],[27]。因此，所收集的数据矩阵具有低秩特征。我们将在第三节中对该特征进行详细分析。

矩阵补全理论表明，利用矩阵中的一小部分数据即可精确恢复低秩矩阵[11],[15],[16]。因此，在无线传感器网络中使用矩阵补全可以大幅降低感知和传输成本。[11]证明了对于一个大小为n1 ×n2、秩为r的低秩矩阵，当使用随机正交采样模型获取m个数据，且常数C和c满足:时

$$
m ≥ Cn^{5/4}r \log n, \quad n= \max(n1, n2) \quad (4)
$$

观测矩阵可以以至少 $1 −cn^{-3}$ 的概率被精确恢复。

因此，数据恢复问题可以表示为以下形式:

$$
\begin{cases}
\min_{X∈RN×T} |X|_* \
\text{subject to } ϑ(M)= B
\end{cases}
\quad (5)
$$

其中 $|X|_*$表示奇异值之和，即矩阵XN×T的核范数。XN×T是通过矩阵补全获得的恢复矩阵。

示意图0

图1展示了基于矩阵补全的数据感知和数据恢复的简要过程。圆圈代表传感器节点。在每个时隙中随机选择一些传感器节点唤醒并感知环境数据，这些数据用彩色圆圈表示，然后将它们传输到汇聚节点。经过若干个时隙后，汇聚节点接收到一个不完整的感知（观测）数据矩阵，并根据(5)恢复原始数据。

III. 所提方案

所提方法的方案如图2所示。本节将从三个方面详细阐述所提出的MSDC方案：两个真实无线传感器网络数据集的特征、所提出的结构化随机稀疏采样（SRSS）方法以及所提出的数据恢复优化方法。

示意图1

图2 所提出的MTDC方案。

A. 无线传感器网络数据特征

我们分析了从数据感知实验室[23]和英特尔伯克利研究实验室[24]获得的两个数据集。前者采集自分布在数据感知实验室的40个传感器。为了更好地评估方法的性能，我们选取了第71到550个时隙的数据。同时，有四个传感器节点在480个时间槽内未感知到任何数据。因此，获得了36个传感器节点在480个时间槽内的完整传感器数据。后者来自布置在英特尔伯克利研究实验室的54个传感器。传感器每31秒感知一次环境参数。由于英特尔原始数据存在数据丢失问题，我们选择了一个小但完整的子集作为英特尔数据的基础研究。

1) 低秩特征

在无线传感器网络（WSNs）的应用中，由于传感器节点密集分布，同一时隙内从相邻的不同传感器节点获取的传感器数据具有相似性。此外，由于环境信息变化缓慢，同一传感器节点在连续时间槽内获取的数据也较为稳定。因此，无线传感器网络的数据矩阵包含冗余数据，这进一步说明该矩阵具有低秩特征。首先，我们将无线传感器网络的数据矩阵记为MN×T，其中N和T分别表示传感器节点数量和时间槽数量。例如，对于选定的完整数据感知数据矩阵，N和T分别为36和480。然后，我们采用奇异值分解（SVD）来确定无线传感器网络数据矩阵的低秩特性。一个数据矩阵MN×T可被分解为:

$$
M= UΣV^T \quad U ∈ R^{N×N}, V ∈ R^{T×T}, Σ ∈ R^{N×T} \quad (6)
$$

其中，U =[u1, · · ·, un] 和 V =[v1, · · ·, vt] 为酉矩阵。Σ 是一个对角矩阵，其对角元素 (σ1, σ2, · · ·, σr, 0, · · ·, 0) 按降序排列。当 r << min(N, T) 成立时，理论上矩阵 MN×T 必然是低秩的，但对于大多数实际数据而言，应用此定义并不现实。因此，我们采用低秩近似来判断传感器数据矩阵的低秩性。(7) 式定义了前d个奇异值之和在所有奇异值之和中所占的比例

$$
g(d)= \frac{\sum_{i=1}^{d} σ_i}{\sum_{i=1}^{r} σ_i} \quad (7)
$$

示意图2

图3 前d个奇异值所捕获的分数。

可以得出结论，当g(d)接近于1且d<<r时，矩阵MN×T具有良好的低秩近似。

图3绘制了前d个奇异值之和在所有奇异值之和中所占的比例。从图中可以看出，对于不同的环境参数数据，前5个奇异值之和占总奇异值的81.5%至96.2%。同时，分别满足 5<<54和5<<36。因此，在所有研究场景中，传感器数据矩阵具有良好的低秩近似性。

2) 时空相关性

一方面，根据环境信息缓慢变化的特性，同一传感器节点在时间域上的观测数据具有连续性，进一步表现出时间相关性。另一方面，在同一时隙中，相邻传感器节点感知的数据具有相似的值，或者某个传感器节点的观测数据可以由其相邻传感器节点的观测数据表示，这表明了空间相关性。

为了验证无线传感器网络数据矩阵MN×T的时空相关性，采用了一种改进的二阶全变分范数，其定义为:

$$
|M| {MSTV} = \sum {n=1}^{N} \sum_{t=1}^{T} \left( (R_h^{n,t} M)^2 + (R_v^{n,t} M)^2 \right) \quad (8)
$$

$$
R_h^{n,t} =
\begin{cases}
M_{n,t+1} - 2M_{n,t} + M_{n,t-1}, & 2 ≤ t ≤ T −1 \
M_{n,t−1} - M_{n,t}, & t= T
\end{cases}
\quad (9)
$$

$$
R_v^{n,t} =
\begin{cases}
M_{n+1,t} - M_{n,t}, & n= 1 \
-2M_{n,t} + M_{n−1,t}, & 2 ≤ n ≤ N −1 \
M_{n−1,t} - M_{n,t}, & n= T
\end{cases}
\quad (10)
$$

其中，$R_h^{n,t}$ 和 $R_v^{n,t}$ 分别表示第n个传感器节点在第t个时隙的水平和垂直方向的修正二阶全变分参数

此外，(8) 可以进一步写成矩阵形式为:

$$
|M|_{MSTV} = |M^T R_N|_F^2 + |M R_T|_F^2 \quad (11)
$$

其中RN ∈ RN×N和RT ∈ RT×T分别表示垂直方向和水平方向的修正二阶全变差矩阵。它们的具体表达式为:

$$
R_v =
\begin{bmatrix}
-1 & 1 & 0 & \cdots & 0 & 0 \
1 & -2 & 1 & \cdots & 0 & 0 \
0 & 1 & -2 & \cdots & 0 & 0 \
\vdots & \vdots & \vdots & \ddots & \vdots & \vdots \
0 & 0 & 0 & \cdots & -2 & 1 \
0 & 0 & 0 & \cdots & 1 & -1
\end{bmatrix}
∈ R^{v×v}, v= N \text{ or } T \quad (12)
$$

我们首先在水平和垂直方向上使用了修正的二阶全变差矩阵对原始矩阵MN×T 进行处理，如下所示，然后将处理后的矩阵定义为gapT 和gapN：

$$
gapT(n, t)= \sum_{k=1}^{T} M(n, k)RT(k, t), \quad 1 ≤ n ≤ N, 1 ≤ t ≤ T \quad (13)
$$

$$
gapN(n, t)= \sum_{k=1}^{N} M^T(n, k)RN(k, t), \quad 1 ≤ n ≤ N, 1 ≤ t ≤ T \quad (14)
$$

其中，MT 是M的转置，M(n,k) 表示原始矩阵M 在点 (n,k) 处的读数。

显然，gapN(n,t)越小，对应于点(n,t)的无线传感器网络读数的空间相关性越强。类似地，gapT(n, t)越小，对应于点(n,t)的无线传感器网络读数的时间稳定性越好。为了度量各种传感器数据矩阵的时空相关性，我们需要计算归一化的gapv(v= N or T)，记为1gapv(v= N or T)，使用公式 (15)：

$$
1gapv(n, t)= \frac{|gapv(n, t)|}{\max_{1≤n≤N,1≤t≤T}|gapv(n, t)|}, \quad 1 ≤ n ≤ N, 1 ≤ t ≤ T, v= N \text{ or } T \quad (15)
$$

示意图3

图4. 1gapN 的累积分布函数。

示意图4

图5. 1gapT 的累积分布函数。

总体而言，所研究的所有轨迹均表现出时间稳定性特征。但在空间相关性方面，大多数被研究的轨迹并不具备这一特征。因此，我们决定利用时间稳定性特征来构建核范数正则化最小化模型。

B. 结构化随机稀疏采样(SRSS)方法

目前，大多数基于矩阵补全的采样模型采用伯努利模型，即每个传感器节点根据预设概率独立地决定是否将其读数转发给汇聚节点。对于多时隙无线传感器网络，如果

示意图5

图6. 示例采样矩阵（num为整数）。

对应所选随机点的传感器节点处于休眠状态时，汇聚节点可能由于通信限制而无法获取感知数据；如果未被选中的传感器节点处于唤醒状态，也会造成能量的浪费。

此外，当采样率较低时，伯努利模型在观测矩阵中以较大概率产生全零行或全零列，从而给恢复算法带来巨大挑战。

为了解决该问题，我们提出了SRSS方法。与随机采样方法相比，其采样率随窗口大小而变化。我们将T个时隙划分为多个窗口，每个窗口包含c个时隙和一个传输周期。每个传感器节点在每个窗口内只能进行一次采样和传输，因此整个无线传感器网络的总体采样率为ps = 1/c = 1/s = N/(N ∗ c)c，压缩率为ppc。基于上述定义，我们按时间顺序说明所提出的SRSS方法如下。

每个窗口开始时，所有传感器节点将独立唤醒，设置拓扑结构，并传输上一个窗口获取的数据。该过程也称为传输周期。每个传感器节点的数据包包含数据值x、节点标识n以及

感知时隙的数量t。在传输周期结束后，每个传感器节点在第w个窗口的第一个时隙被赋予一个介于0和1之间的随机数，记为U={unw, 1 ≤n ≤N}。将这些随机数按升序排列，可表示为issorted(U)={issorted(unw) 1 ≤n ≤N}。由于每个窗口包含c个时隙，因此每个时隙预期选中的传感器节点数量为:

$$
num= N ∗ c ∗ ps / c = N ∗ ps \quad (16)
$$

我们将issorted(U)划分为c个子集，每个子集包含 num个元素，且c个子集所包含的元素互不相同，具体表示为:

$$
\begin{cases}
issorted(U) = {issorted(U)_j, 1 ≤ j ≤ c} \
\text{subject to } size(issorted(U)_j) = num
\end{cases}
\quad (17)
$$

因此，每个窗口中j时隙对应的传感器节点被选中以监测环境参数。我们确定每个窗口对应的采样矩阵，然后可以得到完整的采样矩阵Q。为了便于理解，图6展示了一个示例采样矩阵。

值得注意的是，当num不是整数而进行舍入时，不仅会改变采样率，而且无法保证每个传感器节点在每个窗口内只有一个数据采样设置。在极端情况下，某些传感器节点可能不会工作，这使得后续的数据恢复变得困难。为了解决上述问题，我们对小数部分采用“重叠舍入法”来解决该问题。具体而言，随着时间槽的增加， num中的小数部分依次叠加。当叠加值大于或等于1时，我们在下一个时隙选择一个额外的传感器节点，并移除整数部分，依此类推。尽管该方法不能保证每个时隙所选传感器节点的数量绝对一致，但可以确保每个窗口内的每个传感器节点仅采集一次数据。为了更好地理解，我们在图7中展示了另一个满足num不是整数的采样矩阵示例。

示意图6

图7. 示例采样矩阵（num不是整数）。

C. 数据恢复算法

根据无线传感器网络数据矩阵的低秩和时间稳定性，我们提出了一种结合低秩和改进的二阶水平全变分的数据恢复算法变化约束（LRMSHTV）。该数学模型可表示为:

$$
\begin{cases}
\min_{X∈R^{N×T}} |X|_* + \lambda |X R_T|_F^2 \
\text{subject to } B = Q ◦ M
\end{cases}
\quad (18)
$$

其中，$\lambda$是调整参数，$Q$和$M$分别为采样矩阵和原始数据矩阵。

我们使用交替方向法（ADM）求解问题（18）。ADM 已被应用于求解无线传感器网络中的实际问题 [8]。我们首先将问题（18）重写为:

$$
\begin{cases}
\min_{X,Y} |X|_* + \lambda |Y R_T|_F^2 \
\text{subject to } X = Y, B = Q ◦ Y
\end{cases}
\quad (19)
$$

然后将(19)的相应增广拉格朗日函数表示为:

$$
\begin{aligned}
\min `p(X, Y, Z) &= \min_{X,Y,Z} |X|_* + \lambda |Y R_T|_F^2 + \langle Z, X - Y \rangle + \frac{\rho}{2} |X - Y|_F^2 \
&\text{subject to } B = Q ◦ Y
\end{aligned}
\quad (20)
$$

其中，$\rho$ 是惩罚参数，$Z^{N×T}$ 是拉格朗日乘子。根据 ADM，我们将迭代过程描述如下：

1) 固定 $Y_k$ 和 $Z_k$，求解 $X_{k+1}$

$$
\begin{aligned}
X_{k+1} &= \arg \min_X `p(X, Y_k, Z_k) \
&= \arg \min_X |X|_* + \frac{\rho}{2} \left| X - Y_k + \frac{1}{\rho} Z_k \right|_F^2
\end{aligned}
\quad (21)
$$

定理2.1在[28]中证明了SVT算子$D_\delta$对任意 $\delta > 0$ 满足以下条件：

$$
D_\delta(Y) = \arg \min_X \frac{1}{2} |X - Y| F^2 + \delta |X| * \quad (22)
$$

且$D_\delta(Y)$定义如下:

$$
D_\delta(X) := U D_\delta(\Sigma) V^T, \quad D_\delta(\Sigma) = \text{diag}({(\sigma_i - \delta)_+}) \quad (23)
$$

其中$t_+$表示$t$的正数部分，记为$t_+ = \max(0,t)$。换句话说，该算子对$X$的奇异值应用软阈值规则，从而有效地将其减小至零。不难看出，SVT 算子$D_\delta(X)$是 $\delta|X|_*$[29]的近端映射。因此，在第$k+1$次迭代中，我们使用（22）来最小化（21）中的$X$：

$$
X_{k+1} = D_{1/\rho}\left( Y_k - \frac{1}{\rho} Z_k \right) \quad (24)
$$

2) 固定 $X_{k+1}$ 和 $Z_k$，求解 $Y_{k+1}$

$$
\begin{aligned}
Y_{k+1} &= \arg \min_Y `p(X_{k+1}, Y, Z_k) \
&= \arg \min_Y \lambda |Y R_T| F^2 + \langle Z_k, X {k+1} - Y \rangle + \frac{\rho}{2} |X_{k+1} - Y| F^2 \
&= \arg \min_Y \lambda |Y R_T|_F^2 + \frac{\rho}{2} \left| Y - X {k+1} - \frac{1}{\rho} Z_k \right|_F^2 \
&\text{subject to } B = Q ◦ Y
\end{aligned}
\quad (25)
$$

显然，(25) 是一个二次函数问题。我们通过将函数的梯度设为0来求解该问题。因此，(25) 可重写为 (26)：

$$
2\lambda Y R_T R_T^T + \rho I_N Y = \rho \left( X_{k+1} + \frac{1}{\rho} Z_k \right) \quad (26)
$$

其中$I_N$是$N × N$单位矩阵。(25) 是著名的 Sylvester 方程[30]。我们使用 MATLAB 命令 lyap 来求解它:

$$
\hat{Y} = \text{lyap}(2\lambda Y R_T R_T^T, I_N, \rho (X_{k+1} + \frac{1}{\rho} Z_k)) \quad (27)
$$

在获得$\hat{Y}$后，我们可以近似得到(25)的解：

$$
Y_{k+1} = B + \hat{Y} ◦ \tilde{Q} \quad (28)
$$

其中$\tilde{Q}$由式(29)定义：

$$
\tilde{Q}(n, t)=
\begin{cases}
0, & \text{if the nth node has effective sensing data at the tth time slot} \
1, & \text{otherwise}
\end{cases}
\quad (29)
$$

3) 更新 $Z_{k+1}$：

$$
Z_{k+1} = Z_k + \rho(X_{k+1} - Y_{k+1}) \quad (30)
$$

根据上述描述，用于求解由（19）表示的凸优化问题的LRMSHTV恢复算法在算法1中给出。

算法1 LRMSHTV 恢复算法

输入：观测矩阵B，采样矩阵Q
改进的二阶水平全变分矩阵RT
调整参数λ，惩罚参数ρ
最大迭代次数Kmax,
最大容差参数ε

初始化：$X_0 = Y_0 = B$, $Z_0 = 0$，迭代次数$k = 0$
For $k < K_{\text{max}}$
While $|X_{k+1} - X_k|_F / |X_k|_F > \varepsilon$ do
更新$X_{k+1}$，通过求解(24)；
利用（26）更新 $\hat{Y}$;
更新拉格朗日乘子$Y_{k+1}$，使用（27）；
利用（30）更新$Z_{k+1}$；
更新迭代次数$k$：$k = k + 1$。
End while
End for

输出：恢复矩阵 $\hat{X} = X_k$

IV. 实验与分析

仿真在MATLAB平台上进行。我们评估了所提出的 MTDC方案在STCDG、DRMCSC和DRLRSS方法下的恢复性能。在本节中，我们首先介绍实验参数的设置，然后展示仿真结果。

A. 参数设置

我们采用归一化平均绝对误差（NMAE）作为数据恢复的评估标准，定义为:

$$
\text{NMAE} = \frac{\sum_{n,t} | \hat{X} {nt} ◦ \tilde{Q} - M {nt} ◦ \tilde{Q} |}{\sum_{n,t} | M_{nt} ◦ \tilde{Q} |} \quad (31)
$$

由于观测数据是直接获取的，我们只需考虑未采集数据的恢复误差。在许多数据恢复方法中，使用归一化平均绝对误差（NMAE）来评估恢复性能[10],[13],[14],[20]。对于 LRMSHTV算法，Kmax、λ和ρ分别设置为2000、0.1和1.6。同时，我们将ε设置为$10^{-5}$，表示终止条件。

B. 实验结果与分析

在不同的压缩比$pc$和不同采样方法下进行实验，$pc$设置为$pc = 2, 3, …, 15$。每次实验中，分别重复数据采样和恢复丢失数据的过程100次。我们使用平均NMAE来表示实验结果。此外，我们验证了结构化随机稀疏采样方法的通用性，将所提出的SRSS方法与STCDG、DRMCSC、DRLRSS和LRMSHTV结合的方法分别标记为STCDG-S、DRMCSC-S、DRLRSS-S和MTDC。

示意图7

图8. 数据感知实验室温度数据中每种方法的恢复性能。

示意图8

图9. 数据感知实验室湿度数据中每种方法的恢复性能。

图8和图9分别展示了数据感知实验室温湿度数据恢复性能的仿真结果。如图8和图9所示，在相同压缩比下，所提出的恢复算法比其他算法具有更高的恢复精度。当采用随机采样方法时，随着压缩比的增加，四种恢复算法的NMAE值稳定上升，但LRMSHTV算法的优势在不断扩大。当采用SRSS方法时，四种恢复算法的NMAE值也随压缩比增加而上升，但存在一些波动。其原因可能是SRSS方法未严格满足均匀采样，从而导致了这种不稳定性现象。总体而言，该方法仍对这四种数据恢复算法的恢复效果具有一定的增强效果。这也是我们未来需要改进采样方法的地方。

从另一个角度来看，可以得出结论：当四种恢复算法的归一化平均绝对误差值分别达到某一特定值时，SRSS方法在数据感知过程中能够实现比传统随机采样方法更高的压缩比。这进一步说明了所提出的SRSS方法能够降低无线传感器网络的能耗。

示意图9

图10. 各方法对英特尔伯克利研究实验室温度数据的恢复性能。

示意图10

图11. 各方法对英特尔伯克利研究实验室湿度数据的恢复性能。

来自英特尔伯克利研究实验室的温度数据和湿度数据的恢复精度分别显示在图10和图11中。它们表现出与数据感知实验室数据相似的性能。同时，MTDC方案仍然展现出最佳的恢复精度。值得注意的是，对于不同的数据矩阵，MTDC方案始终能够保持较高的恢复精度，而DRMCSC算法和DRLRSS算法则表现出较大差异，这进一步表明所提出的MTDC方案具有较强的稳定性。

V. 结论

我们提出了一种基于矩阵补全（MC）的多时隙无线传感器网络（WSNs）数据收集方案，称为MTDC方案。该方案包含两个方面：结构化随机稀疏采样（SRSS）方法和基于低秩与改进的二阶水平全变分约束的数据恢复算法（LRMSHTV）。通过采用SRSS方法，在每个时间窗口内随机且稀疏地选择传感器节点，同时大部分时间传感器节点处于休眠状态，从而显著降低了功耗并延长了网络生命周期。充分利用WSNs数据的低秩性和时间稳定性特征，我们构建了基于时间稳定性的核范数正则化最小化模型。此外，针对该优化问题，基于ADM描述了LRMSHTV数据恢复算法。仿真结果表明，所提出的采样方法能够增强基于矩阵补全的数据恢复性能。在恢复精度方面，所提出的MTDC该方案在不同类型的网络数据上均优于STCDG、DRMCSC和DRLRSS。此外，随着压缩比的增加，MTDC方案仍能准确恢复丢失的数据，其优势愈发明显。