数字语义通信:2021 至今系统性文献调研(公开版)

本报告把旧版摘要列表整体返工为可长期查阅的深度笔记。纳入标准聚焦数字化语义变量:VQ/PQ/RVQ/MSVQ、码本 index、离散 token、semantic bits、数字调制符号、OFDM/UEP/BSC/BER 建模。MDPI 期刊论文按项目规则排除。

核心深读 34 篇 公开版:不含 PDF 链接 本地图页 112 张 IEEE 优先,arXiv 备选

检索策略与饱和判据

  • IEEE Xplore: digital semantic communication, VQ semantic communication, digital JSCC semantic communication, semantic digital modulation, OFDM digital semantic communication, product quantization semantic communication.
  • arXiv: vector quantization semantic communication, token communications, codebook design, channel-aware VQ, VQ-DeepVSC, VQ-DSC-R, MSVQ/CEC-MSVQ.
  • Semantic Scholar: 对 12 组必需关键词检索,并以 VQ-DeepSC、VPQ-SemCom、D2-JSCC、MaskDSC、ESC-MVQ、sDMCM 等为 seed 做 references/citations 扩展。
  • Web search: 精确题名检索补齐 IEEE arnumber、arXiv ID 和未命中候选;MDPI 结果按规则排除。
  • 饱和判据: 新增关键词、引用和被引连续两轮主要产生同一批 VQ/codebook/UEP/BSC/OFDM/token 论文,新增项多为应用变体或未获全文边界项。

必查关键词组已覆盖:digital semantic communication, semantic communication vector quantization, VQ semantic communication, discrete semantic communication, semantic communication codebook, semantic communication quantization, digital JSCC semantic communication, semantic-aware channel coding, index error semantic communication, bit error semantic communication, OFDM digital semantic communication, product quantization semantic communication

核心论文总览

年份完整论文标题任务技术路线传输单位信道处理分类
2023Vector Quantized Semantic Communication System图像重建/传输多尺度 VQ-DeepSCcodebook index / bitstream2. 数字语义特征加传统信道编码
2023Robust Semantic Communications With Masked VQ-VAE Enabled Codebook图像检索/重建与语义噪声鲁棒性masked VQ-VAE codebookcodebook index / selected semantic tokens5. 语义噪声与码本鲁棒性机制
2022Learning Based Joint Coding-Modulation for Digital Semantic Communication SystemsCIFAR-10 图像分类与重建概率式 joint coding-modulationBPSK symbol / bit4. 数字符号与信道联合优化
2023Robust Information Bottleneck for Task-Oriented Communication With Digital Modulation任务导向边缘推理/分类DT-JSCC + robust information bottleneckdiscrete representation / PSK symbol4. 显式建模离散错误并联合优化
2024Joint Coding-Modulation for Digital Semantic Communications via Variational Autoencoder图像语义传输/分类与重建VAE joint coding-modulationconstellation symbol4. 显式建模离散错误并联合优化
2024OFDM-Based Digital Semantic Communication With Importance Awareness图像/任务语义传输,OFDM 资源分配OFDM + semantic importance bit allocationquantized bit / OFDM symbol5. 重要性感知资源分配
2025Digital-SC: Digital Semantic Communication With Adaptive Network Split and Learned Non-Linear Quantizationdevice-edge 协同推理/图像分类learned non-linear quantizationbit sequence / quantized intermediate feature2. 数字特征加传统链路
2025From Analog to Digital: Multi-Order Digital Joint Coding-Modulation for Semantic Communication图像语义传输,多阶数字调制MDJCMdigital constellation symbol4. 显式建模离散错误并联合优化
2025Universal Joint Source-Channel Coding for Modulation-Agnostic Semantic Communication图像/任务语义传输,单模型多调制阶数uJSCC with VQ codebooksVQ index / modulation symbol5. 调制自适应与模型复用
2024D2-JSCC: Digital Deep Joint Source-channel Coding for Semantic Communications图像传输digital deep source-channel codingbitstream2. 数字 bitstream + channel coding
2024Joint Source-Channel Coding for Robust Digital Semantic Communications图像分类/重建BSEC robust JSCCbit / erased bit / soft uncertainty4. 显式建模离散错误并联合优化
2025Joint Source-Channel Coding for Channel-Adaptive Digital Semantic Communications图像分类、重建、检索BSEC + channel-adaptive modulationbit / soft-erasure representation4. 显式建模离散错误并联合优化
2025Blind Training for Channel-Adaptive Digital Semantic Communications图像/视频语义任务的 channel-adaptive 训练框架blind parallel-BSC trainingbit / parallel BSC output4. 显式建模离散错误并联合优化
2025MaskDSC: Resilient Digital Semantic Communication with Masked Transformer and Unequal Error Protection图像/视觉数据传输masked Transformer + UEPtoken bitstream / packet5. masked error concealment + UEP
2025Unequal Error Protection for Digital Semantic Communication with Channel Coding图像传输/语义 bit 保护semantic bit UEPbit5. semantic-aware channel coding / UEP
2025Channel-Aware Vector Quantization for Robust Semantic Communication on Discrete Channels图像语义重建,离散信道CAVQ / channel-aware codebookcodebook index / modulation symbol4. 显式建模离散错误并联合优化
2026VQ-DSC-R: Robust Vector Quantized-Enabled Digital Semantic Communication With OFDM Transmission图像语义传输,OFDM 多径鲁棒Swin + SQC + ANDVQ + CDMSQC index / OFDM symbol4. 显式建模离散错误并联合优化
2025Digital Semantic Communications with Variable Product Quantization for Image Transmission图像传输VPQ-SemComPQ sub-index / bitstream2. PQ 特征加数字链路
2025Fully Learnable Multi-Rate Quantization for Digital Semantic Communication Systems图像传输ConcreteSClearned quantized bits / concrete categorical variables4. 显式建模离散错误并联合优化
2025VQ-SDSC: Vector Quantized Satellite Digital Semantic Communication Framework卫星中继图像语义传输satellite VQ + semantic forwardingVQ index / constellation symbol2. VQ + 卫星数字链路
2025ESC-MVQ: End-to-End Semantic Communication With Multi-Codebook Vector Quantization图像重建multi-codebook VQ + JCAMP/JCAPcodebook index / bit / symbol4. 显式建模离散错误并联合优化
2025A Hierarchical Error Protection Framework for Learnable Residual Vector Quantization in Digital Semantic Communication Systems图像重建ResUME / RVQ + unequal modulationRVQ stage index / modulation symbol4. 显式建模离散错误并联合优化
2025Low-Bitrate High-Quality Digital Semantic Communication Based on RVQGAN语音低码率传输RVQGAN speech semantic codecRVQ code index / low-bitrate token stream5. RVQ token + neural error suppression
2025Generative AI-Based Vector Quantized End-to-End Semantic Communication System for Wireless Image Transmission无线图像传输,人/机感知VQ generative semantic codecVQ index / LDPC-protected bits2. VQ index + LDPC
2025SQ-GAN: Semantic Image Communications Using Masked Vector Quantization语义图像压缩/传输semantic mask + VQ-GANVQ token/index1. 数字语义源编码,弱信道建模
2025Conditional Entropy-Constrained Multi-Stage Vector Quantization for Semantic Communication图像语义传输/重建CEC-MSVQmulti-stage VQ index / entropy-coded bitstream1. VQ 源编码与 rate control
2025Rate-Adaptive Semantic Communication via Multi-Stage Vector Quantization图像语义重建,rate-adaptiveMSVQ-SCmulti-stage codebook index1. MSVQ rate adaptation,弱信道错误
2024VQ-DeepVSC: A Dual-Stage Vector Quantization Framework for Video Semantic Communication视频语义传输dual-stage VQ video SemComframe key index / VQ index5. video VQ + recovery,误码建模中等
2024Activation Map-based Vector Quantization for 360-degree Image Semantic Communication360 度图像语义传输AM-VQVQ index1. VQ 源编码,弱信道建模
2025Vision Transformer-Based Semantic Communications With Importance-Aware Quantization图像分类、多视图分类、目标检测ViT IAQpatch-wise quantized bit sequence4. 显式建模离散错误并联合优化
2025sDMCM—A Semantic Digital Modulation Constellation Mapping Scheme for Semantic Communication语义图像/工业 IoT 图像传输中的调制映射semantic digital constellation mappingquantized semantic bit / modulation symbol5. semantic-aware modulation mapping
2025Less Signals, More Understanding: Channel-Capacity Codebook Design for Digital Task-Oriented Semantic Communication任务导向语义推理channel-capacity codebookcodebook index5. channel-aware codebook design
2025A Theoretically-Grounded Codebook for Digital Semantic Communications数字语义通信码本理论theoretical codebookcodebook index5. 理论 bit-flip / codebook 分析
2025Joint Semantic-Channel Coding and Modulation for Token Communicationstoken/prompt 通信,多模态 Transformer tokentoken JSCC-modulationtoken index / bit / modulation symbol5. token-level JSCC / modulation

横向比较表

年份论文任务量化/数字化方式码本传输单位压缩率/CBR/bit 推导摘要是否考虑信道错误是否联合信源信道优化数据集Baseline主要优点主要局限
2023Vector Quantized Semantic Communication System图像重建/传输CNN 语义编码器产生多尺度 feature map,每个尺度用共享 embedding/codebook 最近邻量化codebook index / bitstream传输开销可写为 $$B_{sem}=\sum_l N_l\lceil\log_2 K_l\rceil$$;若接 LDPC 码率 $$R_c$$ 和 $$M$$ 阶调制,则信道比特/符号数约为 $$B_{tx}=B_{sem}/R_c,\ N...2. 数字语义特征加传统信道编码部分/否Cars196 训练,Kodak 测试;输入按论文实验裁剪和缩放。BPG+LDPC、UNet-DeepJSCC/DeepJSCC、不同 LDPC blocklength 和调制组合。在低 SNR 下相对 BPG+LDPC cliff point 更低,且在部分 SNR 区间接近 DeepJSCC 的 MS-SSIM。码本/向量数配置较固定;对 index error 的端到端鲁棒性分析不足;缺少对 bit-level 重要性或 soft demodulation 的建模。
2023Robust Semantic Communications With Masked VQ-VAE Enabled Codebook图像检索/重建与语义噪声鲁棒性语义编码器输出 feature 后进入 masked VQ-VAEcodebook index / selected semantic tokens若保留 $$N_s$$ 个重要 feature,每个索引来自 $$K$$ 个 codeword,则 $$B_{sem}=N_s\lceil\log_2 K\rceil$$;mask 降低 $$N_s$$,patch size 决定 toke...5. 语义噪声与码本鲁棒性机制部分/否图像检索和重建数据集;文中含 retrieval、reconstruction 与 semantic noise 实验。JPEG/BPG+LDPC、无 masking/无 FIM/普通 VQ-VAE 变体。检索 Recall@1 和重建质量在 semantic noise 与低 SNR 下优于传统压缩+信道编码。semantic noise 与 physical bit error 的边界略模糊;缺少软信息或可学习信道编码。
2022Learning Based Joint Coding-Modulation for Digital Semantic Communication SystemsCIFAR-10 图像分类与重建NN encoder 输出每个 BPSK 符号取值的概率,用随机码/Gumbel 技巧采样离散调制符号,避免硬量化不可导。否/非 VQBPSK symbol / bit固定 code length 为 $$n$$ 时,BPSK 每个符号 1 bit,语义链路开销 $$B_{sem}=n$$;论文 n=1536 时原始 CIFAR-10 RGB 为 $$32\times32\times3\times8=24...4. 数字符号与信道联合优化CIFAR-10,32x32 彩色图像。Analog、8-bit Uniform+BPSK、1-bit NN+BPSK。低 SNR 下 accuracy 和 PSNR 优于 analog、8-bit uniform 与 1-bit NN;高 SNR 时与 analog 接近。仅 BPSK,未覆盖高阶调制和复杂 fading;随机采样训练的方差/稳定性仍是问题。
2023Robust Information Bottleneck for Task-Oriented Communication With Digital Modulation任务导向边缘推理/分类把输入编码成 d 个离散表示,每个表示从 K 个 codeword/符号中采样discrete representation / PSK symbol若编码成 $$d$$ 个离散变量、每个变量 K 类,则语义 payload $$B_{sem}=d\lceil\log_2 K\rceil$$;当 K-PSK 与 K 对齐时每个变量对应一个 channel symbol,符号数约 $$d$...4. 显式建模离散错误并联合优化MNIST、CIFAR-10。DeepJSCC、VFE、其他 task-oriented JSCC 变体。MNIST/CIFAR-10 在训练/测试 SNR 不匹配时更稳,表明冗余不是浪费,而是任务鲁棒性资源。任务集中在分类;图像重建/感知质量不是主线;K-PSK 假设与实际编码调制链路仍有距离。
2024Joint Coding-Modulation for Digital Semantic Communications via Variational Autoencoder图像语义传输/分类与重建用 VAE 学习从源数据到离散 constellation symbols 的 transition probability,避免硬调制不可导。否/非 VQconstellation symbol若每个样本发送 $$n_s$$ 个 M 阶星座符号,则语义 bit 等价量为 $$B_{sem}=n_s\log_2 M$$;论文通过 transmission rate 与 modulation order 给出实验点,具体原图压缩率需按...4. 显式建模离散错误并联合优化CIFAR-10 等图像任务数据集。Analog semantic communication、uniform quantization、learning-based JCM 等。在多 SNR、rate、调制阶数下优于量化式数字 baseline,高阶调制时接近 analog 语义通信。星座学习和实际标准编码调制仍需接口;对复杂多径/OFDM 的处理不足。
2024OFDM-Based Digital Semantic Communication With Importance Awareness图像/任务语义传输,OFDM 资源分配语义 encoder 提取 feature,scalar quantizer 数字化,再映射到 OFDM 子载波否/非 VQquantized bit / OFDM symbol若第 i 个语义 feature 分配 $$b_i$$ bits,则 $$B_{sem}=\sum_i b_i$$;OFDM 资源开销还包括每子载波调制阶数与信道编码。论文把优化变量定义为 subcarrier assignment 与 b...5. 重要性感知资源分配部分/否图像任务数据集;文中对比 analog SemCom 与 conventional bit-based communication。Analog SemCom、传统 bit-based、无重要性感知分配变体。频选信道下比 analog SemCom 和 conventional bit-based 系统更高效。信道错误到语义失真的端到端可微建模不足;依赖重要性估计和 DRL 的泛化能力。
2025Digital-SC: Digital Semantic Communication With Adaptive Network Split and Learned Non-Linear Quantizationdevice-edge 协同推理/图像分类DNN 在设备端切分,设备输出中间语义 featurebit sequence / quantized intermediate feature若切分层输出维度为 $$D_s$$、剪枝后保留 $$D_r$$、每维量化 $$b$$ bits,则 $$B_{sem}=D_r b$$;策略网络实际改变 $$D_r$$ 与 split,使 CBR 随输入和信道约束变化。2. 数字特征加传统链路部分/否CIFAR-10、Mini-ImageNet。无量化/线性量化、固定 split、固定 feature 维度、传统 edge inference baseline。在 CIFAR-10/Mini-ImageNet 上在相近精度下显著降低通信/计算开销。缺少显式 BER/UEP/index error 分析;对复杂无线链路的鲁棒性不如专门 channel-adaptive DSC。
2025From Analog to Digital: Multi-Order Digital Joint Coding-Modulation for Semantic Communication图像语义传输,多阶数字调制在 NTSCC 中加入多阶 modulation/demodulation 模块否/非 VQdigital constellation symbol每个 channel use 承载 $$\log_2 M$$ bits,对 n 个符号 $$B_{sem}=n\log_2 M$$;论文重点比较相同 bandwidth ratio 下多阶调制性能,压缩率由 NTSCC latent 维度和...4. 显式建模离散错误并联合优化图像重建数据集;NTSCC 体系下实验。Analog NTSCC、传统数字压缩+信道编码、固定调制/无替代训练变体。在多阶调制下缩小与 analog SemCom 的差距,并优于直接量化式数字方案。替代训练与实际硬件误差之间仍有 gap;未深入优化 bit-label 与语义重要性的对应关系。
2025Universal Joint Source-Channel Coding for Modulation-Agnostic Semantic Communication图像/任务语义传输,单模型多调制阶数NN encoder/decoder 共享一套主干,VQ codebook 数字化语义 latentVQ index / modulation symbol若每个 latent block 量化为 K 个 codeword,$$B_{sem}=N\lceil\log_2 K\rceil$$;不同调制阶数改变每个 channel use 可承载 bits,因此 $$N_{sym}=B_{sem}...5. 调制自适应与模型复用部分/否图像语义任务数据集;覆盖多 modulation order。调制阶数专用模型、现有数字 SemCom、analog JSCC 变体。相对每阶一个模型的方式节省参数,同时保持或提升任务效果。依赖 SNR boundary 与 BN 统计;极端非平稳信道下可能需要重新校准。
2024D2-JSCC: Digital Deep Joint Source-channel Coding for Semantic Communications图像传输深度 source coder 提取并压缩语义 feature,adaptive density model 估计分布否/非 VQbitstream总 bit budget 分成 source rate $$R_s$$ 和 channel redundancy $$R_c$$;给定总信道资源,优化 $$D(R_s,R_c,SNR)$$。若 source bitstream 长度为 $$...2. 数字 bitstream + channel coding部分/否真实图像数据集;与 JPEG/JPEG2000/BPG、DeepJSCC 对比。DeepJSCC、JPEG/JPEG2000/BPG + channel code。在多个 SNR 上优于经典 separation 和 deep JSCC,尤其显示 source/channel rate 协同的重要性。离散语义变量本身的语义鲁棒性较少;性能依赖 density model 与 channel code 选择。
2024Joint Source-Channel Coding for Robust Digital Semantic Communications图像分类/重建binary-output JSCC encoder 输出 bit,通信链路用不确定性 demodulation 与 BSEC 等效模型训练。否/非 VQbit / erased bit / soft uncertainty若 encoder 输出 B bits,则 $$B_{sem}=B$$;调制阶数 M 时符号数 $$B/\log_2 M$$,BSEC 训练通过 erasure/flip 参数决定有效信息保留。4. 显式建模离散错误并联合优化图像分类与重建数据集。固定环境训练 JSCC、常规 hard demodulation、已有 channel-adaptive JSCC。分类与重建任务在未见 SNR 下更稳。会议版规模较小;调制阶数自适应和功率控制在后续 TCCN/TCOMM 版更完整。
2025Joint Source-Channel Coding for Channel-Adaptive Digital Semantic Communications图像分类、重建、检索binary-output JSCC encoder 输出 latent bits否/非 VQbit / soft-erasure representation开销为 encoder bit 数 $$B$$;推理选择第 j 个 latent 的调制阶数 $$M_j$$,总符号数约 $$\sum_j b_j/\log_2 M_j$$,其中 bit 可靠性由 BSEC 参数和 demodulation...4. 显式建模离散错误并联合优化多种图像任务数据集;覆盖 classification/reconstruction/retrieval。固定 JSCC、传统 demodulation、已有 SNR-adaptive/attention JSCC。在分类、重建、检索上相对固定数字 JSCC 更稳,且降低通信延迟。复杂度来自 robust training 与调制选择;若标准信道译码输出 hard bits,软信息接口需要重新设计。
2025Blind Training for Channel-Adaptive Digital Semantic Communications图像/视频语义任务的 channel-adaptive 训练框架semantic encoder 输出 bits否/非 VQbit / parallel BSC output若有 B 个 semantic bits,$$B_{sem}=B$$;每个 BSC 分支有目标 flip probability $$\mu_i$$。推理时选功率/调制使实际 BER 接近 $$\mu_i$$,符号开销随所选 $$M_i$$...4. 显式建模离散错误并联合优化图像分类/重建等任务数据集。特定信道训练、BSC+VQ、BSC+SQ、BlindSC 等。在多 SNR 下用单模型达到接近/优于多个专用模型的性能,并降低功耗。等效 BSC 忽略 burst error、软译码和相关错误;BER 匹配表需要校准。
2025MaskDSC: Resilient Digital Semantic Communication with Masked Transformer and Unequal Error Protection图像/视觉数据传输视觉 token 以因果顺序建模否/非 VQtoken bitstream / packet总开销由 entropy-coded token bitstream 给出;若 token i 的码长为 $$l_i$$,关键 token 采用更强 channel code 码率 $$R_i$$,则 $$B_{tx}=\sum_i l_i...5. masked error concealment + UEP图像数据集;关注视觉 token 传输。传统 RTC/压缩+信道编码、无 masked Transformer、无 UEP 变体。在动态信道下比传统均等保护更稳,压缩和鲁棒性同时提升。UEP 策略与实际 channel code/packetization 的耦合需要系统级验证;不同语义任务的关键 token 定义可能变化。
2025Unequal Error Protection for Digital Semantic Communication with Channel Coding图像传输/语义 bit 保护先由数字语义 encoder 产生 semantic bits否/非 VQbit源开销 $$B_{sem}=B$$;信道开销由每个 bit/block 的重复次数或 channel code blocklength 决定,$$B_{tx}=\sum_i n_i$$。论文的核心是最小化满足 $$P_{e,i}\le\mu...5. semantic-aware channel coding / UEP图像传输任务数据集。Equal protection channel coding、long-block code、无 UEP 语义 bit baseline。在图像任务中比 equal protection 更短 blocklength 或更高性能。依赖已知/可学习的重要性与目标 BER;与神经 decoder 的联合端到端优化还可更紧。
2025Channel-Aware Vector Quantization for Robust Semantic Communication on Discrete Channels图像语义重建,离散信道语义 feature 先 VQ 离散化,再直接映射到 modulation symbolscodebook index / modulation symbol单码本时 $$B_{sem}=N\lceil\log_2K\rceil$$;若 modulation order 为 M 且 K 不匹配,多子信道分解后总开销为各子码本索引 bits 之和。论文强调有效开销与 constellation o...4. 显式建模离散错误并联合优化图像重建数据集。VQJSCC without CAVQ、state-of-the-art digital SemCom baselines。显著缓解 digital cliff effect,在多调制方案下优于现有数字 SemCom。需要已知或估计信道转移矩阵;复杂非平稳信道下 codebook 可能需要重训/自适应。
2026VQ-DSC-R: Robust Vector Quantized-Enabled Digital Semantic Communication With OFDM Transmission图像语义传输,OFDM 多径鲁棒Swin Transformer 提取层级 featureSQC index / OFDM symbol若层级 feature 产生 $$N$$ 个 SQC indices,码本大小 K,则 $$B_{sem}=N\lceil\log_2K\rceil$$;OFDM 实际开销需除以调制阶数与信道码率,并加 pilot/CSI 开销。论文主要报...4. 显式建模离散错误并联合优化图像重建数据集。VQ-DSC、analog DJSCC、传统 OFDM baseline。在复杂 OFDM 条件下比普通 VQ/analog baseline 更稳。arXiv 版本较新;需要标准链路、导频开销和真实信道测试进一步验证。
2025Digital Semantic Communications with Variable Product Quantization for Image Transmission图像传输语义 feature 被分成多个子向量,用 product quantization 的多个轻量 codebooks 表示否/非 VQPQ sub-index / bitstream若 feature 被分成 m 个子向量、每个子码本大小 K_j,则每个 token 开销 $$\sum_{j=1}^m\lceil\log_2K_j\rceil$$;若保留 N 个 token,则 $$B_{sem}=N\sum_j\lc...2. PQ 特征加数字链路部分/否图像重建数据集。VQ-based digital SemCom、DeepJSCC-Q、Seb/传统方案。相对现有 VQ-based digital SemCom 在 LPIPS 上有明显改善。需要与 CAVQ/UEP 类方法结合,才能完整处理 sub-index bit error。
2025Fully Learnable Multi-Rate Quantization for Digital Semantic Communication Systems图像传输不用大 VQ codebook,而用 temperature-controlled concrete distributions 做可微离散化否/非 VQlearned quantized bits / concrete categorical variables若 mask 后保留 L 个离散变量、每个变量 b bits,则 $$B_{sem}=Lb$$;multi-rate 通过 mask 改变 L,不需要重训。复杂度随 bit length 线性增长,而 VQ 大码本常随 K 指数增长。4. 显式建模离散错误并联合优化ImageNet。VQ-based baselines、固定 rate 量化方法。ImageNet 上在 Rayleigh/Rician 下 SSIM/PSNR 超过 VQ baseline。对标准调制、BER 映射和实际 bitstream packing 的描述仍需更细。
2025VQ-SDSC: Vector Quantized Satellite Digital Semantic Communication Framework卫星中继图像语义传输semantic encoder 输出矩阵 L,训练 codebook E,将 feature 向量映射为 codebook indices,并优化 constellation symbol distribution。VQ index / constellation symbol若 L 含 M 个向量、码本大小 K,则 $$B_{sem}=M\lceil\log_2K\rceil$$;poster 未给完整 K/M 数值表,需从实现或扩展版补齐。2. VQ + 卫星数字链路部分/否图像重建实验。经典 semantic communication schemes。相对经典方案提升卫星 relay 场景下图像重建表现。缺少完整实验表、bit ledger 和 error model 细节。
2025ESC-MVQ: End-to-End Semantic Communication With Multi-Codebook Vector Quantization图像重建一个 encoder-decoder 对,多套 VQ codebooks,每套 codebook 对应不同 bit-flip probability/鲁棒性否/非 VQcodebook index / bit / symbol若有 N 个 sub-vectors、选择第 v 个码本大小 K_v,则 $$B_{sem}=\sum_i\lceil\log_2K_{v_i}\rceil$$;JCAMP 还选择 modulation order 和 power,使实际 ...4. 显式建模离散错误并联合优化CIFAR-100、STL-10 等。BSC+VQ、BSC+SQ、BlindSC、single-codebook ESC-SVQ、Codebook Selection。在 AWGN/Rayleigh 下用单模型超过多种数字 baseline,并验证 measured BER 与目标概率匹配。需要维护多码本和查表;BER 独立假设对 burst/correlated error 仍有限。
2025A Hierarchical Error Protection Framework for Learnable Residual Vector Quantization in Digital Semantic Communication Systems图像重建残差 VQ 多阶段逐层编码 residualRVQ stage index / modulation symbolRVQ(n,k) 每个位置开销为 $$nk$$ bits;若有 N 个位置,则 $$B_{sem}=Nnk$$,CBR 由 $$B_{sem}/(HWC8)$$ 得到。论文直接报告 CBR=0.00391、0.0156、0.0299 等。4. 显式建模离散错误并联合优化图像数据集;PSNR/MS-SSIM 实验。RVQ、RVQ+uniform modulation、continuous reference、loss ablations。在相同 CBR 下 RVQ+UME 提升 PSNR/MS-SSIM,特别是低 SNR。假设错误独立和 stage 重要性单调;真实 channel code/soft decoding 集成仍需扩展。
2025Low-Bitrate High-Quality Digital Semantic Communication Based on RVQGAN语音低码率传输多尺度语义 codec 使用 RVQGAN 抽取语义 token/code indicesRVQ code index / low-bitrate token stream若 RVQ 每帧产生 L 个 codebook indices、每个 codebook K 阶,则帧开销 $$B_f=L\lceil\log_2K\rceil$$;总 bitrate $$R=B_f\times f_{frame}$$。论文...5. RVQ token + neural error suppression部分/否语音数据集;低码率 3 kb/s 实验。传统 speech codec、JSCC、无 CNS/无 code predictor 变体。3 kb/s 下保持较高语音质量并在低 SNR 优于 baseline。需要更透明的 bitstream/packet error 设置;生成式模型可能引入语义 hallucination。
2025Generative AI-Based Vector Quantized End-to-End Semantic Communication System for Wireless Image Transmission无线图像传输,人/机感知encoder 用 spatial attention 提取 latent,经 learned codebook VQ 后只发送 code indexVQ index / LDPC-protected bits若 latent map 尺寸为 h×w 且每位置一个 K 阶 index,$$B_{sem}=hw\lceil\log_2K\rceil$$;LDPC 后 $$B_{tx}=B_{sem}/R_c$$。论文强调相对 BPG/JSCC 的复...2. VQ index + LDPC部分/否图像数据集;同时验证 human perception 和 machine perception task utility。BPG、JSCC、LDPC 组合、无注意力/无对比损失变体。低 SNR 尤其 <5 dB 时优于 BPG,并以更低复杂度/延迟接近 JSCC。VQ index 错误语义跳变未充分建模;生成结果质量可能掩盖细节错误。
2025SQ-GAN: Semantic Image Communications Using Masked Vector Quantization语义图像压缩/传输先用现成 semantic segmentation 得到类别重要性,SAMM 只编码任务相关区域/feature,再用 VQ-GAN codebook 表示。VQ token/index若 mask 后保留 N_m 个 latent positions,每个位置 K 阶 index,则 $$B_{sem}=N_m\lceil\log_2K\rceil$$;mask 直接降低 N_m。论文更关注 source compres...1. 数字语义源编码,弱信道建模部分/否Cityscapes 等语义分割图像数据集。JPEG2000、BPG、deep-learning compression、VQ-GAN 变体。极低码率下优于 BPG/JPEG2000 和深度压缩方法。无线信道、误码、调制和信道编码分析不足。
2025Conditional Entropy-Constrained Multi-Stage Vector Quantization for Semantic Communication图像语义传输/重建多阶段 VQ 逐步量化 residual否/非 VQmulti-stage VQ index / entropy-coded bitstream原始 MSVQ 开销 $$B=\sum_l N_l\log_2K_l$$;加入 conditional entropy coding 后期望码长 $$E[B]=\sum_l H(I_l|I_{<l})$$,低于固定长度索引。multi-ra...1. VQ 源编码与 rate control部分/否CIFAR-10 等。single-stage VQ、MSVQ、ECVQ、现有 VQ-based SC。在 CIFAR-10 等任务上用更低复杂度/码率获得更好语义 fidelity。缺少 noisy channel 下的同步/误码恢复分析。
2025Rate-Adaptive Semantic Communication via Multi-Stage Vector Quantization图像语义重建,rate-adaptive多个 VQ stage 逐级细化 residual,每个 stage 中还有多个可选 VQ modulemulti-stage codebook index固定长度时 $$B_{sem}=\sum_{active}N_l\lceil\log_2K_l\rceil$$;若加入 entropy coding,则用 codeword 概率得到期望码长。论文把 module selection 写成 ...1. MSVQ rate adaptation,弱信道错误部分/否CIFAR-10。single-stage VQ、existing digital semantic communication methods。在 CIFAR-10 上较现有 VQ-based DSC 更高效且 rate 控制更细。误码和 packet loss 下的级联 residual 失真有待研究。
2024VQ-DeepVSC: A Dual-Stage Vector Quantization Framework for Video Semantic Communication视频语义传输第一阶段选取/插值关键帧降低帧间冗余frame key index / VQ index视频开销约为关键帧数 $$T_k$$ 乘每帧 VQ index bits:$$B_{sem}=\sum_{t\in K}N_t\lceil\log_2K\rceil$$;帧间插值降低 $$T_k/T$$,adjustable index s...5. video VQ + recovery,误码建模中等部分/否视频数据集;与 H.265 和 JSCC/DeepWiVe 类方法对比。H.265、JSCC/DeepWiVe、普通关键帧或无二阶段 VQ 变体。低 SNR/多径下 MS-SSIM 和 LPIPS 相比 H.265 有优势。需 IEEE 版本全文补验;arXiv 版对标准 channel coding 与 bit ledger 仍可更细。
2024Activation Map-based Vector Quantization for 360-degree Image Semantic Communication360 度图像语义传输DNN 提取 360 图像语义 featureVQ index若按 activation map 保留/量化 N_a 个 feature index,则 $$B_{sem}=N_a\lceil\log_2K\rceil$$;论文以 same transmission symbols 比较,具体压缩率由...1. VQ 源编码,弱信道建模部分/否360-degree image 数据集。传统 coding、DL-based coding、普通 VQ。相同传输符号数下优于传统和 DL-based coding。需要纳入 BSC/OFDM/UEP 实验才能成为完整 DSC 方案。
2025Vision Transformer-Based Semantic Communications With Importance-Aware Quantization图像分类、多视图分类、目标检测预训练 ViT attention score 衡量 patch 重要性否/非 VQpatch-wise quantized bit sequence论文明确定义总 bit 长度 $$B=P^2C\sum_{i=1}^N M_i$$,另有 $$B_{add}$$ 传输量化器信息;原图 bit 为 $$HWC\times8$$,压缩率可由 $$B+B_{add}$$ 对比得到。4. 显式建模离散错误并联合优化CIFAR-100、多视图图像分类数据集、目标检测数据集。JPEG/BPG、均匀 bit allocation、其他 quantization baselines。在分类、多视图和检测任务中用更少 bit 达到更高任务性能。依赖 ViT attention 作为重要性代理;对生成/重建质量和复杂 channel coding 的扩展有限。
2025sDMCM—A Semantic Digital Modulation Constellation Mapping Scheme for Semantic Communication语义图像/工业 IoT 图像传输中的调制映射不改变上游语义 encoder,而重新设计 semantic information value 的 bit-to-constellation mapping,使重要 bit 位落在更可靠星座位。否/非 VQquantized semantic bit / modulation symbol若语义值量化为 n bits、调制为 m-bit PAM/QAM,则每个符号承载 m bits;传统方式可能需要 $$\lceil n/m\rceil$$ 次传输,sDMCM 在 n<m 时可让一个高阶星座承载多个语义值。论文还给出例子:4...5. semantic-aware modulation mapping部分/否图像语义通信系统 LSCI、工业 IoT STSCI。Gray、Pseudo-Gray、Structural Quadrant (SQ) mapping。相同 MS-SSIM 下可容忍约 3 dB SNR 降低;IIoT 图像中指针/仪表盘更清晰。主要针对标量量化语义值;复杂 learned VQ codebook 的高维语义距离需要进一步定义。
2025Less Signals, More Understanding: Channel-Capacity Codebook Design for Digital Task-Oriented Semantic Communication任务导向语义推理离散 codebook 把语义 feature 空间划为 Voronoi/indicescodebook index固定长度索引开销 $$B_{sem}=N\lceil\log_2K\rceil$$;论文还从信道容量角度讨论 optimal codebook usage。若 code activation entropy 小于 $$\log_2K$$,可...5. channel-aware codebook design部分/否多 SNR 下 inference tasks。常规离散 ToSC、未考虑 channel capacity 的 codebook。多 SNR inference tasks 中 accuracy 与效率提升。arXiv 新作,需更多真实链路和标准调制验证。
2025A Theoretically-Grounded Codebook for Digital Semantic Communications数字语义通信码本理论把语义同义一对多映射与 VQ Voronoi partition 对应,最大化语义 feature 与 quantized index 的互信息。codebook index基础开销 $$B_{sem}=N\lceil\log_2K\rceil$$;理论部分把 K 增大带来的量化信息增益与 bit-flip 造成的 semantic distortion 平衡,给出 optimal codebook size ...5. 理论 bit-flip / codebook 分析部分/否理论与仿真实验。常规 VQ/codebook training、无熵正则或无 bit-flip 分析变体。说明合理 K 和 entropy regularization 能改善数字语义鲁棒性。需要和具体神经架构、调制/信道编码联合验证。
2025Joint Semantic-Channel Coding and Modulation for Token Communicationstoken/prompt 通信,多模态 Transformer token把 tokenizer 产生的离散 token 当作通信基本单元,联合设计 token semantic coding、channel coding 和 modulation。token index / bit / modulation symbol若 vocab 大小为 V、发送 T 个 token,最朴素开销 $$B_{sem}=T\lceil\log_2V\rceil$$;若引入语义信道编码和 modulation,则实际 $$B_{tx}$$ 取决于冗余和 $$\log_2M$...5. token-level JSCC / modulation部分/否文本、音频、图像/视频/点云 token 任务。传统 token transmission、separate source-channel coding、固定 modulation baseline。预期在多模态 token 任务中降低开销并提升错误鲁棒性。arXiv 较新;需要更多公开基准和标准 PHY 链路验证。

技术演进与研究空白

2021-2023: 从 analog JSCC 到 VQ/数字调制雏形连续 DeepJSCC 证明任务/感知性能,但硬件兼容性弱。VQ-DeepSC、DT-JSCC、JCM 开始把 feature 变成 index 或 constellation symbol。
2024: 数字链路系统化D2-JSCC、OFDM-based DSC、BSEC robust JSCC 把 source/channel coding、OFDM 和 bit uncertainty 引入语义系统。
2025: 码本、UEP、BSC、调制映射深入VPQ、ConcreteSC、ESC-MVQ、Blind Training、sDMCM、IAQ、MaskDSC 直接处理多 rate、bit/index/symbol error 与重要性保护。
2025-2026: 多模态、视频、语音、卫星与理论VQ-DeepVSC、RVQGAN、VQ-SDSC、VQ-DSC-R、token communications 和 codebook theory 把数字语义变量扩展到更复杂媒体与网络。

从连续 JSCC 转向数字 DSC 的动机:连续 latent 易训练但难兼容标准调制、信道编码、加密、存储和协议;数字 index/bit/token 可直接进入现有 PHY/MAC,但引入“一个 bit 错导致 codeword 跳变”的新问题。

已经较好解决的问题:VQ/PQ/RVQ/MSVQ 降低语义 feature 开销;multi-rate 与 entropy coding 改善带宽适配;BSC/UEP/semantic modulation 开始把 bit/symbol error 纳入设计。

仍未解决好的问题:真实链路中的 burst/correlated errors、soft decoding 与神经 decoder 接口、index assignment/codebook geometry 与 channel code 的联合设计、多模态 token 的语义错误度量、生成式 decoder 的语义 hallucination 风险。

真正处理离散变量过信道出错的论文:Robust Information Bottleneck、Joint/Blind Channel-Adaptive DSC、ESC-MVQ、CAVQ、ResUME、IAQ、sDMCM、UEP、MaskDSC、Theoretically-Grounded Codebook。VQ-DeepSC、VPQ、MSVQ、SQ-GAN 等更多解决压缩和数字表示,信道错误处理较弱。

Vector Quantized Semantic Communication System

字段内容
作者Qifan Fu, Huiqiang Xie, Zhijin Qin, Gregory Slabaugh, Xiaoming Tao
来源/年份IEEE · IEEE Wireless Communications Letters, 2023 · 2023
标识IEEE Xplore; DOI in IEEE record
任务图像重建/传输
是否严格数字语义通信核心
信道处理分类2. 数字语义特征加传统信道编码

实验设置

项目提取结果
数据集Cars196 训练,Kodak 测试;输入按论文实验裁剪和缩放。
BaselineBPG+LDPC、UNet-DeepJSCC/DeepJSCC、不同 LDPC blocklength 和调制组合。
评价指标MS-SSIM,传输符号数,压缩率/相近 transmitted symbols 下的质量。
信道类型AWGN、Rician;语义 index 转 bit 后走 LDPC、BPSK/QAM/AMC。
实验条件文中给出 SNR=9 dB 训练点、LDPC blocklength 20/648/64800 bits,多尺度向量数如 N2=64,N3=16,N4=4 等配置。

Introduction 讲述逻辑

  1. 现有进展:连续 DeepJSCC/任务导向 SemCom 已证明端到端语义传输可在低 SNR 或低带宽下优于传统分离式通信。
  2. 仍有问题:连续 DeepJSCC 在低 SNR 平滑但与数字硬件不合;传统 BPG+LDPC 有 cliff effect;早期 VQ 语义系统又没有很好展示多尺度图像语义。
  3. 为什么重要:数字语义通信必须进入现有 bit、调制、信道编码和硬件栈;一旦离散变量出错,语义 latent 可能发生非线性跳变。
  4. 本文方案:提出 VQ-DeepSC,把语义 feature 压成多尺度 codebook indices,再用现有数字链路传输。
  5. 如何解决:多尺度码本保留全局/局部语义,PatchGAN 提升感知质量,LDPC/调制负责 index bits 的可靠传输。
  6. 核心观点:在低 SNR 下相对 BPG+LDPC cliff point 更低,且在部分 SNR 区间接近 DeepJSCC 的 MS-SSIM。

方法与数字化方案

技术路线:多尺度 VQ-DeepSC。CNN 语义编码器产生多尺度 feature map,每个尺度用共享 embedding/codebook 最近邻量化;indices 再转 bitstream。

实际传输单位:codebook index / bitstream。码本/离散集合:有码本;多尺度 embedding spaces,具体 codebook 维度以每尺度 N_l 与 K_l 表示。

传输开销推导:传输开销可写为 $$B_{sem}=\sum_l N_l\lceil\log_2 K_l\rceil$$;若接 LDPC 码率 $$R_c$$ 和 $$M$$ 阶调制,则信道比特/符号数约为 $$B_{tx}=B_{sem}/R_c,\ N_{sym}=B_{tx}/\log_2 M$$。论文直接报告的是相近 transmitted symbols 与 compression ratio;对原始 Kodak RGB,原始 bit 约为 $$HWC\times8$$。

信道如何作用于离散变量

decoder 输入:经过信道译码后的 recovered indices,而不是带 soft information 的连续 latent。

错误建模/纠错机制:信道错误主要由传统 LDPC/AMC 处理;若 index bit 出错会跳到错误 codeword,但模型本身没有在训练中显式模拟 index flip 语义跳变。

Codex 判断:它是数字语义通信的起点之一,但更偏“VQ 压缩 + 传统可靠链路”。真正的离散变量误码鲁棒性依赖外部信道编码,语义 decoder 没学会从错误 index 中恢复。

架构图与结果图

Vector Quantized Semantic Communication System 方法页
方法/架构图页:来自《Vector Quantized Semantic Communication System》PDF p.2。
Vector Quantized Semantic Communication System 结果页
关键结果图/表页:来自《Vector Quantized Semantic Communication System》PDF p.5,通常包含 SNR/PSNR/MS-SSIM/BER/Accuracy/码率等结果。

局限性

码本/向量数配置较固定;对 index error 的端到端鲁棒性分析不足;缺少对 bit-level 重要性或 soft demodulation 的建模。

Robust Semantic Communications With Masked VQ-VAE Enabled Codebook

字段内容
作者Qiyu Hu, Guangyi Zhang, Zhijin Qin, Yunlong Cai, Guanding Yu, Geoffrey Ye Li
来源/年份IEEE · IEEE Transactions on Wireless Communications, 2023 · 2023
标识IEEE Xplore
任务图像检索/重建与语义噪声鲁棒性
是否严格数字语义通信核心
信道处理分类5. 语义噪声与码本鲁棒性机制

实验设置

项目提取结果
数据集图像检索和重建数据集;文中含 retrieval、reconstruction 与 semantic noise 实验。
BaselineJPEG/BPG+LDPC、无 masking/无 FIM/普通 VQ-VAE 变体。
评价指标Recall@1、重建质量、语义相似度、激活频率、不同 SNR 下性能。
信道类型数字传输链路与 LDPC 对比;重点还包括 semantic noise 而非单纯物理噪声。
实验条件patch size 8/16,对比低 SNR 和高 SNR;包含 semantic noise power ϵ 的实验。

Introduction 讲述逻辑

  1. 现有进展:连续 DeepJSCC/任务导向 SemCom 已证明端到端语义传输可在低 SNR 或低带宽下优于传统分离式通信。
  2. 仍有问题:语义噪声会让接收端拿到“语义上误导”的符号,传统 BER/SER 无法描述这种错误。
  3. 为什么重要:数字语义通信必须进入现有 bit、调制、信道编码和硬件栈;一旦离散变量出错,语义 latent 可能发生非线性跳变。
  4. 本文方案:用 masked VQ-VAE、语义相似度正则和 FIM 让码本更去相关,并抑制容易引入语义噪声的 feature。
  5. 如何解决:训练阶段通过 semantic noise/weight perturbation 增强鲁棒性;传输阶段仍发送离散 index。
  6. 核心观点:检索 Recall@1 和重建质量在 semantic noise 与低 SNR 下优于传统压缩+信道编码。

方法与数字化方案

技术路线:masked VQ-VAE codebook。语义编码器输出 feature 后进入 masked VQ-VAE;通过 mask 与 feature importance module 删除噪声相关或任务无关 feature;发送 codebook indices。

实际传输单位:codebook index / selected semantic tokens。码本/离散集合:有码本;码本作为收发双方共享知识库,论文强调 codebook basis 的语义相似度约束。

传输开销推导:若保留 $$N_s$$ 个重要 feature,每个索引来自 $$K$$ 个 codeword,则 $$B_{sem}=N_s\lceil\log_2 K\rceil$$;mask 降低 $$N_s$$,patch size 决定 token 数。论文以 patch/压缩率和检索指标给出开销收益,精确 bit 数需由保留 token 数和码本大小推导。

信道如何作用于离散变量

decoder 输入:多数实验中 decoder 假设收到经通信链路恢复后的 index 或受语义噪声扰动的 feature/index。

错误建模/纠错机制:论文重点是 semantic noise,不是 bit flip 到邻近/远端 codeword 的物理层模型;index 错误的跳变风险被间接缓解,但未完全用 BSC/BER 端到端建模。

Codex 判断:它把“错误的语义符号”问题说清楚了,但对物理信道造成的 index bit error 仍偏间接。

架构图与结果图

Robust Semantic Communications With Masked VQ-VAE Enabled Codebook 方法页
方法/架构图页:来自《Robust Semantic Communications With Masked VQ-VAE Enabled Codebook》PDF p.3。
Robust Semantic Communications With Masked VQ-VAE Enabled Codebook 结果页
关键结果图/表页:来自《Robust Semantic Communications With Masked VQ-VAE Enabled Codebook》PDF p.14,通常包含 SNR/PSNR/MS-SSIM/BER/Accuracy/码率等结果。

局限性

semantic noise 与 physical bit error 的边界略模糊;缺少软信息或可学习信道编码。

Learning Based Joint Coding-Modulation for Digital Semantic Communication Systems

字段内容
作者Yufei Bo, Yiheng Duan, Shuo Shao, Meixia Tao
来源/年份IEEE · IEEE WCSP, 2022 · 2022
标识DOI 10.1109/WCSP55476.2022.10039447
任务CIFAR-10 图像分类与重建
是否严格数字语义通信核心
信道处理分类4. 数字符号与信道联合优化

实验设置

项目提取结果
数据集CIFAR-10,32x32 彩色图像。
BaselineAnalog、8-bit Uniform+BPSK、1-bit NN+BPSK。
评价指标分类 accuracy、PSNR、SNR 曲线、code length n。
信道类型AWGN;BPSK 数字调制。
实验条件主要实验 code length n=1536;SNR 扫描,另有 SNR=-2 dB 下不同 n。

Introduction 讲述逻辑

  1. 现有进展:连续 DeepJSCC/任务导向 SemCom 已证明端到端语义传输可在低 SNR 或低带宽下优于传统分离式通信。
  2. 仍有问题:数字调制的 hard mapping 不可导,传统 uniform quantizer 在低 SNR 下性能差。
  3. 为什么重要:数字语义通信必须进入现有 bit、调制、信道编码和硬件栈;一旦离散变量出错,语义 latent 可能发生非线性跳变。
  4. 本文方案:把 modulation 作为概率映射学习,训练时用随机 coding 保留不确定性,推理时映射到 BPSK。
  5. 如何解决:概率输出让编码与信道状态匹配,避免连续 latent 直接上信道。
  6. 核心观点:低 SNR 下 accuracy 和 PSNR 优于 analog、8-bit uniform 与 1-bit NN;高 SNR 时与 analog 接近。

方法与数字化方案

技术路线:概率式 joint coding-modulation。NN encoder 输出每个 BPSK 符号取值的概率,用随机码/Gumbel 技巧采样离散调制符号,避免硬量化不可导。

实际传输单位:BPSK symbol / bit。码本/离散集合:无 VQ 码本;离散字母是 BPSK constellation。

传输开销推导:固定 code length 为 $$n$$ 时,BPSK 每个符号 1 bit,语义链路开销 $$B_{sem}=n$$;论文 n=1536 时原始 CIFAR-10 RGB 为 $$32\times32\times3\times8=24576$$ bits,语义 bitstream 约为 1/16 原始 bit 数,不含训练随机性和物理编码冗余。

信道如何作用于离散变量

decoder 输入:decoder 收到经 AWGN 扰动后的 BPSK demodulation 结果或其等效离散/连续判决。

错误建模/纠错机制:显式考虑符号经 AWGN 后错误,但粒度是 BPSK symbol,不是 VQ index。误码会改变 learned bit/symbol,模型通过端到端训练吸收。

Codex 判断:这是早期真正把数字调制纳入训练的工作,处理了 symbol error;但 BPSK 设置较窄,离散语义单位的可解释性弱。

架构图与结果图

Learning Based Joint Coding-Modulation for Digital Semantic Communication Systems 方法页
方法/架构图页:来自《Learning Based Joint Coding-Modulation for Digital Semantic Communication Systems》PDF p.2。
Learning Based Joint Coding-Modulation for Digital Semantic Communication Systems 结果页
关键结果图/表页:来自《Learning Based Joint Coding-Modulation for Digital Semantic Communication Systems》PDF p.6,通常包含 SNR/PSNR/MS-SSIM/BER/Accuracy/码率等结果。

局限性

仅 BPSK,未覆盖高阶调制和复杂 fading;随机采样训练的方差/稳定性仍是问题。

Robust Information Bottleneck for Task-Oriented Communication With Digital Modulation

字段内容
作者Songjie Xie, Shuai Ma, Ming Ding, Yuanming Shi, Mingjian Tang, Youlong Wu
来源/年份IEEE · IEEE Journal on Selected Areas in Communications, 2023 · 2023
标识DOI 10.1109/JSAC.2023.3288252
任务任务导向边缘推理/分类
是否严格数字语义通信核心
信道处理分类4. 显式建模离散错误并联合优化

实验设置

项目提取结果
数据集MNIST、CIFAR-10。
BaselineDeepJSCC、VFE、其他 task-oriented JSCC 变体。
评价指标Top-1 accuracy/error rate、mutual information、不同 PSNR 下曲线。
信道类型AWGN;K-PSK 数字调制。
实验条件训练 PSNR 8/12/16 dB,测试 PSNR 4-20 dB;实验采用 K=16、16-PSK 等配置。

Introduction 讲述逻辑

  1. 现有进展:连续 DeepJSCC/任务导向 SemCom 已证明端到端语义传输可在低 SNR 或低带宽下优于传统分离式通信。
  2. 仍有问题:只保留任务相关信息会牺牲抗信道扰动冗余,连续 JSCC 又难接入数字调制。
  3. 为什么重要:数字语义通信必须进入现有 bit、调制、信道编码和硬件栈;一旦离散变量出错,语义 latent 可能发生非线性跳变。
  4. 本文方案:提出 RIB 目标,在任务信息与对信道扰动的冗余之间做可控折中。
  5. 如何解决:学习 codebook、离散表示和 K-PSK 调制映射,把 AWGN 后的 corrupted representation 纳入训练目标。
  6. 核心观点:MNIST/CIFAR-10 在训练/测试 SNR 不匹配时更稳,表明冗余不是浪费,而是任务鲁棒性资源。

方法与数字化方案

技术路线:DT-JSCC + robust information bottleneck。把输入编码成 d 个离散表示,每个表示从 K 个 codeword/符号中采样;再映射到 K-PSK constellation。

实际传输单位:discrete representation / PSK symbol。码本/离散集合:有 learnable codebook;K 在实验中可从 2 到 64 扫描,主实验 K=16。

传输开销推导:若编码成 $$d$$ 个离散变量、每个变量 K 类,则语义 payload $$B_{sem}=d\lceil\log_2 K\rceil$$;当 K-PSK 与 K 对齐时每个变量对应一个 channel symbol,符号数约 $$d$$。论文同时用互信息 $$I(Z;\hat Z)$$ 与任务信息刻画有效传输率。

信道如何作用于离散变量

decoder 输入:decoder 收到 demodulation 后的 corrupted discrete vector \hat z。

错误建模/纠错机制:显式建模 $$p(\hat z|z)$$,即符号错误导致离散类别变化;RIB 让 codeword/分布保留必要冗余以抵抗这种变化。

Codex 判断:这是严格数字任务通信中的关键论文:不仅量化,还把 modulation error 对任务表示的影响写入目标函数。

架构图与结果图

Robust Information Bottleneck for Task-Oriented Communication With Digital Modulation 方法页
方法/架构图页:来自《Robust Information Bottleneck for Task-Oriented Communication With Digital Modulation》PDF p.3。
Robust Information Bottleneck for Task-Oriented Communication With Digital Modulation 结果页
关键结果图/表页:来自《Robust Information Bottleneck for Task-Oriented Communication With Digital Modulation》PDF p.13,通常包含 SNR/PSNR/MS-SSIM/BER/Accuracy/码率等结果。

局限性

任务集中在分类;图像重建/感知质量不是主线;K-PSK 假设与实际编码调制链路仍有距离。

Joint Coding-Modulation for Digital Semantic Communications via Variational Autoencoder

字段内容
作者Yufei Bo, Yiheng Duan, Shuo Shao, Meixia Tao
来源/年份IEEE · IEEE Transactions on Communications, 2024 · 2024
标识IEEE Xplore
任务图像语义传输/分类与重建
是否严格数字语义通信核心
信道处理分类4. 显式建模离散错误并联合优化

实验设置

项目提取结果
数据集CIFAR-10 等图像任务数据集。
BaselineAnalog semantic communication、uniform quantization、learning-based JCM 等。
评价指标Accuracy、PSNR、不同 transmission rate/modulation order/SNR。
信道类型AWGN;多阶数字调制。
实验条件跨 SNR、rate 与 modulation order 测试。

Introduction 讲述逻辑

  1. 现有进展:连续 DeepJSCC/任务导向 SemCom 已证明端到端语义传输可在低 SNR 或低带宽下优于传统分离式通信。
  2. 仍有问题:早期数字化方法多是先量化再调制,量化误差和信道条件没有联合适配。
  3. 为什么重要:数字语义通信必须进入现有 bit、调制、信道编码和硬件栈;一旦离散变量出错,语义 latent 可能发生非线性跳变。
  4. 本文方案:把 coding 与 modulation 合成 VAE 概率模型,使离散符号分布随信道和任务共同优化。
  5. 如何解决:VAE latent/transition probability 让端到端损失可导,并用信息论 matching loss 约束。
  6. 核心观点:在多 SNR、rate、调制阶数下优于量化式数字 baseline,高阶调制时接近 analog 语义通信。

方法与数字化方案

技术路线:VAE joint coding-modulation。用 VAE 学习从源数据到离散 constellation symbols 的 transition probability,避免硬调制不可导。

实际传输单位:constellation symbol。码本/离散集合:无显式 VQ 码本;离散集合是 M 阶调制星座。

传输开销推导:若每个样本发送 $$n_s$$ 个 M 阶星座符号,则语义 bit 等价量为 $$B_{sem}=n_s\log_2 M$$;论文通过 transmission rate 与 modulation order 给出实验点,具体原图压缩率需按输入 bit 数 $$HWC8$$ 对比。

信道如何作用于离散变量

decoder 输入:decoder 接收经过实际数字调制、AWGN 和 demodulation 后的符号/概率信息。

错误建模/纠错机制:显式考虑 constellation symbol 错误;但不以 bit-level index flip 为中心,而是以符号级转移概率吸收误差。

Codex 判断:它代表从 BPSK 原型走向多阶调制的数字语义 JSCC,真正处理了 symbol error。

架构图与结果图

Joint Coding-Modulation for Digital Semantic Communications via Variational Autoencoder 方法页
方法/架构图页:来自《Joint Coding-Modulation for Digital Semantic Communications via Variational Autoencoder》PDF p.2。
Joint Coding-Modulation for Digital Semantic Communications via Variational Autoencoder 结果页
关键结果图/表页:来自《Joint Coding-Modulation for Digital Semantic Communications via Variational Autoencoder》PDF p.12,通常包含 SNR/PSNR/MS-SSIM/BER/Accuracy/码率等结果。

局限性

星座学习和实际标准编码调制仍需接口;对复杂多径/OFDM 的处理不足。

OFDM-Based Digital Semantic Communication With Importance Awareness

字段内容
作者Chuanhong Liu, Caili Guo, Yang Yang, Wanli Ni, Tony Q. S. Quek
来源/年份IEEE · IEEE Transactions on Communications, 2024 · 2024
标识IEEE Xplore
任务图像/任务语义传输,OFDM 资源分配
是否严格数字语义通信核心
信道处理分类5. 重要性感知资源分配

实验设置

项目提取结果
数据集图像任务数据集;文中对比 analog SemCom 与 conventional bit-based communication。
BaselineAnalog SemCom、传统 bit-based、无重要性感知分配变体。
评价指标任务性能、SNR/频率选择性信道下增益、bit/subcarrier allocation 结果。
信道类型频率选择性信道;OFDM;scalar quantization。
实验条件报告了相对 analog SemCom 9.7%、相对 conventional bit-based 28.7% 的性能增益。

Introduction 讲述逻辑

  1. 现有进展:连续 DeepJSCC/任务导向 SemCom 已证明端到端语义传输可在低 SNR 或低带宽下优于传统分离式通信。
  2. 仍有问题:多数 SemCom 使用简化 AWGN/analog channel,无法落地到 OFDM 频选链路。
  3. 为什么重要:数字语义通信必须进入现有 bit、调制、信道编码和硬件栈;一旦离散变量出错,语义 latent 可能发生非线性跳变。
  4. 本文方案:构建兼容数字 OFDM 的语义链路,把更好子载波和更多 bits 分给更重要语义。
  5. 如何解决:先估计 semantic importance,再用低复杂度子载波分配和 DRL bit allocation 处理不可显式写出的任务目标。
  6. 核心观点:频选信道下比 analog SemCom 和 conventional bit-based 系统更高效。

方法与数字化方案

技术路线:OFDM + semantic importance bit allocation。语义 encoder 提取 feature,scalar quantizer 数字化,再映射到 OFDM 子载波;语义重要性决定子载波和 bit 数。

实际传输单位:quantized bit / OFDM symbol。码本/离散集合:无 VQ 码本;使用标量量化 levels 与 bit allocation。

传输开销推导:若第 i 个语义 feature 分配 $$b_i$$ bits,则 $$B_{sem}=\sum_i b_i$$;OFDM 资源开销还包括每子载波调制阶数与信道编码。论文把优化变量定义为 subcarrier assignment 与 bit allocation,而非固定 CBR。

信道如何作用于离散变量

decoder 输入:decoder 收到 OFDM 解调/译码后的量化语义 bits 或对应 feature 值。

错误建模/纠错机制:考虑 bit allocation 与频选信道质量,但主要不是训练 decoder 从错误 bitstream 中恢复;误码影响通过资源分配和传统 OFDM 可靠性间接控制。

Codex 判断:它把数字 SemCom 推进到 OFDM 系统层,强在资源分配,不强在 index error 的语义恢复。

架构图与结果图

OFDM-Based Digital Semantic Communication With Importance Awareness 方法页
方法/架构图页:来自《OFDM-Based Digital Semantic Communication With Importance Awareness》PDF p.3。
OFDM-Based Digital Semantic Communication With Importance Awareness 结果页
关键结果图/表页:来自《OFDM-Based Digital Semantic Communication With Importance Awareness》PDF p.14,通常包含 SNR/PSNR/MS-SSIM/BER/Accuracy/码率等结果。

局限性

信道错误到语义失真的端到端可微建模不足;依赖重要性估计和 DRL 的泛化能力。

Digital-SC: Digital Semantic Communication With Adaptive Network Split and Learned Non-Linear Quantization

字段内容
作者Lei Guo, Wei Chen, Yuxuan Sun, Bo Ai
来源/年份IEEE · IEEE Transactions on Cognitive Communications and Networking, 2025 · 2025
标识IEEE Xplore
任务device-edge 协同推理/图像分类
是否严格数字语义通信核心
信道处理分类2. 数字特征加传统链路

实验设置

项目提取结果
数据集CIFAR-10、Mini-ImageNet。
Baseline无量化/线性量化、固定 split、固定 feature 维度、传统 edge inference baseline。
评价指标分类 accuracy、通信开销、计算开销、不同 channel/input 约束下性能。
信道类型数字无线链路;learned non-linear quantization 输出 bit sequences。
实验条件自适应选择 split point 与 transmitted feature dimension。

Introduction 讲述逻辑

  1. 现有进展:连续 DeepJSCC/任务导向 SemCom 已证明端到端语义传输可在低 SNR 或低带宽下优于传统分离式通信。
  2. 仍有问题:把完整 DNN 放在端侧太重,把原图传到边缘又太耗带宽;连续 feature 也不适合数字链路。
  3. 为什么重要:数字语义通信必须进入现有 bit、调制、信道编码和硬件栈;一旦离散变量出错,语义 latent 可能发生非线性跳变。
  4. 本文方案:用可学习非线性量化和自适应网络切分,在 device-edge 间只传必要中间语义 bits。
  5. 如何解决:SLL 约束语义错误,policy network 选择 split/feature 数,结构化剪枝降低传输维度。
  6. 核心观点:在 CIFAR-10/Mini-ImageNet 上在相近精度下显著降低通信/计算开销。

方法与数字化方案

技术路线:learned non-linear quantization。DNN 在设备端切分,设备输出中间语义 feature;非线性可训练量化 levels 将 feature 变为 bit sequence,并通过 structured pruning 降维。

实际传输单位:bit sequence / quantized intermediate feature。码本/离散集合:无 VQ 码本;有码字意义上的 learned quantization levels。

传输开销推导:若切分层输出维度为 $$D_s$$、剪枝后保留 $$D_r$$、每维量化 $$b$$ bits,则 $$B_{sem}=D_r b$$;策略网络实际改变 $$D_r$$ 与 split,使 CBR 随输入和信道约束变化。

信道如何作用于离散变量

decoder 输入:edge decoder 收到经数字系统恢复的 quantized feature bit sequence。

错误建模/纠错机制:论文主要假设数字链路能传输 bit sequence;对 bit error 后 feature 值跳变没有像 BSC/soft decoding 那样端到端建模。

Codex 判断:严格数字化且有实际开销控制,但信道误码机制偏弱,更多是边缘推理压缩论文。

架构图与结果图

Digital-SC: Digital Semantic Communication With Adaptive Network Split and Learned Non-Linear Quantization 方法页
方法/架构图页:来自《Digital-SC: Digital Semantic Communication With Adaptive Network Split and Learned Non-Linear Quantization》PDF p.1。
Digital-SC: Digital Semantic Communication With Adaptive Network Split and Learned Non-Linear Quantization 结果页
关键结果图/表页:来自《Digital-SC: Digital Semantic Communication With Adaptive Network Split and Learned Non-Linear Quantization》PDF p.11,通常包含 SNR/PSNR/MS-SSIM/BER/Accuracy/码率等结果。

局限性

缺少显式 BER/UEP/index error 分析;对复杂无线链路的鲁棒性不如专门 channel-adaptive DSC。

From Analog to Digital: Multi-Order Digital Joint Coding-Modulation for Semantic Communication

字段内容
作者Guangyi Zhang, Pujing Yang, Yunlong Cai, Qiyu Hu, Guanding Yu
来源/年份IEEE · IEEE Transactions on Communications, 2025 · 2025
标识IEEE Xplore
任务图像语义传输,多阶数字调制
是否严格数字语义通信核心
信道处理分类4. 显式建模离散错误并联合优化

实验设置

项目提取结果
数据集图像重建数据集;NTSCC 体系下实验。
BaselineAnalog NTSCC、传统数字压缩+信道编码、固定调制/无替代训练变体。
评价指标PSNR、MS-SSIM、LPIPS、SNR 和 modulation order 曲线。
信道类型数字调制/解调;多阶 QAM/PSK;训练中用替代噪声近似不可导模块。
实验条件多 modulation order 与 SNR 测试。

Introduction 讲述逻辑

  1. 现有进展:连续 DeepJSCC/任务导向 SemCom 已证明端到端语义传输可在低 SNR 或低带宽下优于传统分离式通信。
  2. 仍有问题:analog JSCC 性能好但不兼容数字系统;硬调制不可导阻碍端到端训练。
  3. 为什么重要:数字语义通信必须进入现有 bit、调制、信道编码和硬件栈;一旦离散变量出错,语义 latent 可能发生非线性跳变。
  4. 本文方案:用 substitution training 近似 modulation/demodulation,使训练模型可部署到真实多阶数字调制。
  5. 如何解决:层级降维进一步减少 transmitted symbols,同时保持语义质量。
  6. 核心观点:在多阶调制下缩小与 analog SemCom 的差距,并优于直接量化式数字方案。

方法与数字化方案

技术路线:MDJCM。在 NTSCC 中加入多阶 modulation/demodulation 模块;训练时把调制看作受约束量化并加入 scaling 与人工噪声。

实际传输单位:digital constellation symbol。码本/离散集合:无 VQ 码本;离散集合由 modulation constellation 决定。

传输开销推导:每个 channel use 承载 $$\log_2 M$$ bits,对 n 个符号 $$B_{sem}=n\log_2 M$$;论文重点比较相同 bandwidth ratio 下多阶调制性能,压缩率由 NTSCC latent 维度和 M 决定。

信道如何作用于离散变量

decoder 输入:decoder 接收经过数字调制信道后的符号判决/等效 latent。

错误建模/纠错机制:显式把调制错误作为训练近似的一部分,但 bit-level mapping 不如 sDMCM/UEP 细。

Codex 判断:它解决“可导训练 vs 真数字调制”关键矛盾,是从 analog JSCC 转向数字 JSCC 的代表。

架构图与结果图

From Analog to Digital: Multi-Order Digital Joint Coding-Modulation for Semantic Communication 方法页
方法/架构图页:来自《From Analog to Digital: Multi-Order Digital Joint Coding-Modulation for Semantic Communication》PDF p.3。
From Analog to Digital: Multi-Order Digital Joint Coding-Modulation for Semantic Communication 结果页
关键结果图/表页:来自《From Analog to Digital: Multi-Order Digital Joint Coding-Modulation for Semantic Communication》PDF p.13,通常包含 SNR/PSNR/MS-SSIM/BER/Accuracy/码率等结果。

局限性

替代训练与实际硬件误差之间仍有 gap;未深入优化 bit-label 与语义重要性的对应关系。

Universal Joint Source-Channel Coding for Modulation-Agnostic Semantic Communication

字段内容
作者Yoon Huh, Hyowoon Seo, Wan Choi
来源/年份IEEE · IEEE Journal on Selected Areas in Communications, 2025 · 2025
标识IEEE Xplore
任务图像/任务语义传输,单模型多调制阶数
是否严格数字语义通信核心
信道处理分类5. 调制自适应与模型复用

实验设置

项目提取结果
数据集图像语义任务数据集;覆盖多 modulation order。
Baseline调制阶数专用模型、现有数字 SemCom、analog JSCC 变体。
评价指标任务效果、通信效率、模型复杂度、不同 SNR/order 曲线。
信道类型数字 modulation order 可变;VQ codebook + multiple BN。
实验条件按 SNR boundary 选择 modulation order 与 BN 分支。

Introduction 讲述逻辑

  1. 现有进展:连续 DeepJSCC/任务导向 SemCom 已证明端到端语义传输可在低 SNR 或低带宽下优于传统分离式通信。
  2. 仍有问题:多数数字 SemCom 为固定调制阶数训练,换 M 就要重训或性能下降。
  3. 为什么重要:数字语义通信必须进入现有 bit、调制、信道编码和硬件栈;一旦离散变量出错,语义 latent 可能发生非线性跳变。
  4. 本文方案:提出 modulation-agnostic 单模型,靠 VQ 与多 BN 支持跨调制阶数。
  5. 如何解决:按 SNR 边界选择调制阶数,所有 NN 模块同步切换 BN 分支,减少模型数。
  6. 核心观点:相对每阶一个模型的方式节省参数,同时保持或提升任务效果。

方法与数字化方案

技术路线:uJSCC with VQ codebooks。NN encoder/decoder 共享一套主干,VQ codebook 数字化语义 latent;每个 modulation order 选择对应 BN 统计。

实际传输单位:VQ index / modulation symbol。码本/离散集合:有 trained VQ codebooks;多 BN 使共享参数适应不同输出统计。

传输开销推导:若每个 latent block 量化为 K 个 codeword,$$B_{sem}=N\lceil\log_2 K\rceil$$;不同调制阶数改变每个 channel use 可承载 bits,因此 $$N_{sym}=B_{sem}/\log_2 M$$。

信道如何作用于离散变量

decoder 输入:decoder 收到调制/解调后的 VQ 表示,BN 分支按调制阶数解释统计。

错误建模/纠错机制:考虑 modulation order 变化对离散表示的影响,但没有把具体 bit flip/index flip 作为主要训练噪声。

Codex 判断:它解决部署灵活性和模型复用,不是最彻底的错误语义恢复论文。

架构图与结果图

Universal Joint Source-Channel Coding for Modulation-Agnostic Semantic Communication 方法页
方法/架构图页:来自《Universal Joint Source-Channel Coding for Modulation-Agnostic Semantic Communication》PDF p.2。
Universal Joint Source-Channel Coding for Modulation-Agnostic Semantic Communication 结果页
关键结果图/表页:来自《Universal Joint Source-Channel Coding for Modulation-Agnostic Semantic Communication》PDF p.14,通常包含 SNR/PSNR/MS-SSIM/BER/Accuracy/码率等结果。

局限性

依赖 SNR boundary 与 BN 统计;极端非平稳信道下可能需要重新校准。

D2-JSCC: Digital Deep Joint Source-channel Coding for Semantic Communications

字段内容
作者Jianhao Huang, Kai Yuan, Chuan Huang, Kaibin Huang
来源/年份IEEE · IEEE PIMRC, 2024 · 2024
标识DOI 10.1109/PIMRC59610.2024.10817394
任务图像传输
是否严格数字语义通信核心
信道处理分类2. 数字 bitstream + channel coding

实验设置

项目提取结果
数据集真实图像数据集;与 JPEG/JPEG2000/BPG、DeepJSCC 对比。
BaselineDeepJSCC、JPEG/JPEG2000/BPG + channel code。
评价指标PSNR/MS-SSIM 或 distortion-rate,E2E distortion。
信道类型数字 source coding + channel coding;SNR 已知时优化 source/channel rate tradeoff。
实验条件不同 SNR 和 channel codes;给定总 rate 求 source/channel rate。

Introduction 讲述逻辑

  1. 现有进展:连续 DeepJSCC/任务导向 SemCom 已证明端到端语义传输可在低 SNR 或低带宽下优于传统分离式通信。
  2. 仍有问题:Analog/Semi-analog JSCC 仍不含标准 channel encoder/decoder,不兼容数字系统。
  3. 为什么重要:数字语义通信必须进入现有 bit、调制、信道编码和硬件栈;一旦离散变量出错,语义 latent 可能发生非线性跳变。
  4. 本文方案:明确采用数字 source coding 与 channel coding,并用两步算法寻找源信道率折中。
  5. 如何解决:把 E2E distortion 写成 source rate 和 channel rate 的函数,在 SNR 下选择最优分配。
  6. 核心观点:在多个 SNR 上优于经典 separation 和 deep JSCC,尤其显示 source/channel rate 协同的重要性。

方法与数字化方案

技术路线:digital deep source-channel coding。深度 source coder 提取并压缩语义 feature,adaptive density model 估计分布;外接 channel code 保护 bitstream。

实际传输单位:bitstream。码本/离散集合:无 VQ 码本;更接近 learned entropy/source coding。

传输开销推导:总 bit budget 分成 source rate $$R_s$$ 和 channel redundancy $$R_c$$;给定总信道资源,优化 $$D(R_s,R_c,SNR)$$。若 source bitstream 长度为 $$B_s$$,码率 $$r_c$$,实际发送 $$B_s/r_c$$ bits。

信道如何作用于离散变量

decoder 输入:decoder 接收经过 channel decoding 的 source bitstream。

错误建模/纠错机制:信道错误由 channel code 负责;语义 decoder 不直接处理错误 bitstream。

Codex 判断:它是数字 JSCC 系统级设计,严格数字但不是 VQ index error 方向。

架构图与结果图

D2-JSCC: Digital Deep Joint Source-channel Coding for Semantic Communications 方法页
方法/架构图页:来自《D2-JSCC: Digital Deep Joint Source-channel Coding for Semantic Communications》PDF p.2。
D2-JSCC: Digital Deep Joint Source-channel Coding for Semantic Communications 结果页
关键结果图/表页:来自《D2-JSCC: Digital Deep Joint Source-channel Coding for Semantic Communications》PDF p.7,通常包含 SNR/PSNR/MS-SSIM/BER/Accuracy/码率等结果。

局限性

离散语义变量本身的语义鲁棒性较少;性能依赖 density model 与 channel code 选择。

Joint Source-Channel Coding for Robust Digital Semantic Communications

字段内容
作者Joohyuk Park, Yongjeong Oh, Seonjung Kim, Yo-Seb Jeon
来源/年份IEEE · IEEE Globecom, 2024 · 2024
标识DOI 10.1109/GLOBECOM52923.2024.10901466
任务图像分类/重建
是否严格数字语义通信核心
信道处理分类4. 显式建模离散错误并联合优化

实验设置

项目提取结果
数据集图像分类与重建数据集。
Baseline固定环境训练 JSCC、常规 hard demodulation、已有 channel-adaptive JSCC。
评价指标Accuracy、PSNR、SNR 鲁棒性。
信道类型digital modulation;binary symmetric erasure channels (BSEC) 训练模型。
实验条件从多种分布采样 BSEC 参数以覆盖信道变化。

Introduction 讲述逻辑

  1. 现有进展:连续 DeepJSCC/任务导向 SemCom 已证明端到端语义传输可在低 SNR 或低带宽下优于传统分离式通信。
  2. 仍有问题:数字调制下 end-to-end 训练受信道动态影响,固定 SNR 模型泛化差。
  3. 为什么重要:数字语义通信必须进入现有 bit、调制、信道编码和硬件栈;一旦离散变量出错,语义 latent 可能发生非线性跳变。
  4. 本文方案:提出不确定性感知 demodulation 和 BSEC 参数采样训练,提高不同信道环境下的鲁棒性。
  5. 如何解决:BSEC 把 bit flip 和 erasure 合在训练接口中,让 decoder 学会利用不确定/受损 bits。
  6. 核心观点:分类与重建任务在未见 SNR 下更稳。

方法与数字化方案

技术路线:BSEC robust JSCC。binary-output JSCC encoder 输出 bit,通信链路用不确定性 demodulation 与 BSEC 等效模型训练。

实际传输单位:bit / erased bit / soft uncertainty。码本/离散集合:无 VQ 码本;离散变量是 binary encoder output。

传输开销推导:若 encoder 输出 B bits,则 $$B_{sem}=B$$;调制阶数 M 时符号数 $$B/\log_2 M$$,BSEC 训练通过 erasure/flip 参数决定有效信息保留。

信道如何作用于离散变量

decoder 输入:decoder 收到含不确定性/擦除建模的 bit 表示,而不是完美 index。

错误建模/纠错机制:显式处理 bit error/erasure,比只靠 LDPC 的 VQ 系统更接近数字语义误码问题。

Codex 判断:这是后续 channel-adaptive DSC 的前身,核心价值是把 bit 错误模型放进训练。

架构图与结果图

Joint Source-Channel Coding for Robust Digital Semantic Communications 方法页
方法/架构图页:来自《Joint Source-Channel Coding for Robust Digital Semantic Communications》PDF p.2。
Joint Source-Channel Coding for Robust Digital Semantic Communications 结果页
关键结果图/表页:来自《Joint Source-Channel Coding for Robust Digital Semantic Communications》PDF p.6,通常包含 SNR/PSNR/MS-SSIM/BER/Accuracy/码率等结果。

局限性

会议版规模较小;调制阶数自适应和功率控制在后续 TCCN/TCOMM 版更完整。

Joint Source-Channel Coding for Channel-Adaptive Digital Semantic Communications

字段内容
作者Joohyuk Park, Yongjeong Oh, Seonjung Kim, Yo-Seb Jeon
来源/年份IEEE · IEEE Transactions on Cognitive Communications and Networking, 2025 · 2025
标识DOI 10.1109/TCCN.2024.3422496
任务图像分类、重建、检索
是否严格数字语义通信核心
信道处理分类4. 显式建模离散错误并联合优化

实验设置

项目提取结果
数据集多种图像任务数据集;覆盖 classification/reconstruction/retrieval。
Baseline固定 JSCC、传统 demodulation、已有 SNR-adaptive/attention JSCC。
评价指标Accuracy、PSNR、retrieval 指标、latency/power。
信道类型digital modulation/demodulation;binary symmetric erasure channels。
实验条件多 channel conditions 和 modulation orders;推理时 adaptive modulation。

Introduction 讲述逻辑

  1. 现有进展:连续 DeepJSCC/任务导向 SemCom 已证明端到端语义传输可在低 SNR 或低带宽下优于传统分离式通信。
  2. 仍有问题:固定数字 JSCC 难以适应 SNR 与调制阶数动态,传统 hard demodulation 丢失可靠性信息。
  3. 为什么重要:数字语义通信必须进入现有 bit、调制、信道编码和硬件栈;一旦离散变量出错,语义 latent 可能发生非线性跳变。
  4. 本文方案:把 demodulation uncertainty、BSEC robust training 与 adaptive modulation 组合。
  5. 如何解决:训练阶段随机化 BSEC 参数;推理阶段根据信道条件决定 latent-level modulation order 降低延迟。
  6. 核心观点:在分类、重建、检索上相对固定数字 JSCC 更稳,且降低通信延迟。

方法与数字化方案

技术路线:BSEC + channel-adaptive modulation。binary-output JSCC encoder 输出 latent bits;新 demodulation 估计不确定性;训练用 BSEC 参数分布覆盖环境。

实际传输单位:bit / soft-erasure representation。码本/离散集合:无 VQ 码本;离散单位是 semantic bits。

传输开销推导:开销为 encoder bit 数 $$B$$;推理选择第 j 个 latent 的调制阶数 $$M_j$$,总符号数约 $$\sum_j b_j/\log_2 M_j$$,其中 bit 可靠性由 BSEC 参数和 demodulation uncertainty 调节。

信道如何作用于离散变量

decoder 输入:decoder 收到带不确定性的 bit/erasure 表示,而不是无误 bitstream。

错误建模/纠错机制:明确处理 bit error/erasure;不是 VQ index 跳变,但机制直接针对数字 bit 受损。

Codex 判断:这是严格处理离散 bit 经过信道后出错的核心论文之一。

架构图与结果图

Joint Source-Channel Coding for Channel-Adaptive Digital Semantic Communications 方法页
方法/架构图页:来自《Joint Source-Channel Coding for Channel-Adaptive Digital Semantic Communications》PDF p.3。
Joint Source-Channel Coding for Channel-Adaptive Digital Semantic Communications 结果页
关键结果图/表页:来自《Joint Source-Channel Coding for Channel-Adaptive Digital Semantic Communications》PDF p.14,通常包含 SNR/PSNR/MS-SSIM/BER/Accuracy/码率等结果。

局限性

复杂度来自 robust training 与调制选择;若标准信道译码输出 hard bits,软信息接口需要重新设计。

Blind Training for Channel-Adaptive Digital Semantic Communications

字段内容
作者Yongjeong Oh, Joohyuk Park, Jinho Choi, Jihong Park, Yo-Seb Jeon
来源/年份IEEE · IEEE Transactions on Communications, 2025 · 2025
标识DOI 10.1109/TCOMM.2025.3585587
任务图像/视频语义任务的 channel-adaptive 训练框架
是否严格数字语义通信核心
信道处理分类4. 显式建模离散错误并联合优化

实验设置

项目提取结果
数据集图像分类/重建等任务数据集。
Baseline特定信道训练、BSC+VQ、BSC+SQ、BlindSC 等。
评价指标任务性能、power consumption、SNR 泛化、参数量。
信道类型parallel BSC 作为数字通信通用等效模型;推理时 adaptive power/modulation。
实验条件bit-flip probabilities 作为可训练参数,训练后用通信策略匹配实际 BER。

Introduction 讲述逻辑

  1. 现有进展:连续 DeepJSCC/任务导向 SemCom 已证明端到端语义传输可在低 SNR 或低带宽下优于传统分离式通信。
  2. 仍有问题:实际系统的信道、调制和功率设计很多,逐一训练语义模型不可行。
  3. 为什么重要:数字语义通信必须进入现有 bit、调制、信道编码和硬件栈;一旦离散变量出错,语义 latent 可能发生非线性跳变。
  4. 本文方案:提出 blind training,把所有数字链路抽象为并行 BSC,训练后再用通信策略对齐 BER。
  5. 如何解决:可学习 flip probabilities 让模型自己分配 bit 重要性;推理根据 SNR 选 power/modulation。
  6. 核心观点:在多 SNR 下用单模型达到接近/优于多个专用模型的性能,并降低功耗。

方法与数字化方案

技术路线:blind parallel-BSC training。semantic encoder 输出 bits;训练时不指定具体物理信道,而用 parallel BSC 的可学习 flip probability 表征每个 bit/substream 可靠性。

实际传输单位:bit / parallel BSC output。码本/离散集合:无 VQ 码本;可与 VQ/SQ baseline 对比。

传输开销推导:若有 B 个 semantic bits,$$B_{sem}=B$$;每个 BSC 分支有目标 flip probability $$\mu_i$$。推理时选功率/调制使实际 BER 接近 $$\mu_i$$,符号开销随所选 $$M_i$$ 为 $$\sum_i b_i/\log_2M_i$$。

信道如何作用于离散变量

decoder 输入:decoder 收到经过 BSC 扰动的 bits;实际部署中接收 hard bits,其错误率由调制/功率匹配。

错误建模/纠错机制:非常明确地处理 bit error;它不要求知道具体信道,只要求实际链路能实现目标 BER。

Codex 判断:这是“数字语义变量经信道出错”问题最直接的解法之一。

架构图与结果图

Blind Training for Channel-Adaptive Digital Semantic Communications 方法页
方法/架构图页:来自《Blind Training for Channel-Adaptive Digital Semantic Communications》PDF p.4。
Blind Training for Channel-Adaptive Digital Semantic Communications 结果页
关键结果图/表页:来自《Blind Training for Channel-Adaptive Digital Semantic Communications》PDF p.15,通常包含 SNR/PSNR/MS-SSIM/BER/Accuracy/码率等结果。

局限性

等效 BSC 忽略 burst error、软译码和相关错误;BER 匹配表需要校准。

MaskDSC: Resilient Digital Semantic Communication with Masked Transformer and Unequal Error Protection

字段内容
作者Jun Wang, Kailin Tan, Sixian Wang, Xiaoqi Qin, Zhenyu Liu, Jincheng Dai
来源/年份IEEE · IEEE WCNC, 2025 · 2025
标识DOI 10.1109/WCNC61545.2025.10978821
任务图像/视觉数据传输
是否严格数字语义通信核心
信道处理分类5. masked error concealment + UEP

实验设置

项目提取结果
数据集图像数据集;关注视觉 token 传输。
Baseline传统 RTC/压缩+信道编码、无 masked Transformer、无 UEP 变体。
评价指标压缩效率、重建质量、error resilience、动态信道下曲线。
信道类型不可靠无线信道;物理层 UEP。
实验条件通过 critical packets 可靠保护,其余 token 允许 bit errors。

Introduction 讲述逻辑

  1. 现有进展:连续 DeepJSCC/任务导向 SemCom 已证明端到端语义传输可在低 SNR 或低带宽下优于传统分离式通信。
  2. 仍有问题:实时视觉通信里所有 bit 都强保护太贵,不保护又会因错误 token 崩溃。
  3. 为什么重要:数字语义通信必须进入现有 bit、调制、信道编码和硬件栈;一旦离散变量出错,语义 latent 可能发生非线性跳变。
  4. 本文方案:用 masked Transformer 从上下文恢复缺失/错误 token,同时把关键 packets 分配更强保护。
  5. 如何解决:因果上下文提升压缩,mask 训练提升 error concealment,UEP 把可靠性预算给关键语义。
  6. 核心观点:在动态信道下比传统均等保护更稳,压缩和鲁棒性同时提升。

方法与数字化方案

技术路线:masked Transformer + UEP。视觉 token 以因果顺序建模;masked Transformer 同时用于 entropy modeling 和 error concealment;物理层对关键 packets 做 UEP。

实际传输单位:token bitstream / packet。码本/离散集合:可与 VQ/entropy coding 结合;核心不是单一 codebook,而是 token/context model。

传输开销推导:总开销由 entropy-coded token bitstream 给出;若 token i 的码长为 $$l_i$$,关键 token 采用更强 channel code 码率 $$R_i$$,则 $$B_{tx}=\sum_i l_i/R_i$$。UEP 不改变源 bitstream,但改变实际信道开销。

信道如何作用于离散变量

decoder 输入:decoder 收到部分可靠、部分可能带错的 token bitstream,并用 masked Transformer 补偿。

错误建模/纠错机制:显式承认 bit/packet error,不再要求全 bit 无误;关键 token 用 UEP,非关键 token 交给上下文模型恢复。

Codex 判断:它是真正面向错误 bitstream 的数字视觉 SemCom,而不是只做 VQ 压缩。

架构图与结果图

MaskDSC: Resilient Digital Semantic Communication with Masked Transformer and Unequal Error Protection 方法页
方法/架构图页:来自《MaskDSC: Resilient Digital Semantic Communication with Masked Transformer and Unequal Error Protection》PDF p.2。
MaskDSC: Resilient Digital Semantic Communication with Masked Transformer and Unequal Error Protection 结果页
关键结果图/表页:来自《MaskDSC: Resilient Digital Semantic Communication with Masked Transformer and Unequal Error Protection》PDF p.6,通常包含 SNR/PSNR/MS-SSIM/BER/Accuracy/码率等结果。

局限性

UEP 策略与实际 channel code/packetization 的耦合需要系统级验证;不同语义任务的关键 token 定义可能变化。

Unequal Error Protection for Digital Semantic Communication with Channel Coding

字段内容
作者Seonjung Kim, Yongjeong Oh, Yongjune Kim, Namyoon Lee, Yo-Seb Jeon
来源/年份arXiv · arXiv / IEEE-oriented preprint, 2025 · 2025
标识arXiv 2508.03381
任务图像传输/语义 bit 保护
是否严格数字语义通信核心
信道处理分类5. semantic-aware channel coding / UEP

实验设置

项目提取结果
数据集图像传输任务数据集。
BaselineEqual protection channel coding、long-block code、无 UEP 语义 bit baseline。
评价指标任务性能、总 blocklength、保护等级、SNR/BER。
信道类型channel coding;bit-level learned target error probabilities。
实验条件比较 bit-level repetition UEP 与 block-level UEP。

Introduction 讲述逻辑

  1. 现有进展:连续 DeepJSCC/任务导向 SemCom 已证明端到端语义传输可在低 SNR 或低带宽下优于传统分离式通信。
  2. 仍有问题:语义 bits 重要性高度不均匀,用相同可靠性保护会浪费 blocklength。
  3. 为什么重要:数字语义通信必须进入现有 bit、调制、信道编码和硬件栈;一旦离散变量出错,语义 latent 可能发生非线性跳变。
  4. 本文方案:把 learned bit-flip probability 解释为目标 error protection level,并设计 bit/block-level UEP。
  5. 如何解决:按保护需求分组,短 block 反而更适合高度异质的语义 bits。
  6. 核心观点:在图像任务中比 equal protection 更短 blocklength 或更高性能。

方法与数字化方案

技术路线:semantic bit UEP。先由数字语义 encoder 产生 semantic bits;学习得到每个 bit 的目标 flip probability,再据此分配不等保护。

实际传输单位:bit。码本/离散集合:无 VQ 码本;关注 semantic bits 的保护级别。

传输开销推导:源开销 $$B_{sem}=B$$;信道开销由每个 bit/block 的重复次数或 channel code blocklength 决定,$$B_{tx}=\sum_i n_i$$。论文的核心是最小化满足 $$P_{e,i}\le\mu_i$$ 的总 blocklength。

信道如何作用于离散变量

decoder 输入:decoder 收到经 channel coding 保护后但仍可能有残余误码的 semantic bits。

错误建模/纠错机制:明确处理 bit error;关键是把每个 bit 的语义重要性转化为不同的目标误码率。

Codex 判断:这是从通信编码角度补上 DSC 的关键拼图,和 Blind Training/IAQ 相互呼应。

架构图与结果图

Unequal Error Protection for Digital Semantic Communication with Channel Coding 方法页
方法/架构图页:来自《Unequal Error Protection for Digital Semantic Communication with Channel Coding》PDF p.3。
Unequal Error Protection for Digital Semantic Communication with Channel Coding 结果页
关键结果图/表页:来自《Unequal Error Protection for Digital Semantic Communication with Channel Coding》PDF p.13,通常包含 SNR/PSNR/MS-SSIM/BER/Accuracy/码率等结果。

局限性

依赖已知/可学习的重要性与目标 BER;与神经 decoder 的联合端到端优化还可更紧。

Channel-Aware Vector Quantization for Robust Semantic Communication on Discrete Channels

字段内容
作者Zian Meng, Qiang Li, Wenqian Tang, Mingdie Yan, Xiaohu Ge
来源/年份arXiv · arXiv, 2025 · 2025
标识arXiv 2510.18604
任务图像语义重建,离散信道
是否严格数字语义通信核心
信道处理分类4. 显式建模离散错误并联合优化

实验设置

项目提取结果
数据集图像重建数据集。
BaselineVQJSCC without CAVQ、state-of-the-art digital SemCom baselines。
评价指标重建质量、digital cliff effect、不同 modulation/discrete channel 下鲁棒性。
信道类型discrete memoryless channel;modulation constellation transition probabilities。
实验条件多 modulation schemes 和 channel transition matrix。

Introduction 讲述逻辑

  1. 现有进展:连续 DeepJSCC/任务导向 SemCom 已证明端到端语义传输可在低 SNR 或低带宽下优于传统分离式通信。
  2. 仍有问题:普通 VQ 假设 index 无误或等概率错误;一旦 index 错到远端 codeword,语义失真很大。
  3. 为什么重要:数字语义通信必须进入现有 bit、调制、信道编码和硬件栈;一旦离散变量出错,语义 latent 可能发生非线性跳变。
  4. 本文方案:把 channel transition probabilities 纳入 codebook 优化,使高概率混淆的符号语义距离更近。
  5. 如何解决:多码本 alignment 进一步解决 codebook order 与 modulation order 不匹配。
  6. 核心观点:显著缓解 digital cliff effect,在多调制方案下优于现有数字 SemCom。

方法与数字化方案

技术路线:CAVQ / channel-aware codebook。语义 feature 先 VQ 离散化,再直接映射到 modulation symbols;CAVQ 在量化距离中加入信道转移概率,让易混符号对应语义相近 codewords。

实际传输单位:codebook index / modulation symbol。码本/离散集合:有码本;多码本 alignment 处理 codebook order 与 modulation order 不匹配。

传输开销推导:单码本时 $$B_{sem}=N\lceil\log_2K\rceil$$;若 modulation order 为 M 且 K 不匹配,多子信道分解后总开销为各子码本索引 bits 之和。论文强调有效开销与 constellation order 对齐。

信道如何作用于离散变量

decoder 输入:decoder 直接接收可能错误的 symbol/index,并映射到对应 codeword。

错误建模/纠错机制:非常明确地处理 index/symbol error:不是防止错误,而是让错误落到语义相近 codeword。

Codex 判断:这是 VQ 数字语义通信里真正击中“index 出错跳到完全不同向量”痛点的论文。

架构图与结果图

Channel-Aware Vector Quantization for Robust Semantic Communication on Discrete Channels 方法页
方法/架构图页:来自《Channel-Aware Vector Quantization for Robust Semantic Communication on Discrete Channels》PDF p.3。
Channel-Aware Vector Quantization for Robust Semantic Communication on Discrete Channels 结果页
关键结果图/表页:来自《Channel-Aware Vector Quantization for Robust Semantic Communication on Discrete Channels》PDF p.12,通常包含 SNR/PSNR/MS-SSIM/BER/Accuracy/码率等结果。

局限性

需要已知或估计信道转移矩阵;复杂非平稳信道下 codebook 可能需要重训/自适应。

VQ-DSC-R: Robust Vector Quantized-Enabled Digital Semantic Communication With OFDM Transmission

字段内容
作者Jianqiao Chen, Nan Ma, Xiaodong Xu, Tingting Zhu, Huishi Song, Chen Dong, Wenkai Liu, Rui Meng, Ping Zhang
来源/年份arXiv · arXiv, 2026 · 2026
标识arXiv 2602.15045
任务图像语义传输,OFDM 多径鲁棒
是否严格数字语义通信核心
信道处理分类4. 显式建模离散错误并联合优化

实验设置

项目提取结果
数据集图像重建数据集。
BaselineVQ-DSC、analog DJSCC、传统 OFDM baseline。
评价指标PSNR、MS-SSIM、LPIPS、SNR/多径条件。
信道类型OFDM、多径 fading、噪声;CDM refinement。
实验条件三阶段训练;Swin Transformer backbone。

Introduction 讲述逻辑

  1. 现有进展:连续 DeepJSCC/任务导向 SemCom 已证明端到端语义传输可在低 SNR 或低带宽下优于传统分离式通信。
  2. 仍有问题:VQ 数字化可兼容数字系统,但实际 OFDM 多径会造成 CSI 与 index 传输失真。
  3. 为什么重要:数字语义通信必须进入现有 bit、调制、信道编码和硬件栈;一旦离散变量出错,语义 latent 可能发生非线性跳变。
  4. 本文方案:把 VQ codebook、OFDM 链路和条件扩散 CSI refinement 结合,增强 index 传输鲁棒性。
  5. 如何解决:ANDVQ 减小量化误差,CDM 细化 channel state,attention 模块动态适配噪声。
  6. 核心观点:在复杂 OFDM 条件下比普通 VQ/analog baseline 更稳。

方法与数字化方案

技术路线:Swin + SQC + ANDVQ + CDM。Swin Transformer 提取层级 feature;VQ 模块映射到 shared semantic quantized codebook;indices 经 OFDM 传输。

实际传输单位:SQC index / OFDM symbol。码本/离散集合:有 shared semantic quantized codebook;ANDVQ 用 KNN 统计自适应噪声方差并 EMA 稳定码本。

传输开销推导:若层级 feature 产生 $$N$$ 个 SQC indices,码本大小 K,则 $$B_{sem}=N\lceil\log_2K\rceil$$;OFDM 实际开销需除以调制阶数与信道码率,并加 pilot/CSI 开销。论文主要报告 CBR/重建指标而非逐项 bit ledger。

信道如何作用于离散变量

decoder 输入:decoder 接收经 OFDM 影响后的 index/feature 表示以及 refined CSI。

错误建模/纠错机制:处理了噪声和多径导致的 index 传输问题,但更偏连续 CSI/OFDM 鲁棒化;对 bit-level index flip 的语义邻近映射不如 CAVQ 清晰。

Codex 判断:它把 VQ DSC 放进 OFDM 场景,重要但仍处于系统集成型。

架构图与结果图

VQ-DSC-R: Robust Vector Quantized-Enabled Digital Semantic Communication With OFDM Transmission 方法页
方法/架构图页:来自《VQ-DSC-R: Robust Vector Quantized-Enabled Digital Semantic Communication With OFDM Transmission》PDF p.3。
VQ-DSC-R: Robust Vector Quantized-Enabled Digital Semantic Communication With OFDM Transmission 结果页
关键结果图/表页:来自《VQ-DSC-R: Robust Vector Quantized-Enabled Digital Semantic Communication With OFDM Transmission》PDF p.13,通常包含 SNR/PSNR/MS-SSIM/BER/Accuracy/码率等结果。

局限性

arXiv 版本较新;需要标准链路、导频开销和真实信道测试进一步验证。

Digital Semantic Communications with Variable Product Quantization for Image Transmission

字段内容
作者Junxiao Liang, Fengyu Wang, Yuan Zheng, Wenjun Xu, Xiaodong Xu, Jincheng Dai
来源/年份IEEE · IEEE WCNC, 2025 · 2025
标识DOI 10.1109/WCNC61545.2025.10978348
任务图像传输
是否严格数字语义通信核心
信道处理分类2. PQ 特征加数字链路

实验设置

项目提取结果
数据集图像重建数据集。
BaselineVQ-based digital SemCom、DeepJSCC-Q、Seb/传统方案。
评价指标LPIPS、PSNR/MS-SSIM、SNR 与 bandwidth 多场景。
信道类型数字链路;面向多 bandwidth 和 SNR。
实验条件报告 high SNR 下 LPIPS 提升 32.4%,SNR=2 dB 提升 62.2%。

Introduction 讲述逻辑

  1. 现有进展:连续 DeepJSCC/任务导向 SemCom 已证明端到端语义传输可在低 SNR 或低带宽下优于传统分离式通信。
  2. 仍有问题:单 VQ codebook 容量与灵活性不足,固定 modulation/order 难适配多带宽。
  3. 为什么重要:数字语义通信必须进入现有 bit、调制、信道编码和硬件栈;一旦离散变量出错,语义 latent 可能发生非线性跳变。
  4. 本文方案:引入 VPQ,用多个轻量 codebook 提升表示能力,并按语义熵动态调码率。
  5. 如何解决:PQ 避免单大码本指数增长,entropy-aware 模块让低复杂度数字 SemCom 支持多 rate。
  6. 核心观点:相对现有 VQ-based digital SemCom 在 LPIPS 上有明显改善。

方法与数字化方案

技术路线:VPQ-SemCom。语义 feature 被分成多个子向量,用 product quantization 的多个轻量 codebooks 表示;rate adaptation 根据 feature entropy 动态调整长度/码率。

实际传输单位:PQ sub-index / bitstream。码本/离散集合:多 lightweight codebooks;每个子空间一个 codebook。

传输开销推导:若 feature 被分成 m 个子向量、每个子码本大小 K_j,则每个 token 开销 $$\sum_{j=1}^m\lceil\log_2K_j\rceil$$;若保留 N 个 token,则 $$B_{sem}=N\sum_j\lceil\log_2K_j\rceil$$。rate adaptation 改变 N 或子码本使用,论文以多 bitrate/SNR 下性能体现。

信道如何作用于离散变量

decoder 输入:decoder 收到经数字系统恢复后的 PQ sub-indices。

错误建模/纠错机制:论文主要关注压缩/码本表示;信道错误多由传统数字链路吸收,未显式训练 index error。

Codex 判断:核心贡献是“更好的数字化表示与 rate adaptation”,不是错误 index 的语义鲁棒性。

架构图与结果图

Digital Semantic Communications with Variable Product Quantization for Image Transmission 方法页
方法/架构图页:来自《Digital Semantic Communications with Variable Product Quantization for Image Transmission》PDF p.2。
Digital Semantic Communications with Variable Product Quantization for Image Transmission 结果页
关键结果图/表页:来自《Digital Semantic Communications with Variable Product Quantization for Image Transmission》PDF p.6,通常包含 SNR/PSNR/MS-SSIM/BER/Accuracy/码率等结果。

局限性

需要与 CAVQ/UEP 类方法结合,才能完整处理 sub-index bit error。

Fully Learnable Multi-Rate Quantization for Digital Semantic Communication Systems

字段内容
作者Minhoe Kim, Dong Jin Ji
来源/年份IEEE · IEEE Wireless Communications Letters, 2025 · 2025
标识DOI 10.1109/LWC.2025.3581374
任务图像传输
是否严格数字语义通信核心
信道处理分类4. 显式建模离散错误并联合优化

实验设置

项目提取结果
数据集ImageNet。
BaselineVQ-based baselines、固定 rate 量化方法。
评价指标SSIM、PSNR、复杂度、multi-rate 性能。
信道类型Rayleigh、Rician fading;端到端 channel noise 训练。
实验条件temperature-controlled concrete distribution;masking 支持 multi-rate。

Introduction 讲述逻辑

  1. 现有进展:连续 DeepJSCC/任务导向 SemCom 已证明端到端语义传输可在低 SNR 或低带宽下优于传统分离式通信。
  2. 仍有问题:VQ 虽兼容数字系统,但码本庞大、不可导且受 channel noise 影响明显。
  3. 为什么重要:数字语义通信必须进入现有 bit、调制、信道编码和硬件栈;一旦离散变量出错,语义 latent 可能发生非线性跳变。
  4. 本文方案:用 Concrete 分布替代硬 VQ,保持端到端可导并支持 multi-rate。
  5. 如何解决:温度控制软硬程度,mask 控制 rate,训练中加入 channel noise。
  6. 核心观点:ImageNet 上在 Rayleigh/Rician 下 SSIM/PSNR 超过 VQ baseline。

方法与数字化方案

技术路线:ConcreteSC。不用大 VQ codebook,而用 temperature-controlled concrete distributions 做可微离散化;masking 控制 rate。

实际传输单位:learned quantized bits / concrete categorical variables。码本/离散集合:无大码本;用可学习 concrete distribution 近似离散选择。

传输开销推导:若 mask 后保留 L 个离散变量、每个变量 b bits,则 $$B_{sem}=Lb$$;multi-rate 通过 mask 改变 L,不需要重训。复杂度随 bit length 线性增长,而 VQ 大码本常随 K 指数增长。

信道如何作用于离散变量

decoder 输入:decoder 接收经信道扰动后的量化变量/bit 表示。

错误建模/纠错机制:训练中考虑 channel noise,但误差模型不是显式 index flip;由于没有大码本,单个符号错到远端 codeword 的风险被弱化。

Codex 判断:它是 VQ 替代路线:用可微离散化解决训练与复杂度,而非专门做 channel code。

架构图与结果图

Fully Learnable Multi-Rate Quantization for Digital Semantic Communication Systems 方法页
方法/架构图页:来自《Fully Learnable Multi-Rate Quantization for Digital Semantic Communication Systems》PDF p.2。
Fully Learnable Multi-Rate Quantization for Digital Semantic Communication Systems 结果页
关键结果图/表页:来自《Fully Learnable Multi-Rate Quantization for Digital Semantic Communication Systems》PDF p.4,通常包含 SNR/PSNR/MS-SSIM/BER/Accuracy/码率等结果。

局限性

对标准调制、BER 映射和实际 bitstream packing 的描述仍需更细。

VQ-SDSC: Vector Quantized Satellite Digital Semantic Communication Framework

字段内容
作者Jinghong Huang, Mengying Sun, Yuantao Zhang, Haiming Wang, Xiaodong Xu
来源/年份IEEE · IEEE INFOCOM Workshops, 2025 · 2025
标识DOI 10.1109/INFOCOMWKSHPS65812.2025.11153002
任务卫星中继图像语义传输
是否严格数字语义通信核心但证据有限
信道处理分类2. VQ + 卫星数字链路

实验设置

项目提取结果
数据集图像重建实验。
Baseline经典 semantic communication schemes。
评价指标图像重建质量、卫星级联 fading 鲁棒性。
信道类型卫星 relay/cascading fading;vector quantization + learned modulation。
实验条件两页 poster,实验细节有限。

Introduction 讲述逻辑

  1. 现有进展:连续 DeepJSCC/任务导向 SemCom 已证明端到端语义传输可在低 SNR 或低带宽下优于传统分离式通信。
  2. 仍有问题:卫星链路有级联衰落、长时延,普通语义通信不一定能稳健转发。
  3. 为什么重要:数字语义通信必须进入现有 bit、调制、信道编码和硬件栈;一旦离散变量出错,语义 latent 可能发生非线性跳变。
  4. 本文方案:用 VQ 数字语义特征和联合语义编码调制增强卫星链路适应性。
  5. 如何解决:语义 forwarding 减轻级联 fading 对重建的影响。
  6. 核心观点:相对经典方案提升卫星 relay 场景下图像重建表现。

方法与数字化方案

技术路线:satellite VQ + semantic forwarding。semantic encoder 输出矩阵 L,训练 codebook E,将 feature 向量映射为 codebook indices,并优化 constellation symbol distribution。

实际传输单位:VQ index / constellation symbol。码本/离散集合:有码本 E=[e1,...,eK]。

传输开销推导:若 L 含 M 个向量、码本大小 K,则 $$B_{sem}=M\lceil\log_2K\rceil$$;poster 未给完整 K/M 数值表,需从实现或扩展版补齐。

信道如何作用于离散变量

decoder 输入:decoder 收到量化 index/调制符号恢复后的语义 feature。

错误建模/纠错机制:提到 channel adaptability,但两页 poster 没有充分展开 index error 模型。

Codex 判断:相关性强但证据深度有限;作为卫星 DSC 线索纳入。

架构图与结果图

VQ-SDSC: Vector Quantized Satellite Digital Semantic Communication Framework 方法页
方法/架构图页:来自《VQ-SDSC: Vector Quantized Satellite Digital Semantic Communication Framework》PDF p.1。
VQ-SDSC: Vector Quantized Satellite Digital Semantic Communication Framework 结果页
关键结果图/表页:来自《VQ-SDSC: Vector Quantized Satellite Digital Semantic Communication Framework》PDF p.2,通常包含 SNR/PSNR/MS-SSIM/BER/Accuracy/码率等结果。

局限性

缺少完整实验表、bit ledger 和 error model 细节。

ESC-MVQ: End-to-End Semantic Communication With Multi-Codebook Vector Quantization

字段内容
作者Junyong Shin, Yongjeong Oh, Jinsung Park, Joohyuk Park, Yo-Seb Jeon
来源/年份IEEE · IEEE Transactions on Wireless Communications, 2025/2026 · 2025
标识DOI 10.1109/TWC.2025.3605838
任务图像重建
是否严格数字语义通信核心
信道处理分类4. 显式建模离散错误并联合优化

实验设置

项目提取结果
数据集CIFAR-100、STL-10 等。
BaselineBSC+VQ、BSC+SQ、BlindSC、single-codebook ESC-SVQ、Codebook Selection。
评价指标PSNR、BER matching、参数量、SNR 曲线。
信道类型parallel BSC training;AWGN/Rayleigh inference;adaptive modulation/power。
实验条件BSC flip probability sampled U[0,0.1];Rayleigh SNR 表映射。

Introduction 讲述逻辑

  1. 现有进展:连续 DeepJSCC/任务导向 SemCom 已证明端到端语义传输可在低 SNR 或低带宽下优于传统分离式通信。
  2. 仍有问题:单一码本无法同时适应宽 SNR;多个专用模型内存大。
  3. 为什么重要:数字语义通信必须进入现有 bit、调制、信道编码和硬件栈;一旦离散变量出错,语义 latent 可能发生非线性跳变。
  4. 本文方案:联合训练多个 VQ codebooks 与 bit-flip probabilities,用单 encoder-decoder 覆盖多信道。
  5. 如何解决:JCAMP/JCAP 在推理时联合优化 codebook assignment、modulation 和 power。
  6. 核心观点:在 AWGN/Rayleigh 下用单模型超过多种数字 baseline,并验证 measured BER 与目标概率匹配。

方法与数字化方案

技术路线:multi-codebook VQ + JCAMP/JCAP。一个 encoder-decoder 对,多套 VQ codebooks,每套 codebook 对应不同 bit-flip probability/鲁棒性;推理时按信道为 sub-vector 选 codebook、modulation 和 power。

实际传输单位:codebook index / bit / symbol。码本/离散集合:多码本 V;每个 sub-vector 可以选择不同 codebook。

传输开销推导:若有 N 个 sub-vectors、选择第 v 个码本大小 K_v,则 $$B_{sem}=\sum_i\lceil\log_2K_{v_i}\rceil$$;JCAMP 还选择 modulation order 和 power,使实际 BER 匹配训练得到的 $$\mu_{i,v}$$。

信道如何作用于离散变量

decoder 输入:decoder 接收经 BSC/实际链路扰动的 indices/bits,而非假设完全可靠。

错误建模/纠错机制:非常明确地处理 VQ index/bit error:错误概率进入码本训练,推理用 BER matching 让实际错误分布和训练一致。

Codex 判断:这是目前最强的“码本选择 + 调制功率 + bit flip”联合优化代表。

架构图与结果图

ESC-MVQ: End-to-End Semantic Communication With Multi-Codebook Vector Quantization 方法页
方法/架构图页:来自《ESC-MVQ: End-to-End Semantic Communication With Multi-Codebook Vector Quantization》PDF p.3。
ESC-MVQ: End-to-End Semantic Communication With Multi-Codebook Vector Quantization 结果页
关键结果图/表页:来自《ESC-MVQ: End-to-End Semantic Communication With Multi-Codebook Vector Quantization》PDF p.15,通常包含 SNR/PSNR/MS-SSIM/BER/Accuracy/码率等结果。

局限性

需要维护多码本和查表;BER 独立假设对 burst/correlated error 仍有限。

A Hierarchical Error Protection Framework for Learnable Residual Vector Quantization in Digital Semantic Communication Systems

字段内容
作者Wonjung Kim, Jaein Lee, Wonjae Shin, Jungwoo Lee
来源/年份IEEE · IEEE Globecom, 2025 · 2025
标识DOI 10.1109/GLOBECOM59602.2025.11432246
任务图像重建
是否严格数字语义通信核心
信道处理分类4. 显式建模离散错误并联合优化

实验设置

项目提取结果
数据集图像数据集;PSNR/MS-SSIM 实验。
BaselineRVQ、RVQ+uniform modulation、continuous reference、loss ablations。
评价指标PSNR、MS-SSIM、CBR、SNR。
信道类型AWGN;BSC mutual information analysis;unequal modulation。
实验条件训练 SNR 0-10 dB;CBR 0.00391/0.0156/0.0299 等。

Introduction 讲述逻辑

  1. 现有进展:连续 DeepJSCC/任务导向 SemCom 已证明端到端语义传输可在低 SNR 或低带宽下优于传统分离式通信。
  2. 仍有问题:单阶段 VQ 扩 rate 会导致码本爆炸和 collapse;RVQ 有层级但不同 stage 重要性不同。
  3. 为什么重要:数字语义通信必须进入现有 bit、调制、信道编码和硬件栈;一旦离散变量出错,语义 latent 可能发生非线性跳变。
  4. 本文方案:提出 ResUME,把 RVQ 的层级信息和 unequal modulation 结合,按 mutual information 最大化分配保护。
  5. 如何解决:用信息瓶颈式 variational loss 减少 overfitting,并用 BSC 分析推导 modulation order 约束。
  6. 核心观点:在相同 CBR 下 RVQ+UME 提升 PSNR/MS-SSIM,特别是低 SNR。

方法与数字化方案

技术路线:ResUME / RVQ + unequal modulation。残差 VQ 多阶段逐层编码 residual;层级越早语义越重要,因此给不同 RVQ stage 分配不同 modulation order。

实际传输单位:RVQ stage index / modulation symbol。码本/离散集合:有码本;RVQ(n,k) 表示 n-stage、每 stage k-bit codebook。

传输开销推导:RVQ(n,k) 每个位置开销为 $$nk$$ bits;若有 N 个位置,则 $$B_{sem}=Nnk$$,CBR 由 $$B_{sem}/(HWC8)$$ 得到。论文直接报告 CBR=0.00391、0.0156、0.0299 等。

信道如何作用于离散变量

decoder 输入:decoder 收到各 stage 经不同调制保护后的 indices。

错误建模/纠错机制:显式考虑 index symbol 由 b bits 表示且经 BSC 发生错误;用 modulation order 进行层级 UEP。

Codex 判断:它把 RVQ 结构与错误保护强度对齐,解决多阶段 index 不同重要性的问题。

架构图与结果图

A Hierarchical Error Protection Framework for Learnable Residual Vector Quantization in Digital Semantic Communication Systems 方法页
方法/架构图页:来自《A Hierarchical Error Protection Framework for Learnable Residual Vector Quantization in Digital Semantic Communication Systems》PDF p.2。
A Hierarchical Error Protection Framework for Learnable Residual Vector Quantization in Digital Semantic Communication Systems 结果页
关键结果图/表页:来自《A Hierarchical Error Protection Framework for Learnable Residual Vector Quantization in Digital Semantic Communication Systems》PDF p.6,通常包含 SNR/PSNR/MS-SSIM/BER/Accuracy/码率等结果。

局限性

假设错误独立和 stage 重要性单调;真实 channel code/soft decoding 集成仍需扩展。

Low-Bitrate High-Quality Digital Semantic Communication Based on RVQGAN

字段内容
作者Xiaojiao Chen, Jing Wang, Jingxuan Huang, Ming Zeng, Zhong Zheng, Zesong Fei
来源/年份IEEE · IEEE Internet of Things Journal, 2025 · 2025
标识DOI 10.1109/JIOT.2025.3534462
任务语音低码率传输
是否严格数字语义通信核心
信道处理分类5. RVQ token + neural error suppression

实验设置

项目提取结果
数据集语音数据集;低码率 3 kb/s 实验。
Baseline传统 speech codec、JSCC、无 CNS/无 code predictor 变体。
评价指标语音质量、SNR、带宽节省、重建指标。
信道类型低 SNR channel;channel noise suppression (CNS) + code predictor。
实验条件3 kb/s 低码率,可节省至少 50% 带宽。

Introduction 讲述逻辑

  1. 现有进展:连续 DeepJSCC/任务导向 SemCom 已证明端到端语义传输可在低 SNR 或低带宽下优于传统分离式通信。
  2. 仍有问题:低码率下数字 SemCom 容易牺牲接收端任务/感知质量,语音尤其敏感。
  3. 为什么重要:数字语义通信必须进入现有 bit、调制、信道编码和硬件栈;一旦离散变量出错,语义 latent 可能发生非线性跳变。
  4. 本文方案:用 RVQGAN 获得低码率高质量语音 token,再用 CNS 与 predictor 抵抗信道噪声。
  5. 如何解决:生成式 decoder 补细节,CNS 消除低 SNR 特征污染,predictor 利用上下文修正 code。
  6. 核心观点:3 kb/s 下保持较高语音质量并在低 SNR 优于 baseline。

方法与数字化方案

技术路线:RVQGAN speech semantic codec。多尺度语义 codec 使用 RVQGAN 抽取语义 token/code indices;U-Net CNS 恢复受信道影响的语义 feature,Transformer predictor 修正 code。

实际传输单位:RVQ code index / low-bitrate token stream。码本/离散集合:有码本;Residual VQ 多阶段 codebooks。

传输开销推导:若 RVQ 每帧产生 L 个 codebook indices、每个 codebook K 阶,则帧开销 $$B_f=L\lceil\log_2K\rceil$$;总 bitrate $$R=B_f\times f_{frame}$$。论文直接给出 3 kb/s 工作点。

信道如何作用于离散变量

decoder 输入:decoder 收到可能受信道影响的 RVQ indices/semantic features,经 CNS/predictor 后重建。

错误建模/纠错机制:有面向 channel effect 的恢复模块,但 index bit error 的精确 BSC/BER 映射不如 Blind/ESC-MVQ 清晰。

Codex 判断:它是语音数字语义低码率方向的重要例子,强在生成式低码率和后处理鲁棒。

架构图与结果图

Low-Bitrate High-Quality Digital Semantic Communication Based on RVQGAN 方法页
方法/架构图页:来自《Low-Bitrate High-Quality Digital Semantic Communication Based on RVQGAN》PDF p.2。
Low-Bitrate High-Quality Digital Semantic Communication Based on RVQGAN 结果页
关键结果图/表页:来自《Low-Bitrate High-Quality Digital Semantic Communication Based on RVQGAN》PDF p.11,通常包含 SNR/PSNR/MS-SSIM/BER/Accuracy/码率等结果。

局限性

需要更透明的 bitstream/packet error 设置;生成式模型可能引入语义 hallucination。

Generative AI-Based Vector Quantized End-to-End Semantic Communication System for Wireless Image Transmission

字段内容
作者Maheshi Lokumarambage, Thushan Sivalingam, Feng Dong, Nandana Rajatheva, Anil Fernando
来源/年份IEEE · IEEE Transactions on Machine Learning in Communications and Networking, 2025 · 2025
标识DOI 10.1109/TMLCN.2025.3607891
任务无线图像传输,人/机感知
是否严格数字语义通信核心
信道处理分类2. VQ index + LDPC

实验设置

项目提取结果
数据集图像数据集;同时验证 human perception 和 machine perception task utility。
BaselineBPG、JSCC、LDPC 组合、无注意力/无对比损失变体。
评价指标PSNR、MS-SSIM/LPIPS、任务指标、复杂度、延迟。
信道类型LDPC 信道;低 SNR (<5 dB) 对比。
实验条件传输 quantized latent index;共享 codebook 作为知识库。

Introduction 讲述逻辑

  1. 现有进展:连续 DeepJSCC/任务导向 SemCom 已证明端到端语义传输可在低 SNR 或低带宽下优于传统分离式通信。
  2. 仍有问题:语义源编码要能泛化训练集外,同时低 SNR 下保持人/机感知质量。
  3. 为什么重要:数字语义通信必须进入现有 bit、调制、信道编码和硬件栈;一旦离散变量出错,语义 latent 可能发生非线性跳变。
  4. 本文方案:用 generative AI + VQ latent + 多层 contrastive objectives 训练端到端系统。
  5. 如何解决:attention 关注边缘,critic 约束分布真实,LDPC 负责无线 bit 可靠性。
  6. 核心观点:低 SNR 尤其 <5 dB 时优于 BPG,并以更低复杂度/延迟接近 JSCC。

方法与数字化方案

技术路线:VQ generative semantic codec。encoder 用 spatial attention 提取 latent,经 learned codebook VQ 后只发送 code index;生成式 decoder/critic 根据 quantized latent 重建。

实际传输单位:VQ index / LDPC-protected bits。码本/离散集合:有码本;shared knowledge base。

传输开销推导:若 latent map 尺寸为 h×w 且每位置一个 K 阶 index,$$B_{sem}=hw\lceil\log_2K\rceil$$;LDPC 后 $$B_{tx}=B_{sem}/R_c$$。论文强调相对 BPG/JSCC 的复杂度和低 SNR 表现,精确 bit ledger 需按 latent map/codebook 实验配置推导。

信道如何作用于离散变量

decoder 输入:decoder 接收 LDPC 恢复后的 index,或低 SNR 下残余错误较少的 bitstream。

错误建模/纠错机制:主要依靠 LDPC 抑制 bit error;生成式 decoder 可能容忍部分 latent 误差,但没有专门 index flip 训练。

Codex 判断:核心是生成式 VQ 数字语义图像系统,错误处理仍偏传统信道编码。

架构图与结果图

Generative AI-Based Vector Quantized End-to-End Semantic Communication System for Wireless Image Transmission 方法页
方法/架构图页:来自《Generative AI-Based Vector Quantized End-to-End Semantic Communication System for Wireless Image Transmission》PDF p.2。
Generative AI-Based Vector Quantized End-to-End Semantic Communication System for Wireless Image Transmission 结果页
关键结果图/表页:来自《Generative AI-Based Vector Quantized End-to-End Semantic Communication System for Wireless Image Transmission》PDF p.22,通常包含 SNR/PSNR/MS-SSIM/BER/Accuracy/码率等结果。

局限性

VQ index 错误语义跳变未充分建模;生成结果质量可能掩盖细节错误。

SQ-GAN: Semantic Image Communications Using Masked Vector Quantization

字段内容
作者Francesco Pezone, Sergio Barbarossa, Giuseppe Caire
来源/年份IEEE · IEEE Transactions on Cognitive Communications and Networking, 2025/2026 · 2025
标识IEEE Xplore
任务语义图像压缩/传输
是否严格数字语义通信相关核心:源编码强,信道弱
信道处理分类1. 数字语义源编码,弱信道建模

实验设置

项目提取结果
数据集Cityscapes 等语义分割图像数据集。
BaselineJPEG2000、BPG、deep-learning compression、VQ-GAN 变体。
评价指标perceptual quality、semantic segmentation accuracy、compression rate。
信道类型完全兼容 legacy source coding;物理信道不是主要变量。
实验条件极低 compression rates。

Introduction 讲述逻辑

  1. 现有进展:连续 DeepJSCC/任务导向 SemCom 已证明端到端语义传输可在低 SNR 或低带宽下优于传统分离式通信。
  2. 仍有问题:不是所有像素对任务都等价;传统压缩按视觉失真分配 bit,未利用语义类别重要性。
  3. 为什么重要:数字语义通信必须进入现有 bit、调制、信道编码和硬件栈;一旦离散变量出错,语义 latent 可能发生非线性跳变。
  4. 本文方案:把语义分割 mask 和 VQ-GAN 结合,只高质量编码任务重要区域。
  5. 如何解决:SAMM 和语义加权 loss 让压缩更服务于下游 segmentation/感知。
  6. 核心观点:极低码率下优于 BPG/JPEG2000 和深度压缩方法。

方法与数字化方案

技术路线:semantic mask + VQ-GAN。先用现成 semantic segmentation 得到类别重要性,SAMM 只编码任务相关区域/feature,再用 VQ-GAN codebook 表示。

实际传输单位:VQ token/index。码本/离散集合:有码本;VQ-GAN latent codebook。

传输开销推导:若 mask 后保留 N_m 个 latent positions,每个位置 K 阶 index,则 $$B_{sem}=N_m\lceil\log_2K\rceil$$;mask 直接降低 N_m。论文更关注 source compression rate,而非无线信道开销。

信道如何作用于离散变量

decoder 输入:decoder 假设收到无误 VQ token/index 或 legacy 系统传来的 bitstream。

错误建模/纠错机制:几乎不处理信道 bit/index error;它是语义源编码而不是完整信道语义通信。

Codex 判断:相关度高,但严格说是 digital semantic source coding;应与 UEP/CAVQ 结合才算完整 DSC 链路。

架构图与结果图

SQ-GAN: Semantic Image Communications Using Masked Vector Quantization 方法页
方法/架构图页:来自《SQ-GAN: Semantic Image Communications Using Masked Vector Quantization》PDF p.2。
SQ-GAN: Semantic Image Communications Using Masked Vector Quantization 结果页
关键结果图/表页:来自《SQ-GAN: Semantic Image Communications Using Masked Vector Quantization》PDF p.14,通常包含 SNR/PSNR/MS-SSIM/BER/Accuracy/码率等结果。

局限性

无线信道、误码、调制和信道编码分析不足。

Conditional Entropy-Constrained Multi-Stage Vector Quantization for Semantic Communication

字段内容
作者Junyong Shin, Jihun Park, Jinsung Park, Yo-Seb Jeon
来源/年份IEEE · IEEE Wireless Communications Letters, 2025/2026 · 2025
标识IEEE Xplore
任务图像语义传输/重建
是否严格数字语义通信核心
信道处理分类1. VQ 源编码与 rate control

实验设置

项目提取结果
数据集CIFAR-10 等。
Baselinesingle-stage VQ、MSVQ、ECVQ、现有 VQ-based SC。
评价指标task performance、rate-distortion、bitrate、codeword utilization。
信道类型数字语义链路;主要关注 rate-distortion,不强调物理信道错误。
实验条件selectively activating VQ modules 支持 multi-rate。

Introduction 讲述逻辑

  1. 现有进展:连续 DeepJSCC/任务导向 SemCom 已证明端到端语义传输可在低 SNR 或低带宽下优于传统分离式通信。
  2. 仍有问题:单阶段 VQ fixed-rate 且大码本复杂,MSVQ 虽灵活但不利用非均匀 codeword 分布。
  3. 为什么重要:数字语义通信必须进入现有 bit、调制、信道编码和硬件栈;一旦离散变量出错,语义 latent 可能发生非线性跳变。
  4. 本文方案:把 MSVQ 与 conditional entropy-constrained VQ 结合,实现更细粒度 rate control。
  5. 如何解决:Markovian stage model 让每 stage index 码长随条件概率缩短。
  6. 核心观点:在 CIFAR-10 等任务上用更低复杂度/码率获得更好语义 fidelity。

方法与数字化方案

技术路线:CEC-MSVQ。多阶段 VQ 逐步量化 residual;条件熵模型显式估计 stage-wise code distribution,训练 rate-distortion objective。

实际传输单位:multi-stage VQ index / entropy-coded bitstream。码本/离散集合:多阶段码本;每 stage 小 codebook。

传输开销推导:原始 MSVQ 开销 $$B=\sum_l N_l\log_2K_l$$;加入 conditional entropy coding 后期望码长 $$E[B]=\sum_l H(I_l|I_{<l})$$,低于固定长度索引。multi-rate 通过启用前 L' 个 stage 控制。

信道如何作用于离散变量

decoder 输入:decoder 接收 entropy-decoded indices,默认 bitstream 正确。

错误建模/纠错机制:没有重点建模 bit/index error;熵编码甚至可能放大 bit error 的同步问题,需要外部保护。

Codex 判断:它是 rate-control/entropy coding 路线的重要论文,但不解决信道错误跳变。

架构图与结果图

Conditional Entropy-Constrained Multi-Stage Vector Quantization for Semantic Communication 方法页
方法/架构图页:来自《Conditional Entropy-Constrained Multi-Stage Vector Quantization for Semantic Communication》PDF p.3。
Conditional Entropy-Constrained Multi-Stage Vector Quantization for Semantic Communication 结果页
关键结果图/表页:来自《Conditional Entropy-Constrained Multi-Stage Vector Quantization for Semantic Communication》PDF p.5,通常包含 SNR/PSNR/MS-SSIM/BER/Accuracy/码率等结果。

局限性

缺少 noisy channel 下的同步/误码恢复分析。

Rate-Adaptive Semantic Communication via Multi-Stage Vector Quantization

字段内容
作者Jinsung Park, Junyong Shin, Yongjeong Oh, Jihun Park, Yo-Seb Jeon
来源/年份arXiv · arXiv, 2025 · 2025
标识arXiv 2510.02646
任务图像语义重建,rate-adaptive
是否严格数字语义通信核心
信道处理分类1. MSVQ rate adaptation,弱信道错误

实验设置

项目提取结果
数据集CIFAR-10。
Baselinesingle-stage VQ、existing digital semantic communication methods。
评价指标semantic fidelity、rate、复杂度、module selection。
信道类型主要是 rate constraint;信道条件作为 rate adaptation 动因。
实验条件动态激活 stage 与 VQ modules;可结合 entropy coding。

Introduction 讲述逻辑

  1. 现有进展:连续 DeepJSCC/任务导向 SemCom 已证明端到端语义传输可在低 SNR 或低带宽下优于传统分离式通信。
  2. 仍有问题:固定 rate SC 无法适配动态无线环境,单大码本高复杂且易 collapse。
  3. 为什么重要:数字语义通信必须进入现有 bit、调制、信道编码和硬件栈;一旦离散变量出错,语义 latent 可能发生非线性跳变。
  4. 本文方案:用 MSVQ 分阶段增加语义精度,按 rate budget 激活模块。
  5. 如何解决:增量 allocation 找最能降低 task loss 的下一个模块,entropy coding 进一步利用非均匀分布。
  6. 核心观点:在 CIFAR-10 上较现有 VQ-based DSC 更高效且 rate 控制更细。

方法与数字化方案

技术路线:MSVQ-SC。多个 VQ stage 逐级细化 residual,每个 stage 中还有多个可选 VQ module;增量分配算法选择模块满足 rate constraint。

实际传输单位:multi-stage codebook index。码本/离散集合:有码本;多 stage/multi-module codebooks。

传输开销推导:固定长度时 $$B_{sem}=\sum_{active}N_l\lceil\log_2K_l\rceil$$;若加入 entropy coding,则用 codeword 概率得到期望码长。论文把 module selection 写成 rate-constrained loss minimization。

信道如何作用于离散变量

decoder 输入:decoder 收到被选择模块的 index 序列,默认正确解码。

错误建模/纠错机制:信道错误不是重点;如果某 stage index 错误,会污染 residual refinement,论文没有专门处理。

Codex 判断:它补足 rate adaptation,但应和 CAVQ/UEP/Blind Training 组合处理误码。

架构图与结果图

Rate-Adaptive Semantic Communication via Multi-Stage Vector Quantization 方法页
方法/架构图页:来自《Rate-Adaptive Semantic Communication via Multi-Stage Vector Quantization》PDF p.3。
Rate-Adaptive Semantic Communication via Multi-Stage Vector Quantization 结果页
关键结果图/表页:来自《Rate-Adaptive Semantic Communication via Multi-Stage Vector Quantization》PDF p.12,通常包含 SNR/PSNR/MS-SSIM/BER/Accuracy/码率等结果。

局限性

误码和 packet loss 下的级联 residual 失真有待研究。

VQ-DeepVSC: A Dual-Stage Vector Quantization Framework for Video Semantic Communication

字段内容
作者Yongyi Miao, Zhongdang Li, Yang Wang, Die Hu, Jun Yan, Youfang Wang
来源/年份arXiv · arXiv 2024; IEEE TWC version identified in search · 2024
标识arXiv 2409.03393; IEEE TWC 2026 version located but IEEE download timed out
任务视频语义传输
是否严格数字语义通信核心
信道处理分类5. video VQ + recovery,误码建模中等

实验设置

项目提取结果
数据集视频数据集;与 H.265 和 JSCC/DeepWiVe 类方法对比。
BaselineH.265、JSCC/DeepWiVe、普通关键帧或无二阶段 VQ 变体。
评价指标MS-SSIM、LPIPS、SNR、多径信道。
信道类型低 SNR 与 multipath fading channel。
实验条件adaptive key-frame extraction/interpolation + semantic VQ。

Introduction 讲述逻辑

  1. 现有进展:连续 DeepJSCC/任务导向 SemCom 已证明端到端语义传输可在低 SNR 或低带宽下优于传统分离式通信。
  2. 仍有问题:视频流冗余巨大,analog video JSCC 兼容性不足,传统 H.265 在低 SNR 下 cliff 明显。
  3. 为什么重要:数字语义通信必须进入现有 bit、调制、信道编码和硬件栈;一旦离散变量出错,语义 latent 可能发生非线性跳变。
  4. 本文方案:先语义选关键帧,再对关键帧 VQ 数字化,接收端插值恢复非关键帧。
  5. 如何解决:双阶段结构同时处理帧间冗余和帧内语义压缩,可调 index selection 控制码率。
  6. 核心观点:低 SNR/多径下 MS-SSIM 和 LPIPS 相比 H.265 有优势。

方法与数字化方案

技术路线:dual-stage VQ video SemCom。第一阶段选取/插值关键帧降低帧间冗余;第二阶段用 semantic VQ encoder/decoder 对关键帧做 index compression,并有 adjustable index selection/recovery。

实际传输单位:frame key index / VQ index。码本/离散集合:有码本;语义向量量化用于关键帧。

传输开销推导:视频开销约为关键帧数 $$T_k$$ 乘每帧 VQ index bits:$$B_{sem}=\sum_{t\in K}N_t\lceil\log_2K\rceil$$;帧间插值降低 $$T_k/T$$,adjustable index selection 改变 N_t。

信道如何作用于离散变量

decoder 输入:decoder 收到关键帧的 VQ indices;错误 index 的恢复主要由 recovery module 和上下文插值缓解。

错误建模/纠错机制:考虑低 SNR/多径性能,但 index bit error 的明确概率模型不如 BSC 类论文。

Codex 判断:它把数字 VQ 扩展到视频,非常重要;信道错误处理仍偏经验模块。

架构图与结果图

VQ-DeepVSC: A Dual-Stage Vector Quantization Framework for Video Semantic Communication 方法页
方法/架构图页:来自《VQ-DeepVSC: A Dual-Stage Vector Quantization Framework for Video Semantic Communication》PDF p.3。
VQ-DeepVSC: A Dual-Stage Vector Quantization Framework for Video Semantic Communication 结果页
关键结果图/表页:来自《VQ-DeepVSC: A Dual-Stage Vector Quantization Framework for Video Semantic Communication》PDF p.9,通常包含 SNR/PSNR/MS-SSIM/BER/Accuracy/码率等结果。

局限性

需 IEEE 版本全文补验;arXiv 版对标准 channel coding 与 bit ledger 仍可更细。

Activation Map-based Vector Quantization for 360-degree Image Semantic Communication

字段内容
作者Yang Ma, Wenchi Cheng, Jingqing Wang, Wei Zhang
来源/年份arXiv · arXiv, 2024 · 2024
标识arXiv 2406.04740
任务360 度图像语义传输
是否严格数字语义通信核心
信道处理分类1. VQ 源编码,弱信道建模

实验设置

项目提取结果
数据集360-degree image 数据集。
Baseline传统 coding、DL-based coding、普通 VQ。
评价指标重建质量、相同 transmission symbols 下性能。
信道类型无线传输;信道细节较弱。
实验条件activation map 自适应量化,GAN discriminator。

Introduction 讲述逻辑

  1. 现有进展:连续 DeepJSCC/任务导向 SemCom 已证明端到端语义传输可在低 SNR 或低带宽下优于传统分离式通信。
  2. 仍有问题:360 图像数据量大且几何失真特殊,普通压缩没有利用语义/视场重要性。
  3. 为什么重要:数字语义通信必须进入现有 bit、调制、信道编码和硬件栈;一旦离散变量出错,语义 latent 可能发生非线性跳变。
  4. 本文方案:用 activation map 引导 VQ,减少不重要区域的量化开销。
  5. 如何解决:GAN 对抗训练增强视觉质量,VQ 保证数字兼容。
  6. 核心观点:相同传输符号数下优于传统和 DL-based coding。

方法与数字化方案

技术路线:AM-VQ。DNN 提取 360 图像语义 feature;activation map 衡量区域/feature 重要性并自适应 VQ,GAN 判别器提升重建。

实际传输单位:VQ index。码本/离散集合:有码本;activation map 决定量化强度/选择。

传输开销推导:若按 activation map 保留/量化 N_a 个 feature index,则 $$B_{sem}=N_a\lceil\log_2K\rceil$$;论文以 same transmission symbols 比较,具体压缩率由 N_a 和 K 推导。

信道如何作用于离散变量

decoder 输入:decoder 默认接收恢复后的 VQ indices。

错误建模/纠错机制:信道错误不是核心;若 index 错误,论文没有显式邻近 codeword 或 UEP 机制。

Codex 判断:源编码/重要性量化有价值,但离散变量过信道的错误问题还未真正展开。

架构图与结果图

Activation Map-based Vector Quantization for 360-degree Image Semantic Communication 方法页
方法/架构图页:来自《Activation Map-based Vector Quantization for 360-degree Image Semantic Communication》PDF p.2。
Activation Map-based Vector Quantization for 360-degree Image Semantic Communication 结果页
关键结果图/表页:来自《Activation Map-based Vector Quantization for 360-degree Image Semantic Communication》PDF p.6,通常包含 SNR/PSNR/MS-SSIM/BER/Accuracy/码率等结果。

局限性

需要纳入 BSC/OFDM/UEP 实验才能成为完整 DSC 方案。

Vision Transformer-Based Semantic Communications With Importance-Aware Quantization

字段内容
作者Joohyuk Park, Yongjeong Oh, Yongjune Kim, Yo-Seb Jeon
来源/年份IEEE · IEEE Internet of Things Journal, 2025 · 2025
标识IEEE Xplore
任务图像分类、多视图分类、目标检测
是否严格数字语义通信核心
信道处理分类4. 显式建模离散错误并联合优化

实验设置

项目提取结果
数据集CIFAR-100、多视图图像分类数据集、目标检测数据集。
BaselineJPEG/BPG、均匀 bit allocation、其他 quantization baselines。
评价指标Accuracy/mAP、bit budget、BSC 下性能。
信道类型BSC 等效数字链路;扩展到 erroneous communication。
实验条件bit budget constraint;patch-wise Mi bits;Badd overhead。

Introduction 讲述逻辑

  1. 现有进展:连续 DeepJSCC/任务导向 SemCom 已证明端到端语义传输可在低 SNR 或低带宽下优于传统分离式通信。
  2. 仍有问题:端到端训练 SemCom 成本高;不同 patch 语义重要性不同,均匀量化浪费 bit。
  3. 为什么重要:数字语义通信必须进入现有 bit、调制、信道编码和硬件栈;一旦离散变量出错,语义 latent 可能发生非线性跳变。
  4. 本文方案:用 ViT attention 直接做重要性估计,不依赖重新训练 encoder/decoder。
  5. 如何解决:增量算法/水填充求解 bit allocation;BSC 扩展把 bit error 对量化误差的影响写入目标。
  6. 核心观点:在分类、多视图和检测任务中用更少 bit 达到更高任务性能。

方法与数字化方案

技术路线:ViT IAQ。预训练 ViT attention score 衡量 patch 重要性;为每个 patch 分配不同 quantization bits Mi,并把 bit sequence 过 BSC。

实际传输单位:patch-wise quantized bit sequence。码本/离散集合:无 VQ 码本;使用 uniform quantizer 和可变 bit depth。

传输开销推导:论文明确定义总 bit 长度 $$B=P^2C\sum_{i=1}^N M_i$$,另有 $$B_{add}$$ 传输量化器信息;原图 bit 为 $$HWC\times8$$,压缩率可由 $$B+B_{add}$$ 对比得到。

信道如何作用于离散变量

decoder 输入:decoder 收到可能有 bit error 的 patch-wise bit sequence,再反量化成图像/feature。

错误建模/纠错机制:显式讨论 one-bit error 导致量化值偏移,并用 BSC 重新构造分配问题;但不涉及 VQ index 跳到远端 codeword。

Codex 判断:这是 bit-level 错误建模很清楚的数字语义量化论文,尤其适合任务导向视觉。

架构图与结果图

Vision Transformer-Based Semantic Communications With Importance-Aware Quantization 方法页
方法/架构图页:来自《Vision Transformer-Based Semantic Communications With Importance-Aware Quantization》PDF p.3。
Vision Transformer-Based Semantic Communications With Importance-Aware Quantization 结果页
关键结果图/表页:来自《Vision Transformer-Based Semantic Communications With Importance-Aware Quantization》PDF p.12,通常包含 SNR/PSNR/MS-SSIM/BER/Accuracy/码率等结果。

局限性

依赖 ViT attention 作为重要性代理;对生成/重建质量和复杂 channel coding 的扩展有限。

sDMCM—A Semantic Digital Modulation Constellation Mapping Scheme for Semantic Communication

字段内容
作者Lei Teng, Wannian An, Chen Dong, Xiaodong Xu
来源/年份IEEE · IEEE Internet of Things Journal, 2025 · 2025
标识DOI 10.1109/JIOT.2025.3545667
任务语义图像/工业 IoT 图像传输中的调制映射
是否严格数字语义通信核心
信道处理分类5. semantic-aware modulation mapping

实验设置

项目提取结果
数据集图像语义通信系统 LSCI、工业 IoT STSCI。
BaselineGray、Pseudo-Gray、Structural Quadrant (SQ) mapping。
评价指标MSE、MS-SSIM、BER、SNR;理论与仿真曲线。
信道类型AWGN;PAM/QAM;不同 quantization bit number n 与 modulation parameter m。
实验条件16-QAM、256-QAM,n=m/n>m/n<m 多情形。

Introduction 讲述逻辑

  1. 现有进展:连续 DeepJSCC/任务导向 SemCom 已证明端到端语义传输可在低 SNR 或低带宽下优于传统分离式通信。
  2. 仍有问题:传统 Gray mapping 优化 BER,不优化语义数值 MSE;同样 BER 下语义值错误大小可能差异巨大。
  3. 为什么重要:数字语义通信必须进入现有 bit、调制、信道编码和硬件栈;一旦离散变量出错,语义 latent 可能发生非线性跳变。
  4. 本文方案:以 semantic information MSE 为目标重新设计 PAM/QAM 映射。
  5. 如何解决:利用 bit 位可靠性差异,把量化语义值的 MSB 等重要位放到更可靠位置。
  6. 核心观点:相同 MS-SSIM 下可容忍约 3 dB SNR 降低;IIoT 图像中指针/仪表盘更清晰。

方法与数字化方案

技术路线:semantic digital constellation mapping。不改变上游语义 encoder,而重新设计 semantic information value 的 bit-to-constellation mapping,使重要 bit 位落在更可靠星座位。

实际传输单位:quantized semantic bit / modulation symbol。码本/离散集合:无 VQ 码本;核心是 constellation mapping/interleaving 表。

传输开销推导:若语义值量化为 n bits、调制为 m-bit PAM/QAM,则每个符号承载 m bits;传统方式可能需要 $$\lceil n/m\rceil$$ 次传输,sDMCM 在 n<m 时可让一个高阶星座承载多个语义值。论文还给出例子:4 个 2-bit 语义值传统 16-QAM 需 8 次传输,而 m=4 的 256-QAM 可减少次数。

信道如何作用于离散变量

decoder 输入:decoder 收到有 bit/symbol error 的调制结果,再通过 sDMCM 反映射得到量化语义值。

错误建模/纠错机制:非常明确处理 bit/symbol error,但不是让错误消失,而是让错误造成的语义数值 MSE 尽量小。

Codex 判断:这是物理层 mapping 直接服务语义误差的典型论文,可与 VQ index assignment 类工作互补。

架构图与结果图

sDMCM—A Semantic Digital Modulation Constellation Mapping Scheme for Semantic Communication 方法页
方法/架构图页:来自《sDMCM—A Semantic Digital Modulation Constellation Mapping Scheme for Semantic Communication》PDF p.3。
sDMCM—A Semantic Digital Modulation Constellation Mapping Scheme for Semantic Communication 结果页
关键结果图/表页:来自《sDMCM—A Semantic Digital Modulation Constellation Mapping Scheme for Semantic Communication》PDF p.15,通常包含 SNR/PSNR/MS-SSIM/BER/Accuracy/码率等结果。

局限性

主要针对标量量化语义值;复杂 learned VQ codebook 的高维语义距离需要进一步定义。

Less Signals, More Understanding: Channel-Capacity Codebook Design for Digital Task-Oriented Semantic Communication

字段内容
作者Anbang Zhang, Shuaishuai Guo, Chenyuan Feng, Hongyang Du, Haojin Li, Chen Sun, Haijun Zhang
来源/年份arXiv · arXiv, 2025 · 2025
标识arXiv 2508.04291
任务任务导向语义推理
是否严格数字语义通信核心
信道处理分类5. channel-aware codebook design

实验设置

项目提取结果
数据集多 SNR 下 inference tasks。
Baseline常规离散 ToSC、未考虑 channel capacity 的 codebook。
评价指标task accuracy、semantic fidelity、SNR robustness、communication efficiency。
信道类型SNR regimes;channel-aware discrete semantic coding。
实验条件Wasserstein-regularized objective 对齐 code activation 与 optimal input distribution。

Introduction 讲述逻辑

  1. 现有进展:连续 DeepJSCC/任务导向 SemCom 已证明端到端语义传输可在低 SNR 或低带宽下优于传统分离式通信。
  2. 仍有问题:现有离散 ToSC 常把语义映射与信道容量/任务需求分开,导致 codebook 使用不匹配。
  3. 为什么重要:数字语义通信必须进入现有 bit、调制、信道编码和硬件栈;一旦离散变量出错,语义 latent 可能发生非线性跳变。
  4. 本文方案:把 codebook 设计和 channel capacity 关联,用 Wasserstein 正则调节 activation。
  5. 如何解决:让有限 codewords 的使用接近信道最适输入,同时保持任务语义可分。
  6. 核心观点:多 SNR inference tasks 中 accuracy 与效率提升。

方法与数字化方案

技术路线:channel-capacity codebook。离散 codebook 把语义 feature 空间划为 Voronoi/indices;训练时把 code activation 分布和信道容量诱导的最优输入分布对齐。

实际传输单位:codebook index。码本/离散集合:有码本;重点是 codebook size 与 activation distribution。

传输开销推导:固定长度索引开销 $$B_{sem}=N\lceil\log_2K\rceil$$;论文还从信道容量角度讨论 optimal codebook usage。若 code activation entropy 小于 $$\log_2K$$,可用 entropy coding 进一步降至 $$NH(I)$$。

信道如何作用于离散变量

decoder 输入:decoder 收到离散 indices;主要假设离散信道容量约束而非逐 bit 错误恢复。

错误建模/纠错机制:考虑 channel-aware codebook,但对具体 index bit flip 的处理不如 CAVQ。

Codex 判断:理论上补充“码本怎么和信道容量匹配”,对未来 codebook 设计有启发。

架构图与结果图

Less Signals, More Understanding: Channel-Capacity Codebook Design for Digital Task-Oriented Semantic Communication 方法页
方法/架构图页:来自《Less Signals, More Understanding: Channel-Capacity Codebook Design for Digital Task-Oriented Semantic Communication》PDF p.2。
Less Signals, More Understanding: Channel-Capacity Codebook Design for Digital Task-Oriented Semantic Communication 结果页
关键结果图/表页:来自《Less Signals, More Understanding: Channel-Capacity Codebook Design for Digital Task-Oriented Semantic Communication》PDF p.7,通常包含 SNR/PSNR/MS-SSIM/BER/Accuracy/码率等结果。

局限性

arXiv 新作,需更多真实链路和标准调制验证。

A Theoretically-Grounded Codebook for Digital Semantic Communications

字段内容
作者Lingyi Wang, Rashed Shelim, Walid Saad, Naren Ramakrishnan
来源/年份arXiv · arXiv, 2025 · 2025
标识arXiv 2510.07108
任务数字语义通信码本理论
是否严格数字语义通信核心
信道处理分类5. 理论 bit-flip / codebook 分析

实验设置

项目提取结果
数据集理论与仿真实验。
Baseline常规 VQ/codebook training、无熵正则或无 bit-flip 分析变体。
评价指标mutual information、semantic distortion、codebook size、bit-flip robustness。
信道类型bit-flip errors 下的 semantic distortion。
实验条件推导 optimal codebook size 与 entropy-regularized quantization loss。

Introduction 讲述逻辑

  1. 现有进展:连续 DeepJSCC/任务导向 SemCom 已证明端到端语义传输可在低 SNR 或低带宽下优于传统分离式通信。
  2. 仍有问题:VQ 码本常经验训练,缺少语义信息论解释;K 越大不一定越好,因为 bit-flip 后误差可能更大。
  3. 为什么重要:数字语义通信必须进入现有 bit、调制、信道编码和硬件栈;一旦离散变量出错,语义 latent 可能发生非线性跳变。
  4. 本文方案:用互信息和熵正则建立 codebook 训练目标,并分析物理信道 bit-flip 造成的语义失真。
  5. 如何解决:把 semantic mapping、quantization partition 和 channel-induced distortion 放到同一理论框架。
  6. 核心观点:说明合理 K 和 entropy regularization 能改善数字语义鲁棒性。

方法与数字化方案

技术路线:theoretical codebook。把语义同义一对多映射与 VQ Voronoi partition 对应,最大化语义 feature 与 quantized index 的互信息。

实际传输单位:codebook index。码本/离散集合:有码本;理论讨论 K 的选择。

传输开销推导:基础开销 $$B_{sem}=N\lceil\log_2K\rceil$$;理论部分把 K 增大带来的量化信息增益与 bit-flip 造成的 semantic distortion 平衡,给出 optimal codebook size 的判断。

信道如何作用于离散变量

decoder 输入:decoder 收到可能因 bit flip 错误的 index。

错误建模/纠错机制:明确讨论 bit-flip errors 和 semantic distortion,但偏理论,不是完整系统。

Codex 判断:它解释了为什么“更大码本/更细 index”可能在有误码信道下反而危险。

架构图与结果图

A Theoretically-Grounded Codebook for Digital Semantic Communications 方法页
方法/架构图页:来自《A Theoretically-Grounded Codebook for Digital Semantic Communications》PDF p.2。
A Theoretically-Grounded Codebook for Digital Semantic Communications 结果页
关键结果图/表页:来自《A Theoretically-Grounded Codebook for Digital Semantic Communications》PDF p.6,通常包含 SNR/PSNR/MS-SSIM/BER/Accuracy/码率等结果。

局限性

需要和具体神经架构、调制/信道编码联合验证。

Joint Semantic-Channel Coding and Modulation for Token Communications

字段内容
作者Jingkai Ying, Zhijin Qin, Yulong Feng, Liejun Wang, Xiaoming Tao
来源/年份arXiv · arXiv, 2025 · 2025
标识arXiv 2511.15699
任务token/prompt 通信,多模态 Transformer token
是否严格数字语义通信核心
信道处理分类5. token-level JSCC / modulation

实验设置

项目提取结果
数据集文本、音频、图像/视频/点云 token 任务。
Baseline传统 token transmission、separate source-channel coding、固定 modulation baseline。
评价指标token reconstruction/task performance、BER/SNR、latency/overhead。
信道类型无线信道;joint semantic-channel coding and modulation。
实验条件面向 Transformer token 的 task-oriented transmission。

Introduction 讲述逻辑

  1. 现有进展:连续 DeepJSCC/任务导向 SemCom 已证明端到端语义传输可在低 SNR 或低带宽下优于传统分离式通信。
  2. 仍有问题:大模型时代 token 是统一语义单位,但现有通信仍把 token 当普通 bits 可靠传。
  3. 为什么重要:数字语义通信必须进入现有 bit、调制、信道编码和硬件栈;一旦离散变量出错,语义 latent 可能发生非线性跳变。
  4. 本文方案:把 token 的语义重要性直接纳入 source-channel coding 和 modulation。
  5. 如何解决:对 token sequence 设计任务导向的联合编码调制,使错误 token 对下游任务影响更小。
  6. 核心观点:预期在多模态 token 任务中降低开销并提升错误鲁棒性。

方法与数字化方案

技术路线:token JSCC-modulation。把 tokenizer 产生的离散 token 当作通信基本单元,联合设计 token semantic coding、channel coding 和 modulation。

实际传输单位:token index / bit / modulation symbol。码本/离散集合:token vocabulary 本身就是 codebook;可能另有 task-specific token mapping。

传输开销推导:若 vocab 大小为 V、发送 T 个 token,最朴素开销 $$B_{sem}=T\lceil\log_2V\rceil$$;若引入语义信道编码和 modulation,则实际 $$B_{tx}$$ 取决于冗余和 $$\log_2M$$。压缩来自减少 token 数或改变 token 重要性保护。

信道如何作用于离散变量

decoder 输入:decoder 收到可能错误/受保护等级不同的 token 或 token bits。

错误建模/纠错机制:论文方向正对 token index error;细节取决于 token-channel mapping 和冗余设计。

Codex 判断:它把数字语义通信从 VQ image codebook 推向大模型 token 通信,是重要未来路线。

架构图与结果图

Joint Semantic-Channel Coding and Modulation for Token Communications 方法页
方法/架构图页:来自《Joint Semantic-Channel Coding and Modulation for Token Communications》PDF p.1。
Joint Semantic-Channel Coding and Modulation for Token Communications 结果页
关键结果图/表页:来自《Joint Semantic-Channel Coding and Modulation for Token Communications》PDF p.13,通常包含 SNR/PSNR/MS-SSIM/BER/Accuracy/码率等结果。

局限性

arXiv 较新;需要更多公开基准和标准 PHY 链路验证。