架构或方法图截图页。来源:Semantic Communication With Adaptive Universal Transformer。关键结果图/表截图页。来源:Semantic Communication With Adaptive Universal Transformer。
Adaptive Bit Rate Control in Semantic Communication With Incremental Knowledge-Based HARQ
2022数字式文本 SemCom核心
基本信息
Qing Zhou, Rongpeng Li, Zhifeng Zhao, Chenghui Peng, Hang Zhang。IEEE Open Journal of the Communications Society, 2022。来源:IEEE / arXiv;标识:arXiv:2203.06634; DOI 10.1109/OJCOMS.2022.3189023。 外部来源。
架构或方法图截图页。来源:Adaptive Bit Rate Control in Semantic Communication With Incremental Knowledge-Based HARQ。关键结果图/表截图页。来源:Adaptive Bit Rate Control in Semantic Communication With Incremental Knowledge-Based HARQ。
Channel-Adaptive Wireless Image Transmission With OFDM
2022模拟式 OFDM DeepJSCC相关核心
基本信息
Tao Wu, Zhongwei Si, Jincheng Dai, Kai Niu, Mingyu Lu, Hang Zhang。IEEE Wireless Communications Letters, 2022。来源:IEEE / arXiv;标识:arXiv:2205.02417; DOI 10.1109/LWC.2022.3204837。 外部来源。
以 Vision Transformer 为 backbone,编码器/解码器中注入 rate/SNR side information。模型通过 latent-channel prioritization 或 truncation 控制发送维度,按目标 bandwidth ratio 截取相应数量的 channel symbols。
不固定传输符号的具体方式
可控轴:目标 bandwidth ratio 与 SNR 作为 side information 控制信号:target bandwidth ratio、SNR、图像内容 符号/码率灵活性:一个 ViT/DeepJSCC-l++ 模型覆盖多带宽和多 SNR,无需为每个 bandwidth ratio 单独训练。
信道处理
AWGN/fading 下的连续符号传输,SNR 作为条件输入。decoder 接收的是被噪声污染且长度由 bandwidth ratio 控制的 latent。
主要结果
单一模型在多个 bandwidth ratio 下接近或超过多模型 baseline,显著提升部署灵活性。
架构或方法图截图页。来源:DeepJSCC-l++: Robust and Bandwidth-Adaptive Wireless Image Transmission。关键结果图/表截图页。来源:DeepJSCC-l++: Robust and Bandwidth-Adaptive Wireless Image Transmission。
Improved Nonlinear Transform Source-Channel Coding to Catalyze Semantic Communications
2023模拟式 enhanced NTSCC核心
基本信息
Sixian Wang, Jincheng Dai, Kailin Tan, Zhongwei Si, Kai Niu, Mingyu Lu, Hang Zhang, Ping Zhang。IEEE Journal of Selected Topics in Signal Processing, 2023。来源:IEEE / arXiv;标识:arXiv:2303.14637; DOI 10.1109/JSTSP.2023.3304140。 外部来源。
架构或方法图截图页。来源:Predictive and Adaptive Deep Coding for Wireless Image Transmission in Semantic Communication。关键结果图/表截图页。来源:Predictive and Adaptive Deep Coding for Wireless Image Transmission in Semantic Communication。
Semantic Communications With Variable-Length Coding for Extended Reality
2023数字/语义信道编码,XR核心
基本信息
Wenhao Zhang, Yang Shi, H. Vincent Poor, Shuguang Cui。IEEE Journal of Selected Topics in Signal Processing, 2023。来源:IEEE / arXiv;标识:arXiv:2302.08645; DOI 10.1109/JSTSP.2023.3300509。 外部来源。
实验场景较专,rate allocation network 的泛化依赖训练分布;对真实 packet loss / HARQ 的处理仍有限。
架构或方法图截图页。来源:Semantic Communications With Variable-Length Coding for Extended Reality。关键结果图/表截图页。来源:Semantic Communications With Variable-Length Coding for Extended Reality。
Toward Adaptive Semantic Communications: Efficient Data Transmission via Online Learned Nonlinear Transform Source-Channel Coding
2023模拟式 online-adaptive NTSCC核心
基本信息
Jincheng Dai, Kailin Tan, Sixian Wang, Zhongwei Si, Kai Niu, Mingyu Lu, Hang Zhang, Ping Zhang。IEEE Journal on Selected Areas in Communications, 2023。来源:IEEE / arXiv;标识:arXiv:2211.04339; DOI 10.1109/JSAC.2023.3288246。 外部来源。
架构或方法图截图页。来源:WITT: A Wireless Image Transmission Transformer for Semantic Communications。关键结果图/表截图页。来源:WITT: A Wireless Image Transmission Transformer for Semantic Communications。
Deep Joint Source-Channel Coding for Adaptive Image Transmission Over MIMO Channels
2024模拟式 MIMO DeepJSCC相关核心
基本信息
Tao Wu, Jincheng Dai, Sixian Wang, Zhongwei Si, Kai Niu, Ping Zhang。IEEE Transactions on Wireless Communications, 2024。来源:IEEE / arXiv;标识:arXiv:2309.00470; IEEE 10597355。 外部来源。
任务与实验
Kodak/CLIC 等图像;baseline 包括传统 MIMO 传输、DeepJSCC、channel-adaptive OFDM/JSCC;指标为 PSNR/MS-SSIM 和多天线/SNR 设置。
Introduction 讲述逻辑
SISO/AWGN 下训练的 DeepJSCC 难以应对 MIMO 信道矩阵、空间流和天线数变化。论文用 Transformer 自注意力建模源特征与 MIMO 信道之间的耦合,实现 channel-adaptive 语义映射。
可控机制与方法细节
编码器提取图像 token/latent;CSI embedding 注入 Transformer,使网络学习在不同空间子信道上分配语义特征和功率。接收端使用对应 MIMO 检测/解码和语义 decoder 重建图像。
MIMO fading + AWGN。信道影响连续 latent,decoder 接收 MIMO 检测后的带噪表示。
主要结果
在不同天线数和 SNR 条件下比固定映射更稳,说明信道矩阵可作为语义编码控制信号。
为何不是纯优化式论文
CSI 被注入编码网络并改变特征映射,不是外部资源分配。
局限性与 Codex 判断
payload 数量通常按配置固定;可控性更偏物理层适配。
架构或方法图截图页。来源:Deep Joint Source-Channel Coding for Adaptive Image Transmission Over MIMO Channels。关键结果图/表截图页。来源:Deep Joint Source-Channel Coding for Adaptive Image Transmission Over MIMO Channels。
Rate-Adaptive Coding Mechanism for Semantic Communications With Multi-Modal Data
2024数字/多模态 SemCom边界核心
基本信息
Zhenzi Zhang, Mingzhe Chen, Walid Saad, Merouane Debbah, et al.。IEEE Transactions on Communications, 2024。来源:IEEE / arXiv;标识:arXiv:2305.10773; IEEE 10327757。 外部来源。
相当一部分设计靠 channel coding/UEP,离散语义 token 本身的 index error 建模不如 VQ 系列深入。
架构或方法图截图页。来源:Rate-Adaptive Coding Mechanism for Semantic Communications With Multi-Modal Data。关键结果图/表截图页。来源:Rate-Adaptive Coding Mechanism for Semantic Communications With Multi-Modal Data。
SCAN: Semantic Communication With Adaptive Channel Feedback
2024模拟式 MIMO SemCom核心
基本信息
Zhenzi Zhang, Mingzhe Chen, Walid Saad, Merouane Debbah, Chau Yuen。IEEE Transactions on Cognitive Communications and Networking, 2024。来源:IEEE / arXiv;标识:arXiv:2306.15534; DOI 10.1109/TCCN.2024.3394867。 外部来源。
架构或方法图截图页。来源:DD-JSCC: Dynamic Deep Joint Source-Channel Coding for Semantic Communications。关键结果图/表截图页。来源:DD-JSCC: Dynamic Deep Joint Source-Channel Coding for Semantic Communications。
Digital Semantic Communications With Variable Product Quantization for Image Transmission
离散 index 通常通过数字链路传输,信道错误主要交给传统信道编码;论文重点是可变 PQ 源编码。
主要结果
在多码率下比固定 VQ/PQ 更灵活,低码率可保持较好语义质量。
为何不是纯优化式论文
控制点是 VPQ 量化结构和 codebook 使用方式。
局限性与 Codex 判断
子 index 一旦误判会映射到不同 codeword;若没有 joint channel-aware index assignment,语义跳变仍是风险。
架构或方法图截图页。来源:Digital Semantic Communications With Variable Product Quantization for Image Transmission。关键结果图/表截图页。来源:Digital Semantic Communications With Variable Product Quantization for Image Transmission。
Digital-SC: Digital Semantic Communication With Adaptive Network Split and Learned Non-Linear Quantization
2025数字式 split-computing SemCom核心
基本信息
Lei Guo, Wei Chen, Yuxuan Sun, Bo Ai。IEEE Transactions on Cognitive Communications and Networking, 2025。来源:IEEE;标识:DOI 10.1109/TCCN.2024.3510586; IEEE 10772628。 外部来源。
架构或方法图截图页。来源:Digital-SC: Digital Semantic Communication With Adaptive Network Split and Learned Non-Linear Quantization。关键结果图/表截图页。来源:Digital-SC: Digital Semantic Communication With Adaptive Network Split and Learned Non-Linear Quantization。
Entropy-and-Channel-Aware Adaptive-Rate Semantic Communication With MLLM-Aided Feature Compensation
MLLM/InternViT 补偿带来模型规模和部署成本;论文把 mask/cut-off side information 开销简化为很小,实际链路仍需协议验证。
架构或方法图截图页。来源:Entropy-and-Channel-Aware Adaptive-Rate Semantic Communication With MLLM-Aided Feature Compensation。关键结果图/表截图页。来源:Entropy-and-Channel-Aware Adaptive-Rate Semantic Communication With MLLM-Aided Feature Compensation。
Fully Learnable Multi-Rate Quantization for Digital Semantic Communication Systems
2025数字式 learnable multi-rate quantization核心
基本信息
Minhoe Kim, Dong Jin Ji。IEEE Wireless Communications Letters, 2025。来源:IEEE;标识:DOI 10.1109/LWC.2025.3581374。 外部来源。
任务与实验
图像传输;baseline 包括固定 bit-depth 量化、VQ/PQ、模拟 DeepJSCC;指标为重建质量与 bit rate。
数字 bitstream 可接传统 channel coding;部分实验显式考虑 BER 或离散错误。decoder 接收量化后的数字表示。
主要结果
多 rate 下比固定量化器更平滑,降低多模型维护成本。
为何不是纯优化式论文
可控性来自 learnable quantizer 本身。
局限性与 Codex 判断
Concrete 松弛和真实硬判决之间仍可能有 gap;强信道错误下 index 语义距离未必被优化。
架构或方法图截图页。来源:Fully Learnable Multi-Rate Quantization for Digital Semantic Communication Systems。关键结果图/表截图页。来源:Fully Learnable Multi-Rate Quantization for Digital Semantic Communication Systems。
Hybrid Digital-Analog Semantic Communications
2025混合数字-模拟 SemCom核心
基本信息
Huiqiang Xie, Zhijin Qin, Xiaoming Tao, et al.。IEEE Journal on Selected Areas in Communications, 2025。来源:IEEE / arXiv;标识:arXiv:2405.12580; DOI 10.1109/JSAC.2025.3559149。 外部来源。
任务与实验
图像语义传输实验;baseline 包括 analog DeepJSCC、digital semantic coding、BPG/LDPC 等;指标为 PSNR/MS-SSIM/LPIPS 和 rate。
Joint Source-Channel Coding for Channel-Adaptive Digital Semantic Communications
2025数字式 channel-adaptive DSC核心
基本信息
Joohyuk Park, Yongjeong Oh, Seonjung Kim, Yo-Seb Jeon。IEEE Transactions on Cognitive Communications and Networking, 2025。来源:IEEE;标识:DOI 10.1109/TCCN.2024.3422496。 外部来源。
架构或方法图截图页。来源:Joint Source-Channel Coding for Channel-Adaptive Digital Semantic Communications。关键结果图/表截图页。来源:Joint Source-Channel Coding for Channel-Adaptive Digital Semantic Communications。
Progressive Learned Image Transmission for Semantic Communication Using Hierarchical VAE
2025生成式/渐进式 SemCom核心
基本信息
Wenhao Zhang, et al.。IEEE Transactions on Cognitive Communications and Networking, 2025。来源:IEEE / arXiv;标识:arXiv:2408.16340; DOI 10.1109/TCCN.2025.3546935。 外部来源。
架构或方法图截图页。来源:Progressive Learned Image Transmission for Semantic Communication Using Hierarchical VAE。关键结果图/表截图页。来源:Progressive Learned Image Transmission for Semantic Communication Using Hierarchical VAE。
Rate-Adaptive Generative Semantic Communication Using Conditional Diffusion Models
2025生成式 rate-adaptive SemCom核心
基本信息
Ke Yang, Jincheng Dai, Sixian Wang, Kailin Tan, Kai Niu, Ping Zhang。IEEE Wireless Communications Letters, 2025。来源:IEEE / arXiv;标识:arXiv:2409.02597; DOI 10.1109/LWC.2024.3515656。 外部来源。
rate control 与 diffusion conditional decoder 共同构成通信方法。
局限性与 Codex 判断
扩散推理成本高,且低语义条件下可能引入非真实细节。
架构或方法图截图页。来源:Rate-Adaptive Generative Semantic Communication Using Conditional Diffusion Models。关键结果图/表截图页。来源:Rate-Adaptive Generative Semantic Communication Using Conditional Diffusion Models。
Rate-Adaptive Semantic Communication via Multi-Stage Vector Quantization
2025数字式 MSVQ SemCom核心
基本信息
Jinsung Park, Junyong Shin, Yongjeong Oh, Jihun Park, Yo-Seb Jeon。arXiv preprint, 2025。来源:arXiv;标识:arXiv:2510.02646。 外部来源。
主要关注数字 VQ index payload;信道错误处理较弱,通常依赖可靠数字链路或传统 channel coding。
主要结果
多 stage 结构提供平滑 rate-quality 曲线,一个模型覆盖多个 rate。
为何不是纯优化式论文
可控性来自 multi-stage codebook 架构,不是外层分配模型。
局限性与 Codex 判断
如果后续 residual index 出错,误差如何传播到语义 latent 仍需更细的信道联合训练。
架构或方法图截图页。来源:Rate-Adaptive Semantic Communication via Multi-Stage Vector Quantization。关键结果图/表截图页。来源:Rate-Adaptive Semantic Communication via Multi-Stage Vector Quantization。
Rate-Distortion-Perception Controllable Joint Source-Channel Coding for High-Fidelity Generative Semantic Communications
2025生成式模拟 JSCC核心
基本信息
Kailin Tan, Jincheng Dai, Sixian Wang, Zhongwei Si, Kai Niu, Ping Zhang。IEEE Transactions on Cognitive Communications and Networking, 2025。来源:IEEE / arXiv;标识:arXiv:2408.14127; DOI 10.1109/TCCN.2024.3511960。 外部来源。
连续 latent 通过有噪无线信道;控制变量主要作用在 semantic/generative decoder 和传输表示上,不涉及离散 bit error。
主要结果
用户可在更高 PSNR 与更好感知质量之间调节,并能对兴趣区域获得更好重建。
为何不是纯优化式论文
可控性由生成式 JSCC 结构、realism map 和内容控制模块实现。
局限性与 Codex 判断
控制目标更偏质量/感知/内容,而不是严格的符号数自适应;生成式幻觉风险需额外约束。
架构或方法图截图页。来源:Rate-Distortion-Perception Controllable Joint Source-Channel Coding for High-Fidelity Generative Semantic Communications。关键结果图/表截图页。来源:Rate-Distortion-Perception Controllable Joint Source-Channel Coding for High-Fidelity Generative Semantic Communications。
Semantic Codebook-Based HARQ for Wireless Image Transmission
2025数字/混合式 semantic codebook HARQ核心
基本信息
Gaohong Liang, Xuefei Zhang, Ji Zhang, Yao Sun, Qimei Cui, Xiaofeng Tao。IEEE Transactions on Communications, 2025。来源:IEEE;标识:IEEE 11145114; DOI 10.1109/TCOMM.2025.3604326。 外部来源。
数字语义通信的 bit 不是等价的:某些 bit 翻转会导致语义 feature 大幅跳变,其他 bit 影响很小。传统均等信道编码忽视这种不均匀性。
可控机制与方法细节
先估计每个数字语义 bit 的重要性或误差敏感度,再与 channel coding 结合进行 UEP。发送端将重要 bit 分配更低码率/更强纠错,接收端译码后恢复语义表示。
不固定传输符号的具体方式
可控轴:semantic bit importance 驱动的 unequal error protection 控制信号:语义 bit sensitivity、channel code rate/protection level、信道条件 符号/码率灵活性:不同 bit 或 bit groups 使用不同保护强度;重要语义 bit 获得更多冗余,不重要 bit 可少保护。
信道处理
显式考虑 channel coding 后残余 bit error;decoder 收到经译码的 bitstream。它直接针对 bit error 对语义质量的不均匀影响。
主要结果
相同总体冗余下,UEP 比均等保护更能维持语义质量,尤其在低 SNR/高 BER 下。
为何不是纯优化式论文
虽然涉及保护资源分配,但输入是 semantic bit importance,输出是 channel coding 方案,属于语义感知链路方法。
局限性与 Codex 判断
若重要性估计与真实任务不匹配,冗余可能放错位置;复杂调制链路中的软信息利用仍可加强。
架构或方法图截图页。来源:Unequal Error Protection for Digital Semantic Communication With Channel Coding。关键结果图/表截图页。来源:Unequal Error Protection for Digital Semantic Communication With Channel Coding。
Vision Transformer-Based Semantic Communications With Importance-Aware Quantization
2025数字式 ViT importance-aware quantization核心
基本信息
Joohyuk Park, Yongjeong Oh, Yongjune Kim, Yo-Seb Jeon。IEEE Internet of Things Journal, 2025。来源:IEEE;标识:arXiv:2412.06038; IEEE 11038757; DOI 10.1109/JIOT.2025.3580597。 外部来源。