上海科技大学积极鼓励本科生走进实验室、参与科学研究,这一创新举措从建校之初延续至今。近期,信息科学与技术学院2024届本科毕业生王宇瀚(现为香港中文大学博士研究生)在本科阶段学习期间完成主要理论与实验工作的两项研究成果分别被通信领域国际期刊录用。这两项成果在通信系统设计的优化以及分布式计算效率的提升方面,均展现出了重要的理论价值与潜在的应用前景。两项研究各有侧重:一项围绕“多任务导向的有损压缩” 展开深入探索,以“Task-Oriented Lossy Compression with Data, Perception, and Classification Constraints”为题被通信领域期刊IEEE Journal on Selected Areas in Communications(JSAC)接收;另一项则聚焦于“预定义场景下的编码分布式计算”,以“Coded Distributed Computing with Pre-set Data Placement and Output Functions Assignment”为题发表于信息论领域期刊IEEE Transactions on Information Theory(TIT)。两项工作由信息学院吴幼龙教授指导,吴幼龙教授为通讯作者,第一完成单位为上海科技大学。
任务导向的有损压缩理论
在通信系统中,如何在有限带宽下实现高效数据传输一直是核心挑战。传统的信息瓶颈(Information Bottleneck, IB)理论通过压缩冗余信息、保留目标关键信息为核心任务(如分类)服务,但其单一任务导向的特性使其难以应对复杂场景下的多任务需求。
研究人员首次提出“率-失真-分类”(Rate-Distortion-Classification, RDC)和“率-感知-分类”(Rate-Perception-Classification, RPC)两大函数,将IB理论拓展至多任务场景,成功统一重建、生成与类三类任务的联合优化目标,为提取任务导向信息提供了新的理论框架。
图一:综合考虑失真(distortion)、感知(perception)与分类(classification)任务的有损压缩模型
通过理论分析,研究人员证明了在高斯信源下,失真约束与分类目标存在折衷关系。例如,过度追求低均方误差(MSE)会导致图像分类准确率显著下降;而在码率受限时,感知质量提升则会加剧这一矛盾。此外,研究人员推导并揭示了信源噪声对任务间权衡的决定性作用,提出了一个基于深度学习的多任务图像压缩框架,并在真实数据集上验证了理论分析结果的准确性。该研究为智能通信、自动驾驶等场景的实时多任务处理提供了新思路。
图二:高斯信源下的RDC与RPC函数
攻克异构计算难题,提出普适性编码算法
在分布式计算领域,如何通过编码技术降低通信负载是提升效率的关键。现有编码分布式计算(CDC)方案严重依赖预设的文件分配规则,难以适配边缘计算等场景中节点自主存储数据、输出函数多样化的现实需求。
研究人员针对“任意预设的文件与函数分配”场景提出系统解决方案。通过定义“赤字比率”量化中间值的异构性,设计了“即时编码传输(OSCT)”与“联合编码传输(FSCT)”两大算法。算法通过对中间值进行高效的分类和分割,并充分利用多播增益,显著优化了数据传输效率。其中OSCT算法注重数据块的独立解码,适用于对实时性要求较高的场景;而FSCT算法则通过联合解码多个数据块,进一步提升了多播增益,适用于对传输效率有更高要求的场景。研究人员通过理论分析,建立了算法达到最优计算负载-通信负载权衡关系的充分条件。
两项研究虽分属通信理论与分布式计算领域,但共同体现出“基础理论创新—技术方案设计—实践验证”的研究路径。在任务导向压缩研究中,团队从信息论出发构建统一框架,并通过深度学习模型实现落地;而在编码计算领域,则从系统异构性建模切入,抽象出可扩展的算法核心。
这两项研究的第一作者王宇瀚在本科阶段完成主要理论与实验工作。信息学院的很多本科课程都会设置项目型“大作业”,以本研结合模式培养具有学术前瞻性的学生,鼓励学生从低年级接触前沿问题,将前沿的研究成果引入课堂,实现科研、教学相互结合。