免费申请个人网站申请主机托管公司

张小明 2026/1/9 17:19:33
免费申请个人网站申请,主机托管公司,专业网站制作技术,微商软件商城24小时点击蓝字关注我们AI TIME欢迎每一位AI爱好者的加入#xff01;导读论文《Fourier-based Decoupling Network for Joint Low-Light Image Enhancement and Deblurring》已被图像处理领域的国际顶级期刊 IEEE Transactions on Image Processing (TIP) 收录 。该研究由中山大学智…点击蓝字关注我们AI TIME欢迎每一位AI爱好者的加入导读论文《Fourier-based Decoupling Network for Joint Low-Light Image Enhancement and Deblurring》已被图像处理领域的国际顶级期刊 IEEE Transactions on Image Processing (TIP) 收录 。该研究由中山大学智能工程学院完成。论文第一作者为中山大学博士研究生涂陆炜通讯作者为其导师金枝教授。Codehttps://github.com/Jabruson/FDN-TIP2025夜间手持拍摄的图像常常同时存在光照不足和运动模糊两种退化问题。先前的方法在空间域中独立处理这两种退化但由于暗光和模糊在空间域中高度耦合这些方法难以有效解耦并恢复出清晰的图像细节。针对这一挑战我们从频域的角度分析图像的退化表形式并观察到一个关键现象在傅里叶域中暗光和模糊两种退化可以被独立地表示为图像的振幅 (amplitude) 和相位 (phase) 。基于此我们深入分析了图像退化的物理过程研究了暗光退化和模糊退化在振幅和相位上的表达形式并提出了傅里叶解耦网络 (FDN)能够端到端实现联合暗光增强和去模糊还可以实现用户自定义亮度恢复。大量实验证明FDN在合成与真实世界数据集上均取得了当前最佳的性能尤其在恢复图像边缘细节方面表现出良好的效果。Abstract本文提出了一种基于傅里叶域解耦的联合暗光增强和去模糊算法FDN。FDN从不同退化的物理过程出发有效解耦并复原了暗光退化和模糊退化能够恢复良好的图像边缘和细节。本文的贡献与创新点如下基于低光和模糊在傅里叶域振幅和相位上的不同物理特性来设计网络 。我们深入探究了相位相关性与模糊信息、振幅调制与暗光退化信息之间的关系为联合图像复原任务提供了高效的解耦方法。我们设计了一种自注意力机制来提取不同类型的退化表征并设计了一个高效的前馈网络 (FFN) 来自适应地学习幅度和相位的频率特征。此外我们还引入了一种基于傅里叶变换的交叉注意力机制为频率学习提供关键的先验知识。实验结果表明与当前的 SOTA 方法相比我们的方法仅用 16.7% 的参数就达到了 SOTA 性能。尤其是在边缘恢复方面我们的复原结果表现出了良好的性能。MethodMotivation图1我们的核心观察是图像的结构信息如边缘主要由相位决定而亮度、对比度等统计信息则主要由振幅决定。如图1所示我们将一张正常光照的清晰图像(a)与一张暗光模糊图像(h)的相位进行交换可以分别得到一张正常光照的模糊图像(d)和一张暗光的清晰图像(k)。这直观地证明了在傅里叶域中对暗光振幅分量和模糊相位分量进行解耦的可行性。我们还展示了仅包含相位分量的结果(f)和(m)以及仅包含振幅分量的结果(g)和(h)进一步说明相位分量能够充分表征图像结构信息这一点。我们进一步从物理过程对这种解耦特性进行了理论推导:振幅中的亮度信息对于一幅灰度图像对于一副灰度图像其傅里叶振幅的直流分量等于图像所有像素的总和因此该直流分量可以被视为图像的全局亮度。然而如果仅仅通过增加该直流分量来提升亮度会由于平等地增加每一个像素点而导致颜色失真。但如果我们同时缩放整个振幅分量而不是仅仅改变直流分量我们就可以在保持相位分量的同时调整全局亮度并保持色彩的保真度。相位中的模糊信息由于图像结构信息主要由傅里叶相位表示因此模糊退化主要表现为傅里叶相位分量的失真。从图像模糊的物理过程来看图像模糊可以建模为一系列连续帧的平均结合傅里叶移位定理我们可以推导出两个模糊程度不同但是初始状态相同的图像之间的相位相关性该公式从数学上描述了两个模糊程度不同的图像之间的相位相关与模糊程度呈正比关系。这一理论指导我们设计了基于相位相关的注意力机制来专门提取和处理模糊信息。Network Architecture图2基于上述理论分析我们设计了FDN如图2所示其整体架构由两个核心模块构成多尺度振幅恢复模块 (MAR) 和 傅里叶解耦变换器 (FDformer) 。MAR负责粗略的振幅恢复 。MAR生成的粗略振幅作为亮度先验使FDformer能够专注于精细细节的恢复 。此外MAR允许通过缩放因子来实现用户自定义的亮度恢复 。图3FDformer是网络的核心采用非对称的编码器-解码器架构包含三个关键组件如图3傅里叶解耦自注意力 (FDSA), 傅里叶解耦前馈网络 (FDFFN), 和 傅里叶交叉注意力前馈网络 (FCAFFN)。傅里叶解耦自注意力(FDSA)。结合上述对不同退化信息在相位以及振幅上的表征分析我们设计了FDSA以提取混合退化情景中的不同退化信息,FDSA旨在从相位中提取模糊特征从振幅中提取暗光特征 。我们引入了三种注意力机制分别用于捕捉模糊退化信息、暗光退化信息以及混合退化信息。傅里叶解耦前馈网络 (FDFFN)。FDFFN包含并行的频率分支和空间分支 。频率分支利用可学习的滤波器分别对特征的振幅和相位进行自适应的频域选择与调整 。空间分支用于学习局部信息以补充频域信息的表达。傅里叶交叉注意力前馈网络 (FCAFFN)。FCAFFN负责将MAR提供的粗恢复振幅先验以及输入图像的多尺度相位特征有效地融入到FDformer中 以此指导FDformer的亮度恢复以及结构信息恢复。FCAFFN同时包含了傅里叶交叉注意力机制以分别融合振幅和相位信息以及空间调制机制以辅助信息融合。ExperimentsResults on joint low-light image enhancement and deblurringLOL-Blur数据集。我们在公开的LOL-Blur 数据集上进行了广泛的定量评估这是一个专用于联合暗光增强和去模糊的数据集 。如表1所示我们不仅比较了专门由于联合暗光增强和去模糊的方法我们还对比了专门用于暗光增强、去模糊以及通用的图像复原方法。FDN在关键指标PSNR, SSIM, LPIPS, FID上均超越了现有的各类方法 。值得注意的是相较于SOTA方法VQCNIR我们的FDN在性能更优的同时参数量减少了83.3% 。表1为了更全面的展示我们的方法的性能我们进行了定性的评估。如图4的视觉对比所示大多数方法在处理严重模糊的区域时效果不佳或产生伪影。相比之下我们的方法能够显著地恢复出更清晰的边缘和更精细的纹理细节例如图中公交车的车牌和车身细节证明了傅里叶解耦策略的优越性 。图4Real-LOL-Blur数据集。为了验证模型在真实世界场景中的泛化能力我们将在LOL-Blur上训练的模型在没有真实标签的Real-LOL-Blur数据集上进行了测试, 如表2所示。表2此外为了证明FDN的优越性我们还将FDN与“先增强后去模糊”或“先去模糊后增强”的简单级联策略进行了比较 如表3所示。表3在多个常用的无参考图像质量评价指标NIQE, BRISQUE, PI上FDN的表现全面优于其他所有方法 。视觉对比也显示图5和图6在真实的夜景照片中FDN能够恢复出最清晰的边缘和最自然的颜色而其他方法往往难以处理严重的模糊或引入伪影。图5图6Results of luminance control strategyFDN还提供了一个自定义输出亮度的功能 。通过调整输入参数 期望亮度与原始亮度的比值用户可以轻松控制生成图像的明暗程度以满足个性化的视觉偏好 。如图7所示不同的自定义值会改变振幅从而调整亮度但相位基本保持稳定保证了图像结构不被破坏 。图(b)的散点图进一步验证了我们亮度调节策略的精确性和可靠性 。图7Ablation studies为了验证我们所提出各个模块的有效性我们进行了详细的消融研究如表4。实验结果表明对于FDSAA与空间域注意力(MDTA)或其他频域注意力(FSAS)相比我们提出的FDSA由于能够解耦退化信息性能提升显著 。而移除FDFFN中的振幅或相位滤波器或者替换FDFFN为其他常用的前馈网络均会导致性能明显下降证明了对不同频率成分进行精细调整的必要性 。此外实验结果表明FCAFFN中的傅里叶交叉注意力机制以及空间调制策略都是同样必要的。表4中山大学智能工程学院前沿视觉实验室( FVL: https://fvl2020.github.io/fvl.github.com/ )由金枝教授建设并维护实验室目前聚焦在图像/视频质量增强、视频编解码、3D 重建和无接触人体生命体征监测等领域的研究。旨在优化从视频图像的采集、传输到增强以及服务后端应用的完整周期。实验室的目标是开发通用的概念和轻量化的方法。为了应对这些挑战全体成员将持之以恒地进行相关的研究并与其他实验室进行合作希望利用更多关键技术解决核心问题。长期欢迎有志之士加入往期精彩文章推荐《NeurIPS 2025性能暴涨30%中科大团队提出AutoRefine攻克多跳推理核心痛点》关于AI TIMEAI TIME源起于2019年旨在发扬科学思辨精神邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索加强思想碰撞链接全球AI学者、行业专家和爱好者希望以辩论的形式探讨人工智能和人类未来之间的矛盾探索人工智能领域的未来。迄今为止AI TIME已经邀请了2000多位海内外讲者举办了逾800场活动超1000万人次观看。我知道你在看提出观点表达想法欢迎留言
版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!

免费素材视频网站长春营销型网站制作

第一章:农业产量回归模型的构建背景与挑战在现代农业科学中,准确预测作物产量对于粮食安全、资源分配和政策制定具有重要意义。随着传感器技术、遥感数据和气象监测系统的普及,农业生产过程中积累了大量多源异构数据。利用这些数据构建精准的…

张小明 2026/1/8 16:28:15 网站建设

地方网站模板5118网站是免费的吗

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 创建一个电商商品筛选页面,使用uni-data-select实现以下功能:1.三级分类联动选择 2.品牌多选功能 3.价格区间选择 4.商品属性筛选。要求:1.分类数…

张小明 2026/1/9 11:49:33 网站建设

柳州公积金网站少儿编程网站

苹果CMS v10建站实战:7天打造高流量视频平台的完整攻略 【免费下载链接】maccms10 苹果cms官网,苹果cmsv10,maccmsv10,麦克cms,开源cms,内容管理系统,视频分享程序,分集剧情程序,网址导航程序,文章程序,漫画程序,图片程序 项目地址: https://gitcode.com/gh_mirro…

张小明 2026/1/9 16:34:32 网站建设

t云建站温州网页设计美工招聘

引言 销售工作涉及客户跟进、业绩统计、市场分析等众多繁杂事务。到了年终,要把这些琐碎的工作整理成一份逻辑清晰的年终总结PPT,让不少销售人头疼不已。自己手动整理内容,不仅费时费力,还容易出现结构混乱的问题,难以…

张小明 2026/1/6 23:47:47 网站建设

wordpress搭建博客seo扣费系统源码

第一章:智谱Open-AutoGLM 原理智谱Open-AutoGLM 是一个面向自动化自然语言处理任务的开源框架,基于 GLM 大语言模型架构设计,旨在实现零样本或少样本条件下的任务自适应能力。该系统通过引入任务感知提示生成机制与动态推理路径选择策略&…

张小明 2026/1/6 23:47:44 网站建设