新闻中心

News

公司动态 新冠相关 信息公示

米兰官网-图像复原“黑科技”实现1.7秒快速复原高清大片—新闻—科学网

2026-03-24 09:16:05 999+ 公司动态

     

图象回复复兴范畴持久面对一个难题:要末寻求质量却耗时漫长,要末寻求速率却捐躯细节。怎样把一张老照片修复患上又快又好?

7月28日,中国科学院深圳进步前辈技能研究院数字所研究员董超团队发布了一项名为HYPIR的图象回复复兴年夜模子,不仅比现有的图象回复复兴技能快数十倍,更于高清分辩率、文字保真、理解能力、用户节制矫捷性等方面揭示出了优秀机能,为图象回复复兴技能的现实运用提供了更高效的解决方案,更为文化传承与掩护、影视修复等范畴带来新的可能性。

1985年的深圳南头半岛(下图,摄影:陈宗浩)与4倍超分修复(上图)后的对于比图

?

冲破传统技能瓶颈,图象修复更高效

传统要领中,基在预练习扩散模子的回复复兴技能显著晋升了图象回复复兴效果,但存于计较繁杂度高、推理速率慢、练习资源耗损年夜以和天生成果可控性不足等问题,成了限定图象回复复兴技能成长的瓶颈问题。

去年,董超团队提出了智能画质加强年夜模子SUPIR,将低质量的图象恢复到靠近原始状况的高清图象,有用修复多种退化类型的图象。而这次图象年夜模子HYPIR作为进级版,舍弃了迭代式的扩散模子练习,改用单步的匹敌天生模子练习方式,将原本的算法速率晋升了数倍,同时采用更新的文生图基模子进一步晋升算法效果,实现了8K级另外细节天生,于天生图象的不变性及可控性方面远超SUPIR年夜模子。

HYPIR年夜模子处置惩罚图片纹理细节的效果展示。研究团队供图

?

“以往图象回复复兴要领中往往包括扩散模子蒸馏、ControlNet适配器或者者多步推理历程。而HYPIR则不需要依靠这些步调,利用要领越发简朴。于练习及推理速率上较传统要领晋升了一个数目级以上,且机能更优。”董超先容,HYPIR重要有两个立异点,一是利用预练习扩散模子初始化回复复兴收集;二是从理论角度出发注释这一简朴要领暗地里蕴含的深刻道理。

试验数据显示,于单张显卡(图象处置惩罚器)上,HYPIR仅需1.7秒便可完成一张1024x1024分辩率图象的回复复兴。比拟现有的图象回复复兴要领,研究职员提出的HYPIR于回复复兴图象的质量上机能更优,且可以或许合用在各类尺寸的预练习扩散模子,为差别运用场景提供了矫捷性。

多种机能优秀,运用远景广漠

于运用层面,研究职员先容,HYPIR于图象高清分辩率、文字保真、理解能力、用户节制矫捷性等方面均揭示出了优秀的机能。

例如,于老照片修复方面,研究职员应用HYPIR修复了海内外经典影戏、电视剧老照片,让恍惚的影像重现清楚的细节,为文化影象传承提供了技能撑持。于高分辩率图象修复范畴,HYPIR一样体现精彩,因其兼具速率与效果,HYPIR乐成霸占了传统要领于天生8k分辩率图象时往往面对速率慢或者效果欠安的难题。

HYPIR年夜模子修复图象效果展示。研究团队供图

?

于文字保真方面,传统基在扩散模子的要领常致使回复复兴出的文字恍惚或者扭曲,缺少切确性,而HYPIR则可以或许使回复复兴出的文字连结高保真度及清楚度,不管是简朴的标识还有是繁杂的文档,HYPIR都能精准地还有原其原始形态,使图象中的文字清楚可读。

值患上一提的是,HYPIR还有具有了凸起的天然语言理解能力,可三木SEO-以或许精准捕获及理解用户的输入指令,于图象回复复兴历程中正确地反应用户的用意。此外,用户可以按照需求矫捷调治天生与回复复兴的均衡,或者邃密节制图象细节水平,从而得到切合自身偏好的成果。这类用户友爱的设计使患上HYPIR不仅合用在专业范畴,也能满意平凡用户的需求。

HYPIR不仅展示了图象修复技能上的立异性,也表现了对于现实运用需求的理解。经由过程打破传统思维定式,该技能于文化传承与掩护、影视修复、高分辩率图象天生等范畴提供了切实可行的解决方案,为图象回复复兴技能的成长注入了新的活气。

一直以来,董超领导团队致力在底层视觉技能研究,于图象处置惩罚范畴取患了多个主要冲破,并出书了人工智能专著《底层视觉之美》。他先容,今朝HYPIR年夜模子的开源代码及模子已经上传至GitHub开放利用并已经乐成部署在公然平台,同时与深圳市南山区档案馆互助对于部门馆藏照片举行修复,后续该年夜模子还有将进一步推进财产化。

版权声明:凡本网注明“来历:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请于正文上方注明来历及作者,且不患上对于内容作本色性改动;微信公家号、头条号等新媒体平台,转载请接洽授权。邮箱:shouquan@stimes.cn。-米兰官网