近日,阿里云的通义万相团队宣布推出了一款革命性的图像编辑模型——ACE。这款模型的创新之处在于,用户只需通过简单的口头指令,就能生成或编辑图片,极大地简化了图像处理流程。ACE模型的应用范围广泛,不仅适用于风格化的肖像摄影,还能在制作分镜头脚本和室内装饰设计等领域大显身手。目前,ACE模型已经对全球开发者开放源代码,其独特的局部风格化功能也已经集成到了通义App中,供用户使用。
官方资料显示,ACE模型具备文生图和图像编辑的双重能力。用户只需输入日常用语的指令,即可实现精确的视觉编辑、元素编辑、区域重绘编辑以及分层编辑等任务。这种对话式的编辑方式,使得用户能够轻松地完成以往需要专业软件如Photoshop才能完成的工作,例如,通过输入简单的文字指令,用户可以一键去除图片中的水印,或者更换证件照的背景。
为了支持这些通用编辑任务,该团队开发了Long-context Condition Unit(LCU)模块。这一模块能够处理各种多模态条件输入,满足编辑任务的需求。同时,他们还构建了一个全面的编辑成对数据构造链路和指令集生成链路,确保了图像编辑指令的精确性和高质量输出。
对于有兴趣进一步探索ACE模型的开发者和用户,可以通过以下开源地址获取更多信息:
-
魔搭社区:https://www.modelscope.cn/models/iic/ACE-0.6B-1024px
-
Github:https://github.com/ali-vilab/ACE
-
Huggingface:https://huggingface.co/spaces/scepter-studio/ACE-Chat