导读 苹果发布了革命性的人工智能模型,用于基于指令的图像编辑。VentureBeat发现,这个开源AI模型MGIE可以根据自然语言指令编辑图像。根据苹果...

苹果发布了革命性的人工智能模型,用于基于指令的图像编辑。VentureBeat发现,这个开源AI模型MGIE可以根据自然语言指令编辑图像。

根据苹果研究人员发表的一篇论文,基于指令的图像编辑通过自然命令提高了图像操作的可控性和灵活性,无需详细描述或区域掩模。该研究在研究MLLM如何促进编辑指令和MLLM引导的图像编辑时,展示了“通过LM实现跨模式理解和视觉感知响应生成的良好能力”。

“大量的实验结果表明,表达指令对于基于指令的图像编辑至关重要,我们的MGIE可以显着改进自动指标和人工评估,同时保持有竞争力的推理效率。”

有了这个,苹果制作的这个图像编辑AI模型可以为编辑过程提供简洁明了的指令,创建Photoshop风格的修改,优化照片质量,并编辑图片的特定部分,例如脸部、眼睛、头发、衣服、及配件。

任何人都可以使用这个GitHub开源项目。有趣的是,它是在iOS18发布前几个月被发现的,据说iOS18充满了人工智能功能。

目前,尚不清楚苹果是否会将这些突破性的图像编辑模式添加到iPhone中。除了这一发现之外,苹果公司最近还展示了如何在内存有限的情况下使用大型语言模型。

也就是说,以下是我们实际上可以通过iOS18获得的一些人工智能功能:

核心应用程序和生产力软件的自动总结和自动完成功能(Pages、Keynote)

在AppleMusic中更好地创建播放列表

Siri(以人工智能为重点的重大整体改革)

为开发人员提供的新版Xcode中的代码补全

AppleCare工具可协助员工帮助客户解决故障

BGR将持续关注苹果在AI方面的最新努力,包括有关iOS18和iPhone16的所有传闻和报道。