AI生图模型FLUX更新!记者上手实测FLUX.1 Kontext
AI生图模型FLUX更新!记者上手实测FLUX.1 Kontext
AI生图模型FLUX更新!记者上手实测FLUX.1 Kontext近日,国外AI团队黑森林实验室(Black Forest Labs)宣布推出新一代(xīnyídài) AI 图像生成(shēngchéng)与(yǔ)编辑模型FLUX.1 Kontext,这(zhè)是(shì)继去年 8 月首次发布Flux模型后,该团队在多模态生成领域的又一里程碑。据官方介绍,与传统文本到图像模型不同,FLUX.1 Kontext 首次实现了文本与图像双输入(shūrù)的上下文生成与编辑,允许用户(yònghù)通过自然语言指令直接修改现有图像的局部或全局元素,同时保持角色一致性和视觉连贯性。
Flux.1 Kontext系列模型包括两个型号:Flux.1 Kontex [pro] 和 Flux.1 Kontex [max]。Flux.1 Kontex [pro] 允许(yǔnxǔ)用户生成(shēngchéng)图像并通过多次回合对(duì)其进行优化,保留(bǎoliú)字符(zìfú)和样式。Flux.1 Kontex [max] 强调速度、一致性和对提示的(de)(de)遵守。不过(bùguò),与以往的FLux模型不同,Flux.1 Kontex [pro] 和 Flux.1 Kontex [max] 无法下载离线使用。然而,Black Forest Labs 正在(zhèngzài)制作一个开放(kāifàng)的 Kontext 模型 Flux.1 Kontext [dev],可用于私人测试版,用于研究(yánjiū)和安全测试。
FLUX.1 Kontext采用流匹配架构(Flow Matching),彻底打破了文本(wénběn)编码器与扩散模型分离的传统设计。通过将文本提示与参考(cānkǎo)图像的潜在特征(tèzhēng)编码为(wèi)统一序列,模型能够精准捕捉(bǔzhuō)视觉概念与语义指令的关联,实现 “所见即所改” 的交互式创作。
这种架构带来(dàilái)四大核心优势:
1. 角色一致性:多轮编辑中保持人物身份特征,例如将(jiāng)角色从城市街道转移到雪山场景时(shí),发型、服装等细节丝毫不差;
2. 局部编辑:支持像素级精准修改,如删除图像中(zhōng)的杂物、调整特定区域(qūyù)色彩,而不影响其他部分;
3. 风格参考:基于参考图像的风格生成新场景,例如(lìrú)将一张(yīzhāng)文艺复兴风格的油画转换为现代卡通风格,同时保留主体构图;
4. 交互速度:1024×1024 分辨率下生成时间仅需 3-5 秒,比主流竞品快一个(yígè)数量级,显著(xiǎnzhù)提升创意迭代效率。
5月31日,记者(jìzhě)在官方试玩平台Flux Playground上进行了多场景测试(cèshì):
文本编辑:上传一张含有手写字的照片(zhàopiān),输入 “将文字改为Nanjing”,模型不仅准确修改文字内容(nèiróng),还自动调整排版与背景(bèijǐng)光影,使新标题与画面融为一体。
风格迁移:提供一张梵高的向日葵画作(huàzuò)作为参考,输入 “用相同笔触绘制一幅玫瑰(méiguī)画作”,生成的图像既保留印象派(yìnxiàngpài)的色彩层次,又精准还原玫瑰花的细节。
图片编辑:尝试 “将戴珍珠耳环(ěrhuán)的少女改成一个长发戴着(dàizhe)宝石耳环和项链(xiàngliàn)”的创意,模型同时处理少女的发型、项链、耳环等元素,最终输出的图像细节丰富。
值得注意的(de)是,FLUX.1 Kontext 对中文提示词的理解能力也有不错表现。例如输入“青砖黛瓦的江南水乡,细雨中撑伞的旗袍(qípáo)女子”,模型(móxíng)生成的画面(huàmiàn)不仅准确还原了中式建筑的韵味,人物服饰的纹理和动态也极具真实感。
近日,国外AI团队黑森林实验室(Black Forest Labs)宣布推出新一代(xīnyídài) AI 图像生成(shēngchéng)与(yǔ)编辑模型FLUX.1 Kontext,这(zhè)是(shì)继去年 8 月首次发布Flux模型后,该团队在多模态生成领域的又一里程碑。据官方介绍,与传统文本到图像模型不同,FLUX.1 Kontext 首次实现了文本与图像双输入(shūrù)的上下文生成与编辑,允许用户(yònghù)通过自然语言指令直接修改现有图像的局部或全局元素,同时保持角色一致性和视觉连贯性。
Flux.1 Kontext系列模型包括两个型号:Flux.1 Kontex [pro] 和 Flux.1 Kontex [max]。Flux.1 Kontex [pro] 允许(yǔnxǔ)用户生成(shēngchéng)图像并通过多次回合对(duì)其进行优化,保留(bǎoliú)字符(zìfú)和样式。Flux.1 Kontex [max] 强调速度、一致性和对提示的(de)(de)遵守。不过(bùguò),与以往的FLux模型不同,Flux.1 Kontex [pro] 和 Flux.1 Kontex [max] 无法下载离线使用。然而,Black Forest Labs 正在(zhèngzài)制作一个开放(kāifàng)的 Kontext 模型 Flux.1 Kontext [dev],可用于私人测试版,用于研究(yánjiū)和安全测试。
FLUX.1 Kontext采用流匹配架构(Flow Matching),彻底打破了文本(wénběn)编码器与扩散模型分离的传统设计。通过将文本提示与参考(cānkǎo)图像的潜在特征(tèzhēng)编码为(wèi)统一序列,模型能够精准捕捉(bǔzhuō)视觉概念与语义指令的关联,实现 “所见即所改” 的交互式创作。
这种架构带来(dàilái)四大核心优势:
1. 角色一致性:多轮编辑中保持人物身份特征,例如将(jiāng)角色从城市街道转移到雪山场景时(shí),发型、服装等细节丝毫不差;
2. 局部编辑:支持像素级精准修改,如删除图像中(zhōng)的杂物、调整特定区域(qūyù)色彩,而不影响其他部分;
3. 风格参考:基于参考图像的风格生成新场景,例如(lìrú)将一张(yīzhāng)文艺复兴风格的油画转换为现代卡通风格,同时保留主体构图;
4. 交互速度:1024×1024 分辨率下生成时间仅需 3-5 秒,比主流竞品快一个(yígè)数量级,显著(xiǎnzhù)提升创意迭代效率。
5月31日,记者(jìzhě)在官方试玩平台Flux Playground上进行了多场景测试(cèshì):
文本编辑:上传一张含有手写字的照片(zhàopiān),输入 “将文字改为Nanjing”,模型不仅准确修改文字内容(nèiróng),还自动调整排版与背景(bèijǐng)光影,使新标题与画面融为一体。
风格迁移:提供一张梵高的向日葵画作(huàzuò)作为参考,输入 “用相同笔触绘制一幅玫瑰(méiguī)画作”,生成的图像既保留印象派(yìnxiàngpài)的色彩层次,又精准还原玫瑰花的细节。
图片编辑:尝试 “将戴珍珠耳环(ěrhuán)的少女改成一个长发戴着(dàizhe)宝石耳环和项链(xiàngliàn)”的创意,模型同时处理少女的发型、项链、耳环等元素,最终输出的图像细节丰富。
值得注意的(de)是,FLUX.1 Kontext 对中文提示词的理解能力也有不错表现。例如输入“青砖黛瓦的江南水乡,细雨中撑伞的旗袍(qípáo)女子”,模型(móxíng)生成的画面(huàmiàn)不仅准确还原了中式建筑的韵味,人物服饰的纹理和动态也极具真实感。







相关推荐
评论列表
暂无评论,快抢沙发吧~
你 发表评论:
欢迎