【DataWhale | 大模型Bot应用开发】Task4--图像流

写在前面 / 链接存档

Task4 图像流

Coze图像流介绍及案例列举

经典案例

案例一:双亲预测合成亲子形象

揭秘基因魔法,未来家庭超前想象

  • 上传双亲照片+提示词
  • 通过图像流
  • 可以生成AI预测的孩子照片

案例二:毛坯房一键美化装修

梦想家园,触手可及,

一键魔法:毛胚到豪宅的瞬间转变

  • 上传毛坯房原图
  • 通过图像流
  • 可以生成AI预测的装修风格参考图

案例三:电商广告图图像流

创意速成,广告设计新纪元,

视觉营销加速器,产品设计图灵感参考。

PS:另外,虽然可以实现文生图海报*,但当前海报丰富度还欠缺,存在一些问题,字体库少,颜色目前总是调用未生效 ,可以继续观望观望*

案例四:实现穿越古代人物梦想

圆一个穿越的梦想,时光机启动:古代人物,现代梦想。

温馨提示:现在可以选择的角色包含 皇子、公主、皇帝、皇妃、将军,后续官方还将结合用户反馈,考虑增加角色~

同样的逻辑,可以生成证件照也不在话下,推荐探索挖掘

案例五:日常运营的海报宣传

图像流生成的海报1

图像流生成的海报2

  • 适用场景:

    需要做九宫格,

    或者群分享海报,节庆海报

图像流的定义

  • 图像流是专门用于图像处理的一个流程工具

    在图像流中,

    可以通过可视化的操作方式灵活添加各种用于图像处理的节点

    构建一个图像处理流程来最终生成一个图像

  • 图像流发布后,支持在 Bot工作流中使用

图像流的能力范围

类型图像处理工具
智能生成图像生成、图像参考
风格模板风格滤镜、宠物风格化
智能编辑提示词推理、提示词优化、智能换脸、背景替换、光影融合、智能扩图、智能抠图、画质提升、美颜
基础编辑画板、裁剪、调整、旋转、缩放
通用节点选择器、消息
限制说明
并发限制每个开发者创建的所有工作流和图像流中,智能生成、智能编辑、风格模板类型下的同一个图像流节点,并发数限制为最多 4 个。在扣子专业版中,主账号和子账号共享 4 个并发。例如开发者小明账号下,同一时刻最多有 4 个宠物风格化节点在运行中。
超时时间如果图像流运行超时,Bot 可能无法提供符合预期的回复。各场景的超时时间如下: 未开启异步运行时,图像流整体超时时间为 2 分钟,单节点超时时间为 50 秒。 开启异步运行后,图像流整体超时时间为 24 小时,单节点超时时间为 50 秒。

图像流在线体验

Coze图像流商店一览-1

Coze图像流商店一览-2

图像流的应用方向

  • Coze的图像流应用,因为其灵活的画布控制能力,以及加入了多种AI绘图能力
  • 使得图像流成为代替SD生图,ComfyUI生图的简易方案

1、AI生图:内置了生图模型,无需自建服务器,就可以用AI生图;

2、商品广告图案批量修改:无需PS,可快速实现广告图案的换脸、换衣服、换场景、换文案的多种修改操作,;

3、海报制作:高可控性画布,与AI生图搭配,可以制作精美的海报;

4、小红书等自媒体图文操作:可嵌入工作流中,进行图文生成,制作绘本、商业软文;

5、证件、写真、节日大头像照片:个人旅拍、节日头像等照片生成;

实践教程:单词卡片生成Bot

任务说明

1
2
3
4
5
目标:设计一个使用Coze图像流的单词卡片生成Bot

bot体验:https://www.coze.cn/store/bot/7421333406866423846

图像流:word_card_1

单词卡片生成Bot图像流全貌

创意来源

  • 单词卡片是一种学习方式
  • 利用图文展示的形式,对特定的单词进行集中信息的展示
  • 对于青少年的英语教育有很多的促进作用
  • 单词的图形化,将抽象的单词和具体的图像形成联接,能加深青少年对于单词的认知

实现的主要思路介绍

  • 做图像流之前先思考:

    要实现的图片模版最后的效果,以及要传入的变量。

  • 比如观察下面这个图,它由四个部分组成

    大的背景图、单词、单词解释、以及和单词关联的图片

  • 从空白的画布上开始,要将四个元素凑齐,并放置到画布上

单词卡片结构分析

元素的准备

  • 单词:字符形式,可以让用户输入单词,作用是确定要解释的单词是什么
  • 单词解释:字符形式,可以让用户输入,也可以直接让大模型生成,作用是给单词和图片之间的关联,加一个通俗的解释
  • 图片:图片形式,和单词相关联的图片,让生图模型生成。
  • 背景:图片形式,提前准备好,固定背景图

动手实践

第一步:进入图像流

第二步:创建一个全新的图像流

  • 右上角点击创建图像流
  • 输入【名称】和【描述】

第三步:在开始的节点增加输入变量

  • 为了更好的控制图像流的输入,增加两个变量

    • word: 单词

    • word_content: 单词和图片的关联描述

      测试图像流时可以手动填写

      后续对接工作流后,可以让大模型直接生成

开始节点设置

第四步:添加图像生成组件

  • 增加一个提示词优化组件,以及增加一个图像生成的组件
  • 通过图像流的节点联接的方式,将开始-提示词优化-图像生成连起来
  • 变量的传递包括:
    • 提示词优化的输入为开始节点的word_content.
    • 图像生成的输入为提示词优化节点的输出data.

添加提示词优化和图像生成组件

测试结果:flower

第五步:增加一个画布节点,将内容进行组装

  • 首先添加一个画布节点,调整尺寸为手机卡片的样式,比例设计为9:16,添加一个背景图片

画板设置

  • 其次在画板上增加输入元素
    • word,开始节点的word变量
    • word_content,开始节点的word_content变量
    • img,生图节点的data输出变量
  • 然后在画板上手动排版,移动各元素的位置
    • 比如将word放在最上面
    • word_content放中间
    • img放在最下方

图像流测试效果

生成的单词卡片:flower

第六步:细节美化

  • 调整字体大小

最终成果

  • 图像流创建完后需要点击发布

第七步:创建工作流并串流起图片流并补全内容

  • 用一个工作流来搞定两个变量

    • word可以让用户输入
    • word_content可以用大模型生成
  • 操作步骤:

  1. 回到个人空间,创建一个新的工作流
  2. 在工作流的开始节点先设定一个参数为word,用来接收单词

工作流的开始节点

  1. 增加一个大模型节点,用来生成word_content

大模型节点

  1. 接着再将图像流引入,点左侧节点,选择图像流,就可以看到之前发布的图像流

选择图像流

  1. 添加图像流后,将节点进行联接,并选取参数

节点联结并选取参数

  1. 测试能否正常生成图片

测试能否正常生成图片

  • 工作流全景图

工作流全景图

第八步:用Bot进行封装

  • 为了让图像流能被方便的使用,可以用coze的bot进行封装
  • 创建一个bot,添加好工作流
  • 并且指令里强调使用工作流就可以了

Bot封装

1
2
3
4
5
6
7
8
9
10
11
12
13
# 角色
你是一个单词处理助手,能够接收用户输入的单词,并将其交给工作流‘word_card’以获取相应结果。

## 技能
### 技能 1:处理单词
1. 当用户输入一个单词时,立即将其传递给工作流‘word_card’。
2. 等待工作流‘word_card’的输出结果。
3. 将结果呈现给用户。

## 限制
- 只处理用户输入的单个单词,拒绝处理其他类型的输入。
- 严格按照流程将单词交给工作流‘word_card’,不得使用其他方式处理。
- 仅输出工作流‘word_card’返回的结果,不得添加额外内容。

AI生图组件介绍

智能生图组件及风格模板

包括图像生成、图像参考、风格滤镜、宠物风格化

智能生图组件及风格模板

智能编辑组件

  • 智能编辑,内置了ComfyUI使用节点的类似功能
  • 包括:提示词推理、提示词优化、智能换脸、背景替换、智能抠图、画质提升等高频功能

智能编辑组件

基础编辑组件

  • 基础编辑功能,类似与美图秀秀,PS等,支持对于图片进行增加画板、剪裁、调整、添加文字、叠图、旋转、缩放等功能
  • 这个组件里最常用的是画板、添加文字、叠图

基础编辑组件

更多案例展示

1. 设计一个名人名言展示

名人名言展示

工作流全景

2. 设计国庆头像

  • 图像流:guoqing_coze

工作流全景

作业练习

  • 国庆头像Q版

工作流全景

参考链接

https://www.coze.cn/docs/guides/image_flow_overview

基础教程: Coze “图像流” 抢先体验

YoYo:Coze 图像流小技巧:探索视觉艺术的隐藏宝藏

‌‌⁠‬‍⁠‬‍‌‬‍‬‌‍‌⁠‍‍⁠‌⁠⁠‍⁠‍‬⁠去玩AI开源知识库 - 飞书云文档

  • Copyrights © 2024-2025 brocademaple
  • 访问人数: | 浏览次数:

      请我喝杯咖啡吧~

      支付宝
      微信