cover

[GLIDE] Towards Photorealistic Image Generation and Editing with Text-Guided Diffusion Models

alist

alist-org/alist: 是一个基于 JavaScript 的列表和表格库，支持多种列表和表格样式和选项。该项目提供了一个简单易用的列表和表格库，可以方便地实现各种列表和表格的展示和定制，同时支持多种列表和表格样式和选项。

项目地址：https://gitcode.com/gh_mirrors/al/alist

免费下载资源

emergency_rose

414人浏览 · 2024-06-13 20:00:13

emergency_rose · 2024-06-13 20:00:13 发布

1、目的

综合所有的text prompts来生成photorealistic images

2、方法

Guided Language to Image Diffusion for Generation and Editing (GLIDE)

1）模型

-> 3.5B参数text-conditional diffusion model，64 x 64 resolution

-> 1.5B参数text-conditional upsampling diffusion model，256 x 256 resolution

-> noised 64 x 64 ViT-L CLIP model

2）text condition

-> Classifier-free guidance

将text编码为K tokens送入Transformer模型：作为class embedding；token embeddings的最后一层K个feature vectors映射后并联到扩散模型的每个attention层

alist

alist-org/alist: 是一个基于 JavaScript 的列表和表格库，支持多种列表和表格样式和选项。该项目提供了一个简单易用的列表和表格库，可以方便地实现各种列表和表格的展示和定制，同时支持多种列表和表格样式和选项。

项目地址：https://gitcode.com/gh_mirrors/al/alist

优于CLIP guidance

-> CLIP Guidance

将classifier guidance中的梯度替换为image和caption的encoding的点积对图像的导数，即 $CLIP score = E[s(f(image) \cdot g(caption))]$

需要在noised图像上训练CLIP，得到noised CLIP models

3）对模型进行fine-tune，来执行image inpainting

-> 增加4个通道：随机擦除图像区域后的RGB通道 + mask

-> 新通道参数初始化为0

-> 对于upsampling模型，gt仅包括高分辨率unmasked region

-> 可以让使用者迭代生成结果，直到和复杂的prompts匹配

阅读全文

AI总结

GitHub 加速计划 / al / alist

31

2

下载

alist-org/alist: 是一个基于 JavaScript 的列表和表格库，支持多种列表和表格样式和选项。该项目提供了一个简单易用的列表和表格库，可以方便地实现各种列表和表格的展示和定制，同时支持多种列表和表格样式和选项。

最近提交(Master分支：6 个月前 )

3375c26c * perf(quark_uc): native proxy multithreading * perf(quark_uc_tv): native proxy multithreading * chore(fs): file query result add id 6 天前

ab68faef Co-authored-by: anobodys <anobodys@gmail.com> 6 天前

GitCode 开源社区

旨在为数千万中国开发者提供一个无缝且高效的云端环境，以支持学习、使用和贡献开源项目。

更多推荐

cover

Dify：开源的大型语言模型应用开发平台深度解析

GitCode 开源社区

cover

Datawhale 入驻 GitCode：以开源力量推动 AI 教育公平与创新

GitCode 开源社区

cover

当开源邂逅AI，公益长出翅膀 | 回顾3.30 上海「开源×AI 赋能公益」Meetup

GitCode 开源社区

所有评论(0)

查看更多评论

emergency_rose

@sinat_30618203

已为社区贡献3条内容

目录

1、目的
2、方法