易读性较差(字数太多懒得排版),很抱歉。

这件事我从2026年3月16日下午4点折腾到当天晚上快9点钟。

我的秋葉ai绘画整合包安装在D盘,所以后面的具体文件地址举例我是从D盘开始的,不同的人按自己的文件地址来就好。

2026年3月16日下午3点,我试图在秋葉aaaki大佬的绘世2.8.14启动器启动的ai绘画webui中使用opendalle类自然语言模型,我绘画模型用的是proteusV0.5.safetensors。这类模型的鼻祖是dalle模型,特点是生成画面时可以输入一段话的描述而不是用一个个分散的tag来生成画面。在一开始,我的拓展设置是属于从来没动过的默认情况。我输入自然语言描述时,逗号总是被识别为分割不同tag的符号。

也就是说,用stable diffusion运行像opendalle(dalle的开源模型)时遇到了这样的问题:dalle类型的模型可以输入自然语言描述,这通常是用句号或者逗号分割的几句话组成的一段话,但是stable diffusison默认输入逗号是不同tag的分割点,该如何把有逗号的自然语言描述正常输入成同一个tag?(解决方法和总结和效果图在后面,当然也可以看到最后,有更新,总之是建议直接换用comfyui,直接换用comfyui是一个在底层逻辑上更好的办法。)

我的问题探索经历:

一开始,Deepseek建议我使用转义符,也就是在提示词输入框输入自然语言描述时,其中的逗号前面加入反斜杠转义(文本的逗号,变成反斜杠逗号\,),但是毫无效果。Deepseek给的另一个方案是把整段描述用双引号包裹起来,也毫无效果。不管用这一段里两种方法的哪一种,提示词tag还是依旧按照逗号分割。

Deepseek又建议我修改all-in-one拓展插件的设置,关闭自动解析提示词功能,我在设置→sd-webui-prompt-all-in-one(或者中文叫做标签自动补全?)里关闭了很多设置,比如关闭标签自动补全,关闭自动添加逗号,也没什么用,逗号是没有了,但是自然语言文本描述里的逗号还是识别成了不同tag的分隔符号。

Deepseek又建议我用换行符代替逗号,说webui里的换行符只是视觉上的换行,模型会把同一段话里的几行文字当成一整段文字处理。依旧失败,一段话还是被分割成了不同的tag。

Deepseek又建议我使用sd-dynamic-prompts拓展,我安装它给的地址下载并安装该拓展。说是在webui根目录里找到或者新建一个prompts文件夹,把文本txt放入prompt文件夹中,再使用__prompts/文本名.txt__(前缀后缀为下划线)作为提示词,即可识别自然语言文本。我又失败了,ai根本画不出图了。(注意:我在提到从网页链接下载拓展时都是魔法上网的,不然无法显示拓展市场,从网页链接下载拓展也不好下)

沿着这条线,我发现all in one拓展和dynamic prompts有冲突,两个拓展同时运行会导致ai无法生成任何图片(而且all in one拓展关闭会导致没有预设提示词菜单)。我关掉了dynamici prompts拓展只保留了all in one拓展,现在无法切换ai 模型,ai模型也无法画图了。然后在只保留all in one拓展的情况下,重新载入webui突然又可以画图了。

接着,我关闭了all-in-one拓展,重新打开dynamic-prompts拓展,又测试了六种可能的错误。①不能用相对地址(短地址)__prompts/文本名.txt__,而是要用从D盘开始到prompts到txt文件的绝对地址(长地址),在文件管理器复制完绝对地址时,要记得把地址里的\斜杠换成/反斜杠。结果是依然读取失败。

②dynamic prompts拓展和lora拓展冲突。我在关闭了all-in-one拓展后,又同时关闭了lora拓展,保持dynamic prompts拓展运行并再次重新载入。结果依然是读取失败。

③也许是prompts文件夹权限不足,我在文件夹属性-安全里给了我电脑名为昵称的用户以读取和写入文件夹内文件的权限,重新输入提示词,还是无法识别txt文件。

④我为了防止是地址过长或者地址中间有中文文件名的问题,在D盘根目录又新建了一个prompts文件夹,放入了txt文件。然后重新输入D盘根目录这个prompts文件夹的txt文件地址,依然无法读取txt。

⑤文本文档没有使用utf-8编码而是使用了utf-8-bom编码导致出错。我在两种编码之间换来换去,还是无法识别。

⑥前后的通配符冲突。原本的通配符是前后各有两个下划线,在web ui的设置项-sd-dynamic-prompts里可以修改前后的通配符,我把下划线改成了英文问号。依然无法读取txt文件。

六种错误都被排除,此时Deepseek怀疑我的webui版本(秋叶整合包v4.10)和环境存在某些不兼容。

Deepseek又建议我下载wildcards拓展(这个wildcards和all in one以及lora 不会产生冲突且占用内存和硬盘小)。

用拓展-从网页链接下载一栏下载wildcards拓展时,总是弹出一个Git Credentials Manager窗口让我输入https://jihulab.com的credentnials,我一开始输入的是github的账号密码,还是无法下载。后面一看,应该是github里的国内镜像jihulab.com的账号密码。果然在绘世启动器的设置里关掉使用git 国内镜像源就可以安装wildcards拓展了。

由于wildcards和all in one以及lora没有冲突,我在使用wildcards时没有关闭all in one以及lora这两个拓展,只关闭了dynamic-prompts拓展,如图。

Deepseek给我介绍了wildcards的使用方法,其实和dynamic prompts差不多。

 1.在 WebUI 根目录下找到(或新建)wildcards 文件夹。

   - 在里面新建一个文本文件,比如description.txt,写入你的自然语言描述。

2.调用语法

在提示词输入框里输入:__description__(注意是双下划线,中间是文件名,不带路径和 .txt 后缀),点击生成,插件会自动读取wildcards/description.txt 里的内容替换进去,逗号会原样保留。

结果安装了wildcards也无法识别webui根目录下的wildcards文件夹里的txt文件。

最后我发现webui根目录\extensions\stable-diffusion-webui-wildcards下面还有个wildcards文件夹,把txt文件搬到这里,再使用wildcards的提示词语法,果然成功识别到了。在webui的根目录里新建一个prompts文件夹或者wildcards文件夹都是没用的,必须在拓展安装的文件夹里的对应拓展文件夹里的wildcards文件夹放txt文件才能识别。

这时,重新载入webui,再使用wildcards的提示词语法__txt文件的名字__终于可以正常识别自然语言描述了。

然后我发现D:\sd-webui-aki\sd-webui-aki-v4.10\extensions\sd-dynamic-prompts\wildcards,也就是说dynamic prompts自身的文件夹里依然有一个wildcards文件夹,应该是把txt文件放在这里才能让dynamic-prompts识别而不是在webui根目录新建一个prompts文件夹!

也许在关闭all in one以及lora拓展的同时(应该也要关掉wildcards拓展),只启用dynamic-prompts拓展,把txt文件放在D:\sd-webui-aki\sd-webui-aki-v4.10\extensions\sd-dynamic-prompts\wildcards里,然后在提示词语法里读取的文件地址放到wildcards\文件名.txt,即__wildcards/文本名.txt__或者__D:\sd-webui-aki\略\sd-dynamic-prompts\wildcards\文件名.txt__(注意前后的通配符符号,默认是两个下划线),也可以让dynamic-prompts拓展识别到txt文件?

至少我就关掉了dynamic-prompts拓展,启动了all in one和lora和wildcards三个拓展来识别自然语言文本。

解决方法省流:

不会和其他插件冲突的好办法:在启动的ai绘画web ui→拓展→从url链接下载里下载wildcards拓展,地址为https://github.com/AUTOMATIC1111/stable-diffusion-webui-wildcards.git,如果下载时弹出Git Credentials Manager的弹窗让你输入https://jihulab.com的credentnials,而且你没有这个网址的账户密码的话,可以在绘世启动器的设置里关掉使用git 国内镜像源,使用魔法上网,用该网页链接从git直接下载wildcards插件。webui根目录\extensions\stable-diffusion-webui-wildcards下面还有个wildcards文件夹,把含有自然语言描述的txt文件搬到这里,再使用wildcards的提示词语法。语法如下:在提示词输入框里输入:__txt文件名__(注意是双下划线,中间是文件名,不带路径和 .txt 后缀),点击生成,插件会自动读取webui根目录\extensions\stable-diffusion-webui-wildcards/txt文件名.txt 里的内容替换进去,逗号会原样保留。然后就可以识别了。

需要关闭all in one和lora两个拓展的方法:在启动的ai绘画web ui→拓展→从url链接下载里下载dynamic-prompts拓展,网页链接问deepseek即可,自动安装完成后,把txt文件放在D:\sd-webui-aki\sd-webui-aki-v4.10\extensions\sd-dynamic-prompts\wildcards里,然后使用dynamic-prompts拓展的关键词语法:_wildcards/文本名.txt__或者__D:\sd-webui-aki\略\sd-dynamic-prompts\wildcards\文件名.txt__。

总结:dynamic prompts拓展插件和all in one拓展插件无法同时使用,会造成ai模型无法生成图片。dynamic prompts和lora拓展也会产生冲突。txt文件放在webui根目录的prompts文件夹时(deepseek说没有就新建),dynamic prompts的读取txt文件功能完全用不了(不管关键词语法里用是txt文件的相对路径还是绝对路径),也就无法解决自然语言的逗号强制变成tag分隔符的问题。但其实是deepseek搞错txt文件该放的位置了,应该把txt文件放在D:\sd-webui-aki\sd-webui-aki-v4.10\extensions\sd-dynamic-prompts\wildcards文件夹。all in one拓展不加载的话,就无法使用预设的提示词菜单。但是dynamic prompts的动态提示词功能和魔法提示词功能很有意思(但是选了它就没有预设提示词了)。all in one+lora和dynamic  prompts之间只能选一个加载,因为两个拓展同时运行会抢夺提示词解析权导致ai无法画图。后面deepseek又建议我下载wildcards拓展(这个wildcards和all in one 以及lora 不会产生冲突且占用内存和硬盘小),经历一系列问题,然后发现把文本放入D:\sd-webui-aki\sd-webui-aki-v4.10\extensions\stable-diffusion-webui-wildcards\wildcards文件夹,使用提示词语法:__文本名__终于可以识别了!不过记得文本文件里的描述需要是英文,而且不能太长,不然效果还是很差甚至相当于识别不了。

 

效果图(在把txt文件正确地放在D:\sd-webui-aki\sd-webui-aki-v4.10\extensions\stable-diffusion-webui-wildcards\wildcards之后):

①使用的自然语言文本,是图片中间的一段

②翻译为英文输入txt文件

③用wildcards拓展的关键词语法让ai绘画模型识别到txt文件

④proteusV0.5绘画模型识别到自然语言txt后生成的画面

感谢您读到这里!!其实我还有一个webui拓展,用来抠图的Automatic1111-Geeky-Remb拓展安装完成后好像完全不能输出改变之后的效果图,只能上传图片和视频输入但不能产生输出,很烦,但是无所谓了。

2026年3月17日更新——根据热心网友的指导,我总结了以下几点:

①直接换用comfyui模型无疑是更好的解决方式,比我在webui上浪费时间强多了。

②可以看看stable diffusion教程中的nelly同学的教程,我看到nelly同学的sd教程的视频提示词一篇,原来长句和tag组合都能理解,甚至tag组合的出图效果还更好,我就是想试试怎么单纯输入一段自然语言文本不被分割成一堆tag)

③有人发了个配合webui的语言模型给绘画模型当文本解析器的插件(视频bv号为 BV1qRmyBgEwU,我说在教程评论区有人反应文本模型+绘画模型容易爆显存,他说那我就更应该换用comfyui了,comfyui对两个模型搭配的情况有优化)

④webui支持的主要模型用的clip对自然语言的训练都不好,就只适合用一个个tag分割,开源模型只能这样了要么就去买闭源模型,而且deepseek的幻觉也高,数据库也老了(两年前),根本起不到应该的指导作用。

⑤web ui forge neo之类的可以用qwen和fluxu以及zit等模型挂着的巨大文本编辑器来实现输入自然语言的效果。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐