GPT-Image-2 高级特性与提示词完全指南(中文版)

作者:12年互联网资深架构师
技术栈:Spring AI 1.1.4 + GPT-Image-2 + Spring Boot 3.5.x
适用人群:Java开发者、AIGC应用开发者、产品设计师、自媒体从业者


📖 前言

GPT-Image-2(API中模型名为gpt-image-2)是OpenAI推出的最新图像生成模型,相比DALL·E 3有了质的飞跃。本文将全面介绍其高级特性,提供全中文提示词,并使用Java Spring AI给出完整的代码实现。
在这里插入图片描述


🎯 一、GPT-Image-2 核心高级特性

1.1 特性全景图

┌─────────────────────────────────────────────────────────┐
│              GPT-Image-2 高级特性矩阵                    │
├──────────────────┬──────────────────────────────────────┤
│ 🎨 图像生成       │ 文本生成图像、多风格切换、超高分辨率    │
│ ✏️ 图像编辑       │ 局部修改、智能擦除、区域重绘           │
│ 🔤 文字渲染       │ 图片内精准文字排版(重大突破!)        │
│ 🧠 指令理解       │ 超长复杂提示词理解、多主体场景构建      │
│ 🎭 风格控制       │ 写实/动漫/水彩/3D/像素等精确风格控制   │
│ 🔄 多图融合       │ 多张参考图融合、风格迁移               │
│ 📐 构图控制       │ 精确的空间布局、视角、景深控制          │
│ 🌈 色彩控制       │ 精确的色调、光影、氛围控制             │
│ 📏 多尺寸输出     │ 1024×1024 / 1536×1024 / 自适应       │
│ 🛡️ 安全特性       │ 内置C2PA元数据水印、内容安全过滤       │
│ 🔲 透明背景       │ 原生支持PNG透明通道输出                │
└──────────────────┴──────────────────────────────────────┘

1.2 与 DALL·E 3 对比

能力维度 DALL·E 3 GPT-Image-2
文字渲染 经常出错、模糊 ✅ 精准,支持中英日多语言
指令遵循 中等 ✅ 显著提升,复杂场景理解更好
图像编辑 不支持 ✅ 原生支持编辑和局部修改
透明背景 不支持 ✅ 原生支持
风格一致性 中等 ✅ 同一提示词多次生成更一致
多主体场景 容易混淆属性 ✅ 更好的属性绑定
细节丰富度 ✅ 更精细的纹理和细节
输出格式 PNG/URL ✅ PNG/JPEG/WebP + 透明通道

🔧 二、Spring AI 集成配置

2.1 Maven依赖

<parent>
    <groupId>org.springframework.boot</groupId>
    <artifactId>spring-boot-starter-parent</artifactId>
    <version>3.5.3</version>
</parent>

<dependencies>
    <!-- Spring AI OpenAI Starter -->
    <dependency>
        <groupId>org.springframework.ai</groupId>
        <artifactId>spring-ai-starter-model-openai</artifactId>
    </dependency>

    <!-- Spring Web -->
    <dependency>
        <groupId>org.springframework.boot</groupId>
        <artifactId>spring-boot-starter-web</artifactId>
    </dependency>

    <!-- Lombok(可选) -->
    <dependency>
        <groupId>org.projectlombok</groupId>
        <artifactId>lombok</artifactId>
        <optional>true</optional>
    </dependency>
</dependencies>

<dependencyManagement>
    <dependencies>
        <dependency>
            <groupId>org.springframework.ai</groupId>
            <artifactId>spring-ai-bom</artifactId>
            <version>1.1.4</version>
            <type>pom</type>
            <scope>import</scope>
        </dependency>
    </dependencies>
</dependencyManagement>

2.2 配置文件

# application.yml
spring:
  ai:
    openai:
      api-key: ${OPENAI_API_KEY}
      base-url: https://api.openai.com
      image:
        options:
          model: gpt-image-2           # GPT-Image-2的API模型名
          quality: high                 # 图片质量:low / medium / high
          size: 1024x1024             # 默认尺寸
          response-format: b64_json    # 返回base64编码

2.3 核心服务类

package com.example.aigc.service;

import lombok.RequiredArgsConstructor;
import lombok.extern.slf4j.Slf4j;
import org.springframework.ai.image.*;
import org.springframework.ai.openai.OpenAiImageOptions;
import org.springframework.stereotype.Service;

import java.io.IOException;
import java.nio.file.*;
import java.util.*;

/**
 * GPT-Image-2 图像生成服务
 */
@Slf4j
@Service
@RequiredArgsConstructor
public class ImageGenerationService {

    private final ImageModel imageModel;

    /**
     * 基础图像生成
     *
     * @param prompt  中文提示词
     * @param width   宽度
     * @param height  高度
     * @param quality 质量:low / medium / high
     * @return Base64编码的图片数据
     */
    public String generateImage(String prompt, int width, int height, String quality) {
        OpenAiImageOptions options = OpenAiImageOptions.builder()
                .model("gpt-image-1")
                .quality(quality)
                .size(width + "x" + height)
                .responseFormat("b64_json")
                .build();

        ImagePrompt imagePrompt = new ImagePrompt(prompt, options);
        ImageResponse response = imageModel.call(imagePrompt);

        String b64Data = response.getResult().getOutput().getB64Json();
        log.info("图像生成成功,提示词: {}...", prompt.substring(0, Math.min(50, prompt.length())));
        return b64Data;
    }

    /**
     * 生成图像并保存到文件
     */
    public String generateAndSave(String prompt, int width, int height,
                                   String quality, String outputPath) throws IOException {
        String b64Data = generateImage(prompt, width, height, quality);
        byte[] imageBytes = Base64.getDecoder().decode(b64Data);
        Path path = Paths.get(outputPath);
        Files.createDirectories(path.getParent());
        Files.write(path, imageBytes);
        log.info("图像已保存至: {}", outputPath);
        return outputPath;
    }

    /**
     * 批量生成图像变体
     */
    public List<String> generateVariants(String promptTemplate,
                                          List<Map<String, String>> variables,
                                          String outputDir) throws IOException {
        List<String> results = new ArrayList<>();
        Path dir = Paths.get(outputDir);
        Files.createDirectories(dir);

        for (int i = 0; i < variables.size(); i++) {
            Map<String, String> vars = variables.get(i);
            String prompt = promptTemplate;
            for (Map.Entry<String, String> entry : vars.entrySet()) {
                prompt = prompt.replace("{" + entry.getKey() + "}", entry.getValue());
            }

            log.info("[{}/{}] 正在生成: {}", i + 1, variables.size(),
                    vars.values().iterator().next());

            String b64Data = generateImage(prompt, 1024, 1024, "high");
            byte[] imageBytes = Base64.getDecoder().decode(b64Data);
            String filename = outputDir + "/variant_" + (i + 1) + ".png";
            Files.write(Paths.get(filename), imageBytes);
            results.add(filename);

            log.info("  → 已保存: {}", filename);
        }
        return results;
    }

    /**
     * 生成透明背景图像(Logo/图标专用)
     */
    public String generateTransparentImage(String prompt) {
        // 注意:透明背景需要通过底层API设置 background=transparent
        // Spring AI 1.1.4 中可通过自定义选项实现
        String enhancedPrompt = prompt + "。纯透明背景,无任何背景元素,PNG格式适用。";

        OpenAiImageOptions options = OpenAiImageOptions.builder()
                .model("gpt-image-1")
                .quality("high")
                .size("1024x1024")
                .responseFormat("b64_json")
                .build();

        ImagePrompt imagePrompt = new ImagePrompt(enhancedPrompt, options);
        ImageResponse response = imageModel.call(imagePrompt);
        return response.getResult().getOutput().getB64Json();
    }
}

2.4 REST控制器

package com.example.aigc.controller;

import com.example.aigc.service.ImageGenerationService;
import lombok.RequiredArgsConstructor;
import org.springframework.http.*;
import org.springframework.web.bind.annotation.*;

import java.io.IOException;
import java.util.Base64;

/**
 * 图像生成API控制器
 */
@RestController
@RequestMapping("/api/image")
@RequiredArgsConstructor
public class ImageController {

    private final ImageGenerationService imageService;

    /**
     * 根据提示词生成图像
     */
    @PostMapping("/generate")
    public ResponseEntity<byte[]> generate(
            @RequestParam String prompt,
            @RequestParam(defaultValue = "1024") int width,
            @RequestParam(defaultValue = "1024") int height,
            @RequestParam(defaultValue = "high") String quality) {

        String b64Data = imageService.generateImage(prompt, width, height, quality);
        byte[] imageBytes = Base64.getDecoder().decode(b64Data);

        HttpHeaders headers = new HttpHeaders();
        headers.setContentType(MediaType.IMAGE_PNG);
        headers.setContentDisposition(
                ContentDisposition.inline().filename("generated.png").build());

        return new ResponseEntity<>(imageBytes, headers, HttpStatus.OK);
    }

    /**
     * 生成图像并保存到服务器
     */
    @PostMapping("/generate-and-save")
    public ResponseEntity<String> generateAndSave(
            @RequestParam String prompt,
            @RequestParam(defaultValue = "1024") int width,
            @RequestParam(defaultValue = "1024") int height,
            @RequestParam(defaultValue = "high") String quality,
            @RequestParam(defaultValue = "output/image.png") String outputPath)
            throws IOException {

        String savedPath = imageService.generateAndSave(
                prompt, width, height, quality, outputPath);
        return ResponseEntity.ok("图像已保存至: " + savedPath);
    }

    /**
     * 生成透明背景图像
     */
    @PostMapping("/generate-transparent")
    public ResponseEntity<byte[]> generateTransparent(@RequestParam String prompt) {
        String b64Data = imageService.generateTransparentImage(prompt);
        byte[] imageBytes = Base64.getDecoder().decode(b64Data);

        HttpHeaders headers = new HttpHeaders();
        headers.setContentType(MediaType.IMAGE_PNG);
        return new ResponseEntity<>(imageBytes, headers, HttpStatus.OK);
    }
}

🔤 三、文字渲染能力(最大突破)

这是GPT-Image-2相比DALL·E 3最显著的进步——能在图片中准确渲染中英文文字。

3.1 咖啡店菜单板

提示词:
深绿色复古咖啡店黑板菜单,纯粉笔手写质感字体,黑板哑光肌理,文字用白色 + 淡黄色粉笔书写,内容排版工整:
今日特饮
焦糖拿铁 - ¥32
抹茶星冰乐 - ¥38
现烤羊角面包 - ¥25
黑板四周点缀简约手绘小咖啡杯、咖啡豆简笔画装饰,柔和暖光氛围感,复古文艺咖啡厅慵懒温馨格调,写实质感,细节清晰,构图居中对称,治愈系暖色调,高清细腻

在这里插入图片描述

/**
 * 文字渲染示例:咖啡店菜单
 */
@GetMapping("/demo/menu")
public ResponseEntity<byte[]> generateMenu() {
    String prompt = """
            深绿色复古咖啡店黑板菜单,纯粉笔手写质感字体,黑板哑光肌理,文字用白色 + 淡黄色粉笔书写,内容排版工整:
            今日特饮
            焦糖拿铁 - ¥32
            抹茶星冰乐 - ¥38
            现烤羊角面包 - ¥25
            黑板四周点缀简约手绘小咖啡杯、咖啡豆简笔画装饰,柔和暖光氛围感,复古文艺咖啡厅慵懒温馨格调,写实质感,细节清晰,构图居中对称,治愈系暖色调,高清细腻
            """;

    String b64 = imageService.generateImage(prompt, 1536, 1024, "high");
    byte[] bytes = Base64.getDecoder().decode(b64);

    return ResponseEntity.ok()
            .contentType(MediaType.IMAGE_PNG)
            .body(bytes);
}

3.2 Logo与品牌设计

提示词:
极简科技风创业公司 Logo,纯白色背景,矢量设计,线条干净利落。
中文名称「架构源启」采用现代无衬线简约字体,字体主体为纯色,专属创意设计:“源” 字上方一点替换为水滴造型,水滴做蓝紫渐变配色,色值 #0066FF 至 #9933FF。
中文下方搭配小字英文:Architecture Origin,排版规整平衡。整体极简高级、商务科技感,适配浅色与深色双背景使用,
画面底部添加小字文案:欢迎关注 架构源启,扁平化矢量 LOGO,高清精致、构图居中。

在这里插入图片描述

3.3 电影海报设计

提示词:
一张科幻电影海报,电影名为"地平线之上"。
标题"地平线之上"使用大号未来感金属铬合金质感字体,位于海报上方。
标题下方有一行副标题:"2156年,沉默是最致命的武器。"
海报底部使用小号字体标注:
"导演:架构源启 | 主演:‌刘亦菲 & 易烊千玺 & 吴京 & 迪丽热巴‌"
右下角有"PG-13"的分级标识。
背景画面:一个孤独的宇航员站在如玻璃般的星球表面上,
脚下反射着一颗即将熄灭的恒星。
色彩方案:深海军蓝、电光青色、温暖琥珀色。
电影级质感,戏剧性光影效果。

在这里插入图片描述

3.4 表情包制作

提示词:
一张搞笑的互联网表情包图片。一只惊讶的橘猫坐在桌子前,
面前放着一台笔记本电脑,猫戴着一副迷你阅读眼镜。
猫的上方用粗体白色Impact字体(带黑色描边)写着:"老板居然不画大饼"
猫的下方写着:"你在逗我?"
猫的表情极度夸张地震惊。明亮的室内光线,照片写实风格。

在这里插入图片描述

3.5 产品包装文字

提示词:
一款高端中国绿茶的包装盒设计。盒子采用哑光黑色材质,配以金箔点缀。
产品名称"翠峰"以优雅的中国书法风格大字呈现,
下方用精致的衬线英文标注"Architecture Origin"。
附加文字信息:"特选宇治抹茶 | 30克"
以及"西湖龙井产地直供"小字说明。
整体设计极简,仅以一片茶叶的金色线描作为装饰点缀。
高级感,中国古典美学。

在这里插入图片描述

3.6 中文书法风格

提示词:
一幅中国传统书法作品,宣纸质感背景。
主体内容为行书风格书写的"但行好事,莫问前程"八个大字,
墨色浓淡有致,飞白效果自然。
左下角有一方朱红色的印章,印章内容为"观自在"三字篆书。
右侧有一列小字落款:"甲辰年春月书于京华"。
整体构图留白充分,符合中国传统书法的审美法则。
宣纸的纹理和墨迹的渗透效果要真实自然。

在这里插入图片描述


✏️ 四、图像编辑能力

4.1 Spring AI 图像编辑服务

package com.example.aigc.service;

import lombok.RequiredArgsConstructor;
import lombok.extern.slf4j.Slf4j;
import org.springframework.ai.image.*;
import org.springframework.ai.openai.OpenAiImageOptions;
import org.springframework.core.io.ClassPathResource;
import org.springframework.stereotype.Service;

import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Path;
import java.util.Base64;

/**
 * 图像编辑服务
 * 注意:Spring AI 1.1.4 对图像编辑的支持可能需要通过底层API直接调用
 * 以下展示推荐的封装方式
 */
@Slf4j
@Service
@RequiredArgsConstructor
public class ImageEditService {

    private final ImageModel imageModel;

    /**
     * 基于文字描述编辑图像
     * 将原图的指定区域(mask白色部分)替换为新内容
     *
     * @param originalImagePath 原图路径
     * @param maskImagePath     遮罩图路径(白色=需修改区域,黑色=保留区域)
     * @param editPrompt        编辑指令(中文)
     * @return 编辑后的图片Base64
     */
    public String editImage(String originalImagePath, String maskImagePath,
                            String editPrompt) throws IOException {
        // Spring AI 1.1.4 中通过 ImagePrompt 实现编辑
        // 部分版本需要使用底层 OpenAI Client 直接调用

        log.info("开始编辑图像,指令: {}", editPrompt);

        // 读取原图和遮罩
        byte[] originalImage = Files.readAllBytes(Path.of(originalImagePath));
        byte[] maskImage = Files.readAllBytes(Path.of(maskImagePath));

        String originalB64 = Base64.getEncoder().encodeToString(originalImage);
        String maskB64 = Base64.getEncoder().encodeToString(maskImage);

        // 构建编辑提示词,包含原图信息
        OpenAiImageOptions options = OpenAiImageOptions.builder()
                .model("gpt-image-1")
                .quality("high")
                .size("1024x1024")
                .responseFormat("b64_json")
                .build();

        ImagePrompt imagePrompt = new ImagePrompt(editPrompt, options);
        ImageResponse response = imageModel.call(imagePrompt);

        log.info("图像编辑完成");
        return response.getResult().getOutput().getB64Json();
    }

    /**
     * 使用底层OpenAI API进行图像编辑(更完整的支持)
     */
    public String editImageWithOpenAiClient(String originalImagePath,
                                             String maskImagePath,
                                             String editPrompt)
            throws IOException {
        // 对于完整的编辑功能,推荐使用OpenAI Java SDK直接调用
        // 以下为概念实现

        /*
        OpenAI client = new OpenAI(System.getenv("OPENAI_API_KEY"));

        ImageEditRequest request = ImageEditRequest.builder()
                .model("gpt-image-1")
                .image(Path.of(originalImagePath))
                .mask(Path.of(maskImagePath))
                .prompt(editPrompt)
                .size("1024x1024")
                .build();

        ImageResponse response = client.images().edit(request);
        return response.getData().get(0).getB64Json();
        */

        log.warn("完整图像编辑功能需要使用OpenAI Java SDK直接调用");
        return editImage(originalImagePath, maskImagePath, editPrompt);
    }
}

4.2 智能物体替换

编辑场景:一张客厅照片
遮罩区域:覆盖沙发位置

提示词:
将沙发替换为一张奢华的祖母绿丝绒L形转角沙发,
配以金色金属腿。沙发上放两个配套的靠枕,颜色为奶油白和金色。
保持原图的光线方向、阴影效果和房间透视关系完全一致。
新沙发的材质要体现丝绒的光泽和质感。

4.3 背景替换

编辑场景:一张产品照片(白色背景)
遮罩区域:覆盖整个背景

提示词:
将这个产品放置在一张质朴的实木桌面上,
柔和的清晨阳光从左侧窗户照射进来,形成自然的光影。
背景是一个温馨的厨房场景,添加轻微的散景虚化效果,色调偏暖。
完整保留产品本身的颜色、反光和比例,不做任何修改。
桌面上可以散落一些与产品相关的自然元素作为点缀。

4.4 季节变换

编辑场景:一张夏天的街景照片
遮罩区域:覆盖整个背景(保留建筑轮廓)

提示词:
将这个夏天的街景转换为梦幻的冬日雪景。
屋顶和人行道上覆盖着新鲜的积雪,空中飘着轻柔的雪花,
商店橱窗透出温暖的金色灯光,树枝上结着霜花。
街灯在雪地上投射出温暖的光晕。天空是暮色蓝紫色调。
整体氛围温馨浪漫,像一张圣诞贺卡。

4.5 人物造型变换

编辑场景:一张人物半身照
遮罩区域:覆盖服装部分

提示词:
将人物的现有服装替换为一套中国传统汉服:
上衣为交领右衽的浅蓝色丝绸衫,绣有白色梅花暗纹,
外搭一条深靛蓝色的宽袖外衫。
衣领和袖口有精致的金色云纹镶边。
保持人物的面部表情、姿势和原始光线完全不变。
服装的褶皱和光影要与人物的身体姿态自然贴合。

🎨 五、风格控制提示词大全

5.1 写实摄影风格

📷 专业人像摄影
提示词:
一张20岁中国年轻美女的人像摄影作品,短发波波头,自然妆容。
使用佳能EOS R5相机,85mm f/1.4镜头拍摄。
柔和的自然窗光从左侧照射,形成优雅的伦勃朗光效。
浅景深,背景呈现奶油般的柔美散景。
色彩调校:高光偏暖,阴影区略微降低饱和度。
8K分辨率,杂志封面级画质。
RAW照片风格,无过度修图痕迹。

在这里插入图片描述

/**
 * 人像摄影生成示例
 */
@GetMapping("/demo/portrait")
public ResponseEntity<byte[]> generatePortrait() {
    String prompt = """
           一张20岁中国年轻美女的人像摄影作品,短发波波头,自然妆容。
            使用佳能EOS R5相机,85mm f/1.4镜头拍摄。
            柔和的自然窗光从左侧照射,形成优雅的伦勃朗光效。
            浅景深,背景呈现奶油般的柔美散景。
            色彩调校:高光偏暖,阴影区略微降低饱和度。
            8K分辨率,杂志封面级画质。
            RAW照片风格,无过度修图痕迹。
            """;

    String b64 = imageService.generateImage(prompt, 1024, 1536, "high");
    byte[] bytes = Base64.getDecoder().decode(b64);

    return ResponseEntity.ok()
            .contentType(MediaType.IMAGE_PNG)
            .body(bytes);
}
📷 商业产品摄影
提示词:
一张高端腕表的商业产品照片。瑞士自动机芯计时码表,
午夜蓝色表盘,玫瑰金表壳,棕色鳄鱼皮表带。
无缝渐变灰色背景上拍摄。三点式影棚布光:
45度角主灯在表盘上形成精致反光,补光灯柔化阴影,
轮廓灯勾勒表壳边缘的高光线条。
焦点堆叠确保全局锐利。商业广告级画质。

在这里插入图片描述

📷 美食摄影
提示词:
一组日本怀石料理的俯拍美食摄影。
画面包含:蓝色陶瓷盘中精致摆放的刺身拼盘,
漆器碗中的味噌汤,烤鱼配柚子,以及时令蔬菜小碟。
所有餐具摆放在深色石板台面上,配以天然木质筷子。
柔和的散射自然光从右上方照射。
色彩鲜艳,鱼肉纹理清晰可见,味噌汤上方有轻微的蒸汽升腾。
45度角拍摄以体现层次感。
《架构源启-人间风味》杂志美食摄影风格。

在这里插入图片描述

📷 风光摄影
提示词:
一张壮观的风光摄影作品,展现中国张家界的砂岩柱林。
清晨时分,云海在石柱之间翻涌,阳光穿透云层形成耶稣光。
前景是一棵古松斜伸在悬崖边,松枝上挂着薄薄的晨露。
中景是层叠的砂岩柱,若隐若现于云雾之中。
远景是连绵的山峦轮廓,逐渐淡入天际。
使用尼康Z9相机,24-70mm f/2.8镜头的24mm端拍摄,
f/11光圈确保前后景都清晰。
色调偏青蓝,但晨光部分保留温暖的金色。
国家地理杂志级别的风光摄影水准。

在这里插入图片描述

前方高能干货继续放送,由于个人钱包率先扛不住压力,经费紧急告罄,后续就不额外插图了。省下算力留给大家练手,咱们文字照样把知识点讲透~

5.2 插画与动漫风格

🎌 日式动漫风格
提示词:
一个吉卜力工作室风格的动画场景。
一个长着飘逸赤褐色头发的少女站在一望无际的薰衣草花田中。
她穿着白色连衣裙,手持草帽,裙摆被风轻轻吹起。
天空中漂浮着巨大的积雨云,蔚蓝天色纯净透亮。
远处有一座欧式风车磨坊。
用宫崎骏电影特有的柔和水彩风格绘制。
温暖的午后黄金时刻光线。
充满怀旧感和梦幻氛围。
赛璐珞上色风格,可以看到细腻的笔触。
🎨 美式漫画风格
提示词:
一个漫威漫画风格的超级英雄角色设计。
一位女性英雄,双拳周围噼啪作响着电蓝色能量光弧。
她穿着流线型的深海军蓝配银色战衣,上面有几何图案纹路。
动态动作姿势,正在半空中跃起。
粗犷的墨线勾勒轮廓,用交叉排线营造阴影效果。
背景使用半调网点图案。鲜艳浓烈的漫画着色风格。
画面中有一个对话气泡,内容写着:"够了!"
🖌️ 现代扁平插画
提示词:
一幅现代扁平风格插画,展示一个多元化团队在科技创业公司办公室里协作的场景。
画面包含:一位女性在双屏显示器前写代码,一位男性在平板上画设计稿,
两个人在贴满便签纸的白板前讨论方案。
使用等距(Isometric)透视角度。
干净的几何形状,限定配色方案(珊瑚色、青色、奶油色、炭灰色)。
无轮廓线,纯色块填充配以细微的阴影。
Dribbble/Behance 编辑插画风格。
🌸 水彩风格
提示词:
一幅威尼斯运河日落时分的水彩画。
几艘贡多拉停泊在古旧建筑旁,建筑外墙是赭石色和土红色。
水面上波光粼粼,倒映着天空和建筑。
使用松散、写意的水彩技法,保留可见的画纸纹理,
湿对湿技法形成的色彩自然渗透晕染效果,
留有刻意不上色的白色空间。边缘柔和,水洗般的通透质感。
配色:赭石、镉黄、天蓝、玫瑰红。
🖊️ 中国水墨画
提示词:
一幅传统中国水墨山水画。
远山如黛,层峦叠嶂,以淡墨渲染出空灵的雾气效果。
中景有一座小桥流水,桥上有一位身穿长衫的文人撑着油纸伞。
近景是几棵苍劲的松树,用浓墨粗笔勾勒枝干,
松针以散锋点染。溪流以留白手法表现水面。
右上角题有"山高水长"四字行书,
左下角盖有一方朱红印章。
构图遵循"三远法"——高远、深远、平远。
整体意境空灵悠远,符合"气韵生动"的美学追求。
宣纸质感,墨色五级——焦、浓、重、淡、清。

5.3 3D与科技风格

🎮 3D卡通渲染
提示词:
一个可爱的3D渲染角色:一个机器人咖啡师正在制作咖啡。
机器人有着圆润的白色身体,发光的蓝色护目镜作为眼睛,
小巧的关节手臂正握着咖啡手柄。
站在一台迷你意式咖啡机后面。
皮克斯风格的角色设计。
柔和的环境光遮蔽,白色塑料外壳上有次表面散射光效。
温暖的咖啡馆灯光氛围。
Octane/Blender Cycles级别的渲染质量。
干净的摄影棚背景,地面有轻微的倒影。
💎 毛玻璃设计风格(Glassmorphism)
提示词:
一个未来感的天气应用UI卡片悬浮在太空中。
磨砂玻璃面板,透明度约20%,背景是模糊的紫色到蓝色极光渐变。
卡片上显示的内容:
城市名"上海"使用白色半粗体字
温度"26°C"使用大号细字体
一个极简的太阳图标
"湿度 72% | 风速 12km/h"小字信息
卡片边缘有细微的白色发光边框,下方有柔和的投影。
卡片周围漂浮着一些小水滴,水滴折射着光线。
深色模式美学风格。
🔮 赛博朋克风格
提示词:
一个赛博朋克风格的新东京街景,时间设定在2089年。
狭窄的巷道两旁是高耸入云的建筑,外墙覆盖着全息投影广告,
广告内容有中文和日文。霓虹灯招牌的光芒倒映在地面的雨水中。
一个穿着连帽夹克的孤独身影背对镜头走向远方,
身影在霓虹灯光中形成剪影。
主色调:电光品红、青色、深紫色,与深沉的暗影形成强烈对比。
画面中有体积雾、雨丝效果和镜头光晕。
《银翼杀手》与《阿基拉》的美学融合。
超高细节,电影宽银幕比例。

5.4 艺术与复古风格

🖼️ 古典油画风格
提示词:
一幅荷兰黄金时代大师风格的油画静物。
深色木桌上摆放着:一个削了一半的柠檬,螺旋形的皮悬挂着;
一只盛着红酒的银质高脚杯;紫色的葡萄串;
一颗裂开的核桃;以及一朵即将凋谢的玫瑰。
光线从左上方照射,形成戏剧性的明暗对比效果。
画面高光处可见厚涂法(Impasto)的笔触肌理。
深赭色背景。博物馆收藏级构图。
蕴含虚空画(Vanitas)的象征寓意。
📺 像素艺术风格
提示词:
一个16位像素艺术风格的中世纪奇幻小镇广场场景。
画面包含:广场中央的石砌喷泉,带铁砧的铁匠铺,
橱窗里摆满彩色药瓶的魔药商店,以及在广场上来来往往的小镇居民。
鹅卵石铺就的地面。
风格参考经典SNES游戏(如《时空之轮》/《最终幻想6》)。
每个精灵图使用有限的调色板。
渐变效果使用抖动(Dithering)技法实现。
画布尺寸320×240像素,放大显示。
🎞️ 80年代复古风格
提示词:
一张1980年代复古未来主义风格的专辑封面。
一辆镀铬的德罗宁风格跑车行驶在霓虹网格公路上,
公路笔直延伸至地平线。公路两旁是剪影效果的棕榈树。
背景是一轮巨大的落日(粉色到橙色渐变),占据画面主体。
合成波/蒸汽波美学风格。
画面顶部用金属质感的80年代字体写着"午夜飞驰",
文字上有水平扫描线效果。
配色:热粉色、电光紫、镀铬银、日落橙。
🇨🇳 敦煌壁画风格
提示词:
一幅敦煌莫高窟壁画风格的飞天仙女画作。
画面中央是一位体态优美的飞天仙女,长长的彩带随风飘动,
形成优雅的S形曲线。仙女身穿赭红色和石绿色的唐代服饰,
头戴宝冠,手持琵琶,在祥云间翩翩起舞。
背景是佛光和莲花纹样,色彩使用矿物颜料的质感——
石青、石绿、朱砂、赭石、土黄。
画面有岁月侵蚀的斑驳感和矿物颜料的颗粒质感。
整体构图参考莫高窟第112窟"反弹琵琶"飞天。

📐 六、高级构图与场景控制

6.1 精确空间布局

提示词:
一张精心构图的风景摄影,严格遵循三分法则布局:
- 左侧三分之一:一棵古老的橡树,树干苍劲,枝丫伸展
- 中间区域:一条蜿蜒的泥土小路通向画面深处
- 右侧三分之一:一座小型石砌农舍,烟囱冒着袅袅炊烟
- 前景:野花丛(罂粟花和雏菊混生)
- 中景:起伏的翠绿山丘,木栅栏蜿蜒其间
- 远景:笼罩在薄雾中的蓝色山峦,上方是戏剧性的多云天空
黄金时刻的光线从右侧照射。使用广角24mm镜头拍摄。
大景深,前后景都保持清晰。

6.2 多主体复杂场景

提示词:
一个热闹的台北夜市场景,包含多个焦点:
1. 左前方:一个摊贩正在烤台湾香肠,炭火的烟雾和蒸汽戏剧性地升腾,
   头顶一盏暖色吊灯照亮了摊位
2. 右前方:一对年轻情侣共同分享一杯珍珠奶茶,
   女生正笑着指向远处的什么东西
3. 中部上方:成排的红色灯笼如华盖般串挂在头顶,营造出喜庆的光影
4. 左侧背景:一座传统庙宇牌坊,飞檐翘角,雕梁画栋
5. 右侧背景:现代建筑上的LED广告牌,显示着中文广告内容
6. 散布其中:其他逛街的游客、一个手持气球的小孩
整体氛围:温暖、热闹、微微湿润(空气中可见的热气)。
混合光源:暖色灯笼光、冷色LED广告光、金色食物摊位灯光。
平视角度,35mm镜头,中等景深。

6.3 特殊视角控制

🔭 鸟瞰俯视视角
提示词:
一张正上方垂直俯拍(鸟瞰视角/俯视图)的照片,
拍摄一个完美圆形的日式枯山水禅意庭园。
以中央一块覆盖着苔藓的大石为圆心,沙砾上耙出了同心圆形的波纹。
四个方位各放置一块较小的石头。
右下象限的沙面上静静躺着一片红色枫叶。
正午阳光直射,每块石头下方投射出短小的正下方阴影。
无人机航拍风格,高度约60米。极简构图,充满禅意。
👁️ 仰视虫眼视角
提示词:
一张极端低角度仰拍(虫眼视角)照片,从地面直接向上拍摄,
穿过一片茂密的竹林。竹竿向中心的天空汇聚,
形成强烈的透视消失点效果。
阳光穿过竹叶形成丁达尔光线(耶稣光)。
画面中央偏上位置有一只飞行中的红色蜻蜓。
使用14mm超广角镜头拍摄,产生戏剧性的透视变形。
翠绿的竹冠与蓝天形成鲜明对比。
🔍 微距特写视角
提示词:
一张极致的微距摄影作品,拍摄一滴晨露停留在一片草叶尖端。
水滴内部折射出一个倒置的日出风景画面。
焦点堆叠确保水滴完全清晰,而草叶则逐渐虚化为柔美的散景。
水滴像一个天然的透镜。清晨金色的光线在水滴右上方
形成一个明亮的高光点。
水滴表面的表面张力形成的弯月面清晰可见。
放大比例5:1。绿色草叶与金色阳光形成冷暖对比。

🌈 七、高级光影与氛围控制

7.1 电影级光影

🎬 黑色电影风格(Film Noir)
提示词:
一个黑色电影风格的侦探场景。
一个戴着费多拉毡帽、穿着风衣的男人站在被雨水浸透的巷子里。
唯一的光源是一块闪烁的霓虹灯招牌,上面写着"旅馆"二字,
从右上方投射出刺目的红色光线。
浓重的阴影遮住了他半边脸。
一缕香烟的烟雾在光柱中袅袅上升。
背光中可以看到雨丝的条纹。水坑映出霓虹的倒影。
黑白画面,但霓虹招牌保留红色(选择性着色)。
高对比度,深沉的黑色调,压暗的阴影细节。
1940年代的神秘氛围。变形宽银幕镜头光晕。
胶片颗粒质感叠加。
🌅 魔幻时刻
提示词:
一位独奏的女大提琴手在海边悬崖顶上演奏,正值黄金时刻。
她的白色长裙在风中飘动。夕阳半隐在云层后方,
射出戏剧性的丁达尔光线(耶稣光)扇形地照射天空。
色彩方案:熔金色、温暖琥珀色、阴影中的柔和薰衣草紫、
海面上的深靛蓝色。
逆光在大提琴手和乐器边缘勾勒出一圈发光的轮廓光。
使用长焦镜头压缩背景。电影级2.39:1宽银幕比例。
空灵的、充满情感的氛围。

7.2 特殊光效

✨ 霓虹灯光效
提示词:
一张年轻女性面部的特写人像,面部被交叉的霓虹灯光分别照亮——
左侧是粉色霓虹光,右侧是蓝色霓虹光。
在鼻梁处两种色光交汇融合成紫色。
她的眼睛中可以看到霓虹灯管的倒影(眼神光)。
皮肤有轻微的水润光泽,可以捕捉彩色光线。
深色背景。面前有一面玻璃表面,上面有水滴,
每一滴水珠都折射出霓虹的色彩。
水滴上的浅景深效果。时尚杂志编辑摄影风格。
🕯️ 烛光氛围
提示词:
一个完全由烛光照明的亲密晚餐场景。
圆桌上放着三根铜烛台中的细长蜡烛。
温暖的、摇曳的烛光在身后有纹理的灰泥墙上投射出跳动的影子。
桌上有:两杯红酒在烛火背光下如红宝石般闪亮,
一盘意大利面,一个小花瓶里插着干花。
光线迅速衰减——房间的角落完全沉浸在黑暗中。
暖色温约2700K。墙上呈现伦勃朗式的三角光斑。
油画般的质感和氛围。
🌙 月光场景
提示词:
一座中国江南古镇的月夜景色。
圆月高悬天际,月光如水银般洒满整个画面。
古镇的白墙黛瓦在月光下呈现冷蓝色调,
小桥下的河水映着月亮的倒影,水面微波荡漾。
一艘乌篷船静静停泊在河边,船上挂着一盏昏黄的灯笼,
是画面中唯一的暖色光源。
远处有几户人家的窗户透出微弱的暖光。
整体色调以冷蓝、银灰为主,暖黄为点缀。
宁静、诗意的氛围。如同"月落乌啼霜满天"的意境。

🧠 八、高级提示词工程技巧

8.1 结构化提示词模板

最佳提示词结构(按优先级排列):

【主体描述】  → 画面的核心内容(最重要!)
【风格指定】  → 艺术风格、媒介、参考作品
【构图控制】  → 视角、布局、比例
【光影氛围】  → 光源方向、色温、时间
【色彩方案】  → 主色调、配色关系
【细节补充】  → 材质、纹理、小物件
【技术参数】  → 相机、镜头、分辨率(写实风格时使用)
【否定描述】  → 明确不想要的元素(可选)

8.2 万能模板实战

按模板套用的完整提示词:

【主体描述】一位睿智的老年图书馆管理员坐在皮质扶手椅中,
正在阅读一本厚重的镶金页边的古书

【风格指定】采用古典写实主义油画风格绘制,油彩画布质感,
博物馆馆藏级作品水准

【构图控制】中景镜头,略微仰拍视角,
主体位于三分法左侧竖线位置

【光影氛围】温暖的室内照明,右侧台灯为主光源,
左侧高窗投入柔和的自然光作为辅助光,
傍晚时分,光束中可以看到空气中漂浮的微小灰尘

【色彩方案】浓郁的暖色调——勃艮第红、深森林绿、
古典金色、红木棕色。阴影区采用略微降低饱和度的冷色调

【细节补充】背景是从地板到天花板的书架,略微虚化。
扶手上蜷缩着一只姜黄色的猫正在睡觉。
老人的阅读眼镜推到了额头上。
书中夹着一枚皮质书签。旁边小桌上有一杯冒着热气的茶

【技术参数】等效50mm镜头效果,f/2.8光圈,
画面边缘有自然的暗角效果

【否定描述】不要出现任何现代元素,不要有电子屏幕,
不要使用明亮的人工照明

8.3 质量提升关键词速查表

通用质量提升词汇(中文提示词中也可混用英文术语):

┌─────────────────────────────────────────────────────────┐
│ 分类         │ 关键词                                    │
├──────────────┼───────────────────────────────────────────┤
│ 分辨率/清晰度 │ 超高清、8K分辨率、极致细节、锐利对焦、       │
│              │ 细节丰富                                   │
├──────────────┼───────────────────────────────────────────┤
│ 专业品质      │ 专业摄影级、获奖作品、大师级、杂志级画质、    │
│              │ 商业广告品质、博物馆收藏级                   │
├──────────────┼───────────────────────────────────────────┤
│ 渲染质量      │ 光线追踪、全局光照、Octane渲染、             │
│              │ 虚幻引擎5品质                               │
├──────────────┼───────────────────────────────────────────┤
│ 光影效果      │ 体积光、丁达尔光线(耶稣光)、戏剧性光影、   │
│              │ 轮廓光、明暗对比法、黄金时刻光线              │
├──────────────┼───────────────────────────────────────────┤
│ 氛围情感      │ 大气磅礴、情绪感强烈、空灵飘渺、电影质感、   │
│              │ 史诗感、宁静祥和、奇幻梦幻                   │
├──────────────┼───────────────────────────────────────────┤
│ 细节纹理      │ 精细纹理、微妙的渐变过渡、可见的笔触(绘画)、│
│              │ 材质质感真实、肌理丰富                       │
└──────────────┴───────────────────────────────────────────┘

💡 九、实战场景提示词合集

9.1 电商产品图

👟 产品展示图
提示词:
一张高端无线降噪耳机的商业产品照片。
颜色:哑光午夜蓝,配以拉丝铝合金铰链。
耳机以15度微倾角度悬浮在干净的渐变灰白背景上。
三点式影棚布光:45度角主灯在耳罩上形成精致反光,
补光灯柔化阴影,轮廓灯勾勒铝合金边缘的高光线条。
其中一只耳罩略微旋转,展示内部蓬松的记忆海绵耳垫。
底部有一道轻微的阴影暗示耳机在悬浮状态。
苹果产品摄影风格。超级干净、极简、高端质感。
4K产品细节特写。
🧴 场景化产品图
提示词:
一瓶高端护肤精华液(磨砂玻璃瓶身,玫瑰金瓶盖),
放置在一块天然石板上,周围环绕着新鲜的原料:
切开的血橙片、迷迭香枝、从蜜勺上滴落的蜂蜜、
以及散落的粉红色喜马拉雅盐粒。
清晨阳光从窗户射入,形成明确的硬光阴影和明亮高光。
瓶身表面有几滴水珠,增添清新感。
纯净美容品牌美学风格。从上方30度角俯拍。
Aesop/Glossier品牌编辑摄影风格。
👗 服装展示图
提示词:
一件中国风改良旗袍的电商展示照片。
旗袍面料为深藏蓝色丝绸,上面有精致的手工刺绣白色梅花图案。
立领、盘扣细节清晰可见。旗袍展示在一个无头模特衣架上,
采用45度角侧面展示,可以同时看到正面和侧面的剪裁线条。
纯白色背景,柔和的影棚散射光照明。
面料的丝绸光泽和刺绣的立体质感要清晰体现。
淘宝/天猫高端女装商品图风格。

9.2 UI/UX设计

📱 手机App界面
提示词:
一个高端的iPhone 15 Pro样机(钛合金边框),
屏幕上显示着一款健身追踪App的UI界面。屏幕内容:
- 顶部显示"早上好,小雅"的问候语,配以挥手的emoji
- 一个圆形进度环显示"8,432步",绿色到青色的渐变动效
- 心率卡片:"72次/分",配一条迷你折线图
- 睡眠卡片:"7小时24分",配月亮图标和质量条形图
- 底部导航栏:首页、运动、营养、个人中心
深色模式UI设计,OLED友好的纯黑背景。强调色:电光青色。
手机略微旋转10度,悬浮状态配以柔和阴影。
干净的白色/浅灰背景。Dribbble展示级作品。
🖥️ 数据仪表盘
提示词:
一个数据分析仪表盘界面,显示在27英寸iMac屏幕上。
仪表盘内容:
- 标题栏:"营收概览 — 2024年第四季度",配日期选择器
- 大型面积图展示月度营收趋势(蓝色渐变填充)
- 一排四个关键指标卡片:
  营收(240万 ↑12%)、用户数(4.8万 ↑8%)、
  转化率(3.2% ↑0.5%)、流失率(1.8% ↓0.3%)
- 左下方:分类营收环形图
- 右下方:Top10产品排行表,配迷你折线图
现代毛玻璃风格卡片,深色主题(#0F172A背景色),
强调色:电光蓝和翡翠绿。干净的数据可视化设计。
Figma/Linear设计品质。

9.3 自媒体/社交媒体

📸 小红书封面图
提示词:
一张白色大理石台面上的平铺摆拍(flat lay)照片。
画面中央是一本打开的笔记本,上面用整齐的黑色墨水手写着:
"2025年书单推荐 📚"
周围精心摆放的物品:
- 一杯有拉花的抹茶拿铁
- 一盆白色陶瓷小花盆里的多肉植物
- 三本叠放的莫兰迪色系封面书籍
- 一枚金色回形针和一卷和纸胶带
- 散落的干花花瓣(满天星)
- 一副金色圆框眼镜
柔和的散射自然光从上方照射。粉彩色和中性色调配色方案。
Instagram/小红书美学风格。正上方垂直俯拍角度。
🎬 YouTube缩略图
提示词:
一张戏剧性的YouTube视频缩略图,用于科技评测视频。
左侧:一个年轻亚洲男性的半身像,表情极度兴奋/震惊,
嘴巴张大,一只手指向画面外(右侧)。
右侧:一个全新的产品(透明概念手机),周围有发光的光环效果。
背景:从深蓝到电光紫的渐变色,配以几何图形和光线条纹。
画面上方有粗体黄色3D立体文字(带红色描边):
"这彻底改变了一切!"
高饱和度,高对比度。爆款视频封面的冲击感,
但制作质量是专业级的。MrBeast/MKBHD风格。
📌 微信公众号封面图
提示词:
一张微信公众号技术文章的封面图,宽高比2.35:1。
深色背景(#1a1a2e),中间有一个发光的代码编辑器窗口,
窗口中显示着几行Java代码(内容模糊化处理,营造氛围即可)。
代码窗口周围有流动的蓝色和紫色光粒子效果。
图片下方三分之一处有大号白色标题文字:
"深入理解Reactor工作原理"
副标题(较小灰色文字):"从原理到实战的完整解析"
整体科技感十足,暗色调高级感。

9.4 建筑与室内设计

🏠 室内设计概念图
提示词:
一张逼真的日式极简(Japandi)风格客厅室内渲染效果图。
设计要素:
- 低矮的胡桃木平台式沙发,搭配燕麦色亚麻坐垫
- 落地窗直通一个极简风格的庭院,可以看到竹子
- 一个侘寂风格的陶瓷花瓶放在悬浮搁板上,插着一枝干花
- 浅色橡木人字拼花地板上铺着榻榻米地毯
- 一盏野口勇风格的纸灯笼吊灯
- 天花板边缘的暖色LED隐藏灯带
色彩方案:温暖的中性色(米色、浅灰、杏色),
配以胡桃木色和苔藓绿点缀。
充足的自然日光填满空间。超逼真的建筑可视化渲染品质。
V-Ray/Corona渲染器风格。
🏗️ 建筑概念设计
提示词:
一座未来感公共图书馆的建筑概念渲染效果图。
建筑采用流动的有机形态,灵感来自一本翻开的书——
弯曲的白色混凝土墙面如书页般向外展开。
其中一面"书页"墙是巨大的玻璃幕墙,
透过玻璃可以看到内部多层的书架,内部灯光温暖。
另一面"书页"是实体墙面,覆盖着蕨类和苔藓组成的垂直绿植墙。
建筑前方是一个倒映着建筑全景的水面景观。
有行人正沿着弧形入口坡道步行。
暮色天空,建筑内部发出温暖的光芒。
扎哈·哈迪德与安藤忠雄美学的融合。
建筑获奖摄影级画质。

9.5 游戏与概念设计

⚔️ 游戏角色设计
提示词:
一张奇幻RPG游戏的角色概念设定图,
展示一位精灵族女游侠的三视图:正面、四分之三侧面、背面。
角色设计细节:
- 尖耳朵,佩戴银色耳饰
- 不对称铠甲:左肩是刻有发光绿色符文的木质肩甲,
  右臂缠绕着皮质绑带
- 深翠绿色连帽披风,边缘破损磨损,兜帽放下
- 背后背着箭筒,箭尾有羽毛
- 复合弓由骨骼和木材制成
- 皮质长靴配以叶片形状的护膝
- 面部表情坚毅,左眉有一道疤痕,琥珀色瞳孔,
  银白色头发编成实用的辫子
画风:半写实奇幻插画风格。干净的白色背景。
全身可见。角色转面设定图排版,适合作为3D建模参考。
🗺️ 游戏场景概念
提示词:
一张奇幻游戏环境概念设定画。
场景是建造在巨大火山洞穴内部的古代矮人锻造厂。
中心是一座巨型铁砧形状的锻造炉,
四周有流淌的熔岩河为其提供光源和热能。
石桥横跨在熔岩河上,桥上有铁质栏杆,连接不同的工坊层级。
洞穴顶部悬挂着巨大的齿轮和锁链,部分仍在缓慢转动。
石柱上刻着矮人符文,符文发出橙色光芒。
蒸汽喷口和火花效果增添氛围。
比例参考:桥上有几个矮小的矮人工匠剪影。
宏大的史诗级空间感。下方熔岩的戏剧性暖光与冷灰色岩石形成对比。
3A级游戏品质概念设定画。数字绘画写意风格。
🎴 游戏卡牌设计
提示词:
一张奇幻卡牌游戏的稀有级卡牌设计。
卡牌框架:华丽的金色浮雕边框,上方有蓝色宝石镶嵌。
卡牌名称区域写着"时空裂隙"四个字,使用古朴的金色字体。
卡牌插画区域:一道撕裂空间的裂缝悬浮在半空中,
裂缝中泄漏出紫色和蓝色的能量光芒,
周围的建筑和树木被吸入裂缝中正在扭曲变形。
地面的碎石和尘土向裂缝方向飘浮。
卡牌底部有属性信息:"消耗:5 | 攻击:8 | 防御:3"
整体风格参考《万智牌》/《炉石传说》的卡牌美术设计。

9.6 教育与科普

提示词:
一张科普教育信息图(Infographic),主题是"太阳系行星"。
深蓝色星空背景上,八大行星按照到太阳的距离从左到右排列,
大小比例基本正确(木星最大,水星最小)。
每颗行星下方有中文标注名称和关键数据:
"水星 - 直径4,879km"
"金星 - 表面温度462°C"
"地球 - 生命家园"
"火星 - 红色星球"
"木星 - 太阳系最大行星"
"土星 - 壮观的环系统"
"天王星 - 侧卧旋转"
"海王星 - 最强风暴"
左上角有标题文字"探索太阳系"。
各行星有轨道线连接。干净的信息图设计风格,
扁平化但有光影质感。教科书级插图品质。

📊 十、提示词效果对比与调优技巧

10.1 提示词精细度对比

❌ 模糊提示词(效果不可控):
"画一只猫"

⚠️ 一般提示词(基本可用):
"一只橘猫坐在窗台上看外面的风景"

✅ 精细提示词(效果优秀):
"一只毛色鲜亮的橘猫慵懒地蜷坐在白色窗台上,
透过雨滴斑驳的玻璃窗望向外面的花园。
窗外是模糊的绿色景色和细雨。
猫的眼睛是琥珀色,半眯着,表情慵懒满足。
柔和的自然散射光从窗户照入,在猫毛上形成温暖的轮廓光。
窗台上有一本翻开的书和一杯冒着热气的咖啡。
温馨的室内环境,暖色调。照片写实风格,
使用85mm镜头、f/2.0光圈的浅景深效果。"

结论:提示词越具体、结构越清晰,生成效果越接近预期。

10.2 常见问题与解决方案

问题 原因 解决方案
文字渲染不准确 提示词中文字描述不够明确 用引号明确框住要渲染的文字内容
多个人物属性混淆 属性没有明确绑定到具体人物 用"左边的男人穿着…右边的女人穿着…"明确对应
风格不够像 风格描述太笼统 引用具体的艺术家/品牌/作品名作为参考
构图不合预期 缺少空间位置描述 使用"前景/中景/远景""左侧/右侧/中央"明确布局
光影效果平淡 没有描述光源 明确光源方向、类型、色温和时间段
色彩不协调 没有指定配色方案 给出具体的颜色名称甚至十六进制色值
细节不够丰富 缺少材质纹理描述 添加材质描述(丝绸、木纹、金属拉丝等)
分辨率/清晰度不够 没有指定质量要求 添加"超高清"“8K”"极致细节"等质量提升词

🎓 十一、总结

提示词编写黄金法则

┌─────────────────────────────────────────────────────────┐
│          GPT-Image-2 中文提示词编写黄金法则              │
│                                                         │
│  1. 📝 越具体越好      → 避免"好看的""漂亮的"等模糊词     │
│  2. 🏗️ 结构化描述     → 主体→风格→构图→光影→色彩→细节    │
│  3. 🔤 文字用引号      → 图片中需渲染的文字用引号框住      │
│  4. 🎯 风格要具体      → 引用具体的艺术家/品牌/作品风格    │
│  5. 📐 空间要明确      → 用前景/中景/远景、左/中/右定位    │
│  6. 📷 技术参数加分    → 写实风格时指定相机/镜头/光圈      │
│  7. 🎨 色彩给色值      → 精确的颜色名称或十六进制色值      │
│  8. 🚫 说明不要什么    → 排除不想要的元素                  │
│  9. 🔄 迭代优化        → 基于生成结果逐步调整提示词        │
│  10. 🌏 中英文混用     → 专业术语可用英文,效果更精准      │
└─────────────────────────────────────────────────────────┘

Spring AI集成要点

┌─────────────────────────────────────────────────────────┐
│          Spring AI + GPT-Image-2 集成要点               │
│                                                         │
│  ✅ 模型名使用 "gpt-image-1"                            │
│  ✅ 质量参数:low(草稿)/ medium(日常)/ high(商业)   │
│  ✅ 尺寸选择:根据用途选择合适的宽高比                    │
│  ✅ 响应格式:b64_json 获取Base64编码                    │
│  ✅ 异常处理:捕获内容安全策略拒绝异常                    │
│  ✅ 成本控制:使用限流器控制API调用频率                   │
│  ✅ 存储策略:生成的图片及时保存到OSS/本地文件系统         │
└─────────────────────────────────────────────────────────┘

💬 互动交流

如果你在使用过程中遇到问题,欢迎:

  1. 📝 在评论区留言讨论,我会逐一回复
  2. 👀 关注我的公众号,获取更多AIGC实战教程
  3. ⭐ 如果这篇文章对你有帮助,请点赞、收藏、转发三连

你的支持是我持续创作的最大动力!


📚 参考资料

  1. OpenAI Image Generation API文档
  2. Spring AI官方文档 - Image Model
  3. GPT-Image-2发布博客
  4. C2PA内容溯源标准

版权声明:本文为原创文章,转载请注明出处。
技术栈版本:Spring Boot 3.5.3 + Spring AI 1.1.4 + GPT-Image-2
更新时间:2026年4月26

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐