爆肝自费实测！GPT-Image-2 高级特性与提示词完全指南

风剑无影

408人浏览 · 2026-04-29 10:21:04

风剑无影 · 2026-04-29 10:21:04 发布

GPT-Image-2 高级特性与提示词完全指南（中文版）

作者：12年互联网资深架构师
技术栈：Spring AI 1.1.4 + GPT-Image-2 + Spring Boot 3.5.x
适用人群：Java开发者、AIGC应用开发者、产品设计师、自媒体从业者

📖 前言

GPT-Image-2（API中模型名为gpt-image-2）是OpenAI推出的最新图像生成模型，相比DALL·E 3有了质的飞跃。本文将全面介绍其高级特性，提供全中文提示词，并使用Java Spring AI给出完整的代码实现。
在这里插入图片描述

🎯 一、GPT-Image-2 核心高级特性

1.1 特性全景图

┌─────────────────────────────────────────────────────────┐
│              GPT-Image-2 高级特性矩阵                    │
├──────────────────┬──────────────────────────────────────┤
│ 🎨 图像生成       │ 文本生成图像、多风格切换、超高分辨率    │
│ ✏️ 图像编辑       │ 局部修改、智能擦除、区域重绘           │
│ 🔤 文字渲染       │ 图片内精准文字排版（重大突破！）        │
│ 🧠 指令理解       │ 超长复杂提示词理解、多主体场景构建      │
│ 🎭 风格控制       │ 写实/动漫/水彩/3D/像素等精确风格控制   │
│ 🔄 多图融合       │ 多张参考图融合、风格迁移               │
│ 📐 构图控制       │ 精确的空间布局、视角、景深控制          │
│ 🌈 色彩控制       │ 精确的色调、光影、氛围控制             │
│ 📏 多尺寸输出     │ 1024×1024 / 1536×1024 / 自适应       │
│ 🛡️ 安全特性       │ 内置C2PA元数据水印、内容安全过滤       │
│ 🔲 透明背景       │ 原生支持PNG透明通道输出                │
└──────────────────┴──────────────────────────────────────┘

1.2 与 DALL·E 3 对比

能力维度	DALL·E 3	GPT-Image-2
文字渲染	经常出错、模糊	✅ 精准，支持中英日多语言
指令遵循	中等	✅ 显著提升，复杂场景理解更好
图像编辑	不支持	✅ 原生支持编辑和局部修改
透明背景	不支持	✅ 原生支持
风格一致性	中等	✅ 同一提示词多次生成更一致
多主体场景	容易混淆属性	✅ 更好的属性绑定
细节丰富度	好	✅ 更精细的纹理和细节
输出格式	PNG/URL	✅ PNG/JPEG/WebP + 透明通道

🔧 二、Spring AI 集成配置

2.1 Maven依赖

<parent>
    <groupId>org.springframework.boot</groupId>
    <artifactId>spring-boot-starter-parent</artifactId>
    <version>3.5.3</version>
</parent>

<dependencies>
    <!-- Spring AI OpenAI Starter -->
    <dependency>
        <groupId>org.springframework.ai</groupId>
        <artifactId>spring-ai-starter-model-openai</artifactId>
    </dependency>

    <!-- Spring Web -->
    <dependency>
        <groupId>org.springframework.boot</groupId>
        <artifactId>spring-boot-starter-web</artifactId>
    </dependency>

    <!-- Lombok（可选） -->
    <dependency>
        <groupId>org.projectlombok</groupId>
        <artifactId>lombok</artifactId>
        <optional>true</optional>
    </dependency>
</dependencies>

<dependencyManagement>
    <dependencies>
        <dependency>
            <groupId>org.springframework.ai</groupId>
            <artifactId>spring-ai-bom</artifactId>
            <version>1.1.4</version>
            <type>pom</type>
            <scope>import</scope>
        </dependency>
    </dependencies>
</dependencyManagement>

2.2 配置文件

# application.yml
spring:
  ai:
    openai:
      api-key: ${OPENAI_API_KEY}
      base-url: https://api.openai.com
      image:
        options:
          model: gpt-image-2           # GPT-Image-2的API模型名
          quality: high                 # 图片质量：low / medium / high
          size: 1024x1024             # 默认尺寸
          response-format: b64_json    # 返回base64编码

2.3 核心服务类

package com.example.aigc.service;

import lombok.RequiredArgsConstructor;
import lombok.extern.slf4j.Slf4j;
import org.springframework.ai.image.*;
import org.springframework.ai.openai.OpenAiImageOptions;
import org.springframework.stereotype.Service;

import java.io.IOException;
import java.nio.file.*;
import java.util.*;

/**
 * GPT-Image-2 图像生成服务
 */
@Slf4j
@Service
@RequiredArgsConstructor
public class ImageGenerationService {

    private final ImageModel imageModel;

    /**
     * 基础图像生成
     *
     * @param prompt  中文提示词
     * @param width   宽度
     * @param height  高度
     * @param quality 质量：low / medium / high
     * @return Base64编码的图片数据
     */
    public String generateImage(String prompt, int width, int height, String quality) {
        OpenAiImageOptions options = OpenAiImageOptions.builder()
                .model("gpt-image-1")
                .quality(quality)
                .size(width + "x" + height)
                .responseFormat("b64_json")
                .build();

        ImagePrompt imagePrompt = new ImagePrompt(prompt, options);
        ImageResponse response = imageModel.call(imagePrompt);

        String b64Data = response.getResult().getOutput().getB64Json();
        log.info("图像生成成功，提示词: {}...", prompt.substring(0, Math.min(50, prompt.length())));
        return b64Data;
    }

    /**
     * 生成图像并保存到文件
     */
    public String generateAndSave(String prompt, int width, int height,
                                   String quality, String outputPath) throws IOException {
        String b64Data = generateImage(prompt, width, height, quality);
        byte[] imageBytes = Base64.getDecoder().decode(b64Data);
        Path path = Paths.get(outputPath);
        Files.createDirectories(path.getParent());
        Files.write(path, imageBytes);
        log.info("图像已保存至: {}", outputPath);
        return outputPath;
    }

    /**
     * 批量生成图像变体
     */
    public List<String> generateVariants(String promptTemplate,
                                          List<Map<String, String>> variables,
                                          String outputDir) throws IOException {
        List<String> results = new ArrayList<>();
        Path dir = Paths.get(outputDir);
        Files.createDirectories(dir);

        for (int i = 0; i < variables.size(); i++) {
            Map<String, String> vars = variables.get(i);
            String prompt = promptTemplate;
            for (Map.Entry<String, String> entry : vars.entrySet()) {
                prompt = prompt.replace("{" + entry.getKey() + "}", entry.getValue());
            }

            log.info("[{}/{}] 正在生成: {}", i + 1, variables.size(),
                    vars.values().iterator().next());

            String b64Data = generateImage(prompt, 1024, 1024, "high");
            byte[] imageBytes = Base64.getDecoder().decode(b64Data);
            String filename = outputDir + "/variant_" + (i + 1) + ".png";
            Files.write(Paths.get(filename), imageBytes);
            results.add(filename);

            log.info("  → 已保存: {}", filename);
        }
        return results;
    }

    /**
     * 生成透明背景图像（Logo/图标专用）
     */
    public String generateTransparentImage(String prompt) {
        // 注意：透明背景需要通过底层API设置 background=transparent
        // Spring AI 1.1.4 中可通过自定义选项实现
        String enhancedPrompt = prompt + "。纯透明背景，无任何背景元素，PNG格式适用。";

        OpenAiImageOptions options = OpenAiImageOptions.builder()
                .model("gpt-image-1")
                .quality("high")
                .size("1024x1024")
                .responseFormat("b64_json")
                .build();

        ImagePrompt imagePrompt = new ImagePrompt(enhancedPrompt, options);
        ImageResponse response = imageModel.call(imagePrompt);
        return response.getResult().getOutput().getB64Json();
    }
}

2.4 REST控制器

package com.example.aigc.controller;

import com.example.aigc.service.ImageGenerationService;
import lombok.RequiredArgsConstructor;
import org.springframework.http.*;
import org.springframework.web.bind.annotation.*;

import java.io.IOException;
import java.util.Base64;

/**
 * 图像生成API控制器
 */
@RestController
@RequestMapping("/api/image")
@RequiredArgsConstructor
public class ImageController {

    private final ImageGenerationService imageService;

    /**
     * 根据提示词生成图像
     */
    @PostMapping("/generate")
    public ResponseEntity<byte[]> generate(
            @RequestParam String prompt,
            @RequestParam(defaultValue = "1024") int width,
            @RequestParam(defaultValue = "1024") int height,
            @RequestParam(defaultValue = "high") String quality) {

        String b64Data = imageService.generateImage(prompt, width, height, quality);
        byte[] imageBytes = Base64.getDecoder().decode(b64Data);

        HttpHeaders headers = new HttpHeaders();
        headers.setContentType(MediaType.IMAGE_PNG);
        headers.setContentDisposition(
                ContentDisposition.inline().filename("generated.png").build());

        return new ResponseEntity<>(imageBytes, headers, HttpStatus.OK);
    }

    /**
     * 生成图像并保存到服务器
     */
    @PostMapping("/generate-and-save")
    public ResponseEntity<String> generateAndSave(
            @RequestParam String prompt,
            @RequestParam(defaultValue = "1024") int width,
            @RequestParam(defaultValue = "1024") int height,
            @RequestParam(defaultValue = "high") String quality,
            @RequestParam(defaultValue = "output/image.png") String outputPath)
            throws IOException {

        String savedPath = imageService.generateAndSave(
                prompt, width, height, quality, outputPath);
        return ResponseEntity.ok("图像已保存至: " + savedPath);
    }

    /**
     * 生成透明背景图像
     */
    @PostMapping("/generate-transparent")
    public ResponseEntity<byte[]> generateTransparent(@RequestParam String prompt) {
        String b64Data = imageService.generateTransparentImage(prompt);
        byte[] imageBytes = Base64.getDecoder().decode(b64Data);

        HttpHeaders headers = new HttpHeaders();
        headers.setContentType(MediaType.IMAGE_PNG);
        return new ResponseEntity<>(imageBytes, headers, HttpStatus.OK);
    }
}

🔤 三、文字渲染能力（最大突破）

这是GPT-Image-2相比DALL·E 3最显著的进步——能在图片中准确渲染中英文文字。

3.1 咖啡店菜单板

提示词：
深绿色复古咖啡店黑板菜单，纯粉笔手写质感字体，黑板哑光肌理，文字用白色 + 淡黄色粉笔书写，内容排版工整：
今日特饮
焦糖拿铁 - ¥32
抹茶星冰乐 - ¥38
现烤羊角面包 - ¥25
黑板四周点缀简约手绘小咖啡杯、咖啡豆简笔画装饰，柔和暖光氛围感，复古文艺咖啡厅慵懒温馨格调，写实质感，细节清晰，构图居中对称，治愈系暖色调，高清细腻

在这里插入图片描述

/**
 * 文字渲染示例：咖啡店菜单
 */
@GetMapping("/demo/menu")
public ResponseEntity<byte[]> generateMenu() {
    String prompt = """
            深绿色复古咖啡店黑板菜单，纯粉笔手写质感字体，黑板哑光肌理，文字用白色 + 淡黄色粉笔书写，内容排版工整：
            今日特饮
            焦糖拿铁 - ¥32
            抹茶星冰乐 - ¥38
            现烤羊角面包 - ¥25
            黑板四周点缀简约手绘小咖啡杯、咖啡豆简笔画装饰，柔和暖光氛围感，复古文艺咖啡厅慵懒温馨格调，写实质感，细节清晰，构图居中对称，治愈系暖色调，高清细腻
            """;

    String b64 = imageService.generateImage(prompt, 1536, 1024, "high");
    byte[] bytes = Base64.getDecoder().decode(b64);

    return ResponseEntity.ok()
            .contentType(MediaType.IMAGE_PNG)
            .body(bytes);
}

3.2 Logo与品牌设计

提示词：
极简科技风创业公司 Logo，纯白色背景，矢量设计，线条干净利落。
中文名称「架构源启」采用现代无衬线简约字体，字体主体为纯色，专属创意设计：“源” 字上方一点替换为水滴造型，水滴做蓝紫渐变配色，色值 #0066FF 至 #9933FF。
中文下方搭配小字英文：Architecture Origin，排版规整平衡。整体极简高级、商务科技感，适配浅色与深色双背景使用，
画面底部添加小字文案：欢迎关注 架构源启，扁平化矢量 LOGO，高清精致、构图居中。

在这里插入图片描述

3.3 电影海报设计

提示词：
一张科幻电影海报，电影名为"地平线之上"。
标题"地平线之上"使用大号未来感金属铬合金质感字体，位于海报上方。
标题下方有一行副标题："2156年，沉默是最致命的武器。"
海报底部使用小号字体标注：
"导演：架构源启 | 主演：‌刘亦菲 & 易烊千玺 & 吴京 & 迪丽热巴‌"
右下角有"PG-13"的分级标识。
背景画面：一个孤独的宇航员站在如玻璃般的星球表面上，
脚下反射着一颗即将熄灭的恒星。
色彩方案：深海军蓝、电光青色、温暖琥珀色。
电影级质感，戏剧性光影效果。

在这里插入图片描述

3.4 表情包制作

提示词：
一张搞笑的互联网表情包图片。一只惊讶的橘猫坐在桌子前，
面前放着一台笔记本电脑，猫戴着一副迷你阅读眼镜。
猫的上方用粗体白色Impact字体（带黑色描边）写着："老板居然不画大饼"
猫的下方写着："你在逗我？"
猫的表情极度夸张地震惊。明亮的室内光线，照片写实风格。

在这里插入图片描述

3.5 产品包装文字

提示词：
一款高端中国绿茶的包装盒设计。盒子采用哑光黑色材质，配以金箔点缀。
产品名称"翠峰"以优雅的中国书法风格大字呈现，
下方用精致的衬线英文标注"Architecture Origin"。
附加文字信息："特选宇治抹茶 | 30克"
以及"西湖龙井产地直供"小字说明。
整体设计极简，仅以一片茶叶的金色线描作为装饰点缀。
高级感，中国古典美学。

在这里插入图片描述

3.6 中文书法风格

提示词：
一幅中国传统书法作品，宣纸质感背景。
主体内容为行书风格书写的"但行好事，莫问前程"八个大字，
墨色浓淡有致，飞白效果自然。
左下角有一方朱红色的印章，印章内容为"观自在"三字篆书。
右侧有一列小字落款："甲辰年春月书于京华"。
整体构图留白充分，符合中国传统书法的审美法则。
宣纸的纹理和墨迹的渗透效果要真实自然。

在这里插入图片描述

✏️ 四、图像编辑能力

4.1 Spring AI 图像编辑服务

package com.example.aigc.service;

import lombok.RequiredArgsConstructor;
import lombok.extern.slf4j.Slf4j;
import org.springframework.ai.image.*;
import org.springframework.ai.openai.OpenAiImageOptions;
import org.springframework.core.io.ClassPathResource;
import org.springframework.stereotype.Service;

import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Path;
import java.util.Base64;

/**
 * 图像编辑服务
 * 注意：Spring AI 1.1.4 对图像编辑的支持可能需要通过底层API直接调用
 * 以下展示推荐的封装方式
 */
@Slf4j
@Service
@RequiredArgsConstructor
public class ImageEditService {

    private final ImageModel imageModel;

    /**
     * 基于文字描述编辑图像
     * 将原图的指定区域（mask白色部分）替换为新内容
     *
     * @param originalImagePath 原图路径
     * @param maskImagePath     遮罩图路径（白色=需修改区域，黑色=保留区域）
     * @param editPrompt        编辑指令（中文）
     * @return 编辑后的图片Base64
     */
    public String editImage(String originalImagePath, String maskImagePath,
                            String editPrompt) throws IOException {
        // Spring AI 1.1.4 中通过 ImagePrompt 实现编辑
        // 部分版本需要使用底层 OpenAI Client 直接调用

        log.info("开始编辑图像，指令: {}", editPrompt);

        // 读取原图和遮罩
        byte[] originalImage = Files.readAllBytes(Path.of(originalImagePath));
        byte[] maskImage = Files.readAllBytes(Path.of(maskImagePath));

        String originalB64 = Base64.getEncoder().encodeToString(originalImage);
        String maskB64 = Base64.getEncoder().encodeToString(maskImage);

        // 构建编辑提示词，包含原图信息
        OpenAiImageOptions options = OpenAiImageOptions.builder()
                .model("gpt-image-1")
                .quality("high")
                .size("1024x1024")
                .responseFormat("b64_json")
                .build();

        ImagePrompt imagePrompt = new ImagePrompt(editPrompt, options);
        ImageResponse response = imageModel.call(imagePrompt);

        log.info("图像编辑完成");
        return response.getResult().getOutput().getB64Json();
    }

    /**
     * 使用底层OpenAI API进行图像编辑（更完整的支持）
     */
    public String editImageWithOpenAiClient(String originalImagePath,
                                             String maskImagePath,
                                             String editPrompt)
            throws IOException {
        // 对于完整的编辑功能，推荐使用OpenAI Java SDK直接调用
        // 以下为概念实现

        /*
        OpenAI client = new OpenAI(System.getenv("OPENAI_API_KEY"));

        ImageEditRequest request = ImageEditRequest.builder()
                .model("gpt-image-1")
                .image(Path.of(originalImagePath))
                .mask(Path.of(maskImagePath))
                .prompt(editPrompt)
                .size("1024x1024")
                .build();

        ImageResponse response = client.images().edit(request);
        return response.getData().get(0).getB64Json();
        */

        log.warn("完整图像编辑功能需要使用OpenAI Java SDK直接调用");
        return editImage(originalImagePath, maskImagePath, editPrompt);
    }
}

4.2 智能物体替换

编辑场景：一张客厅照片
遮罩区域：覆盖沙发位置

提示词：
将沙发替换为一张奢华的祖母绿丝绒L形转角沙发，
配以金色金属腿。沙发上放两个配套的靠枕，颜色为奶油白和金色。
保持原图的光线方向、阴影效果和房间透视关系完全一致。
新沙发的材质要体现丝绒的光泽和质感。

4.3 背景替换

编辑场景：一张产品照片（白色背景）
遮罩区域：覆盖整个背景

提示词：
将这个产品放置在一张质朴的实木桌面上，
柔和的清晨阳光从左侧窗户照射进来，形成自然的光影。
背景是一个温馨的厨房场景，添加轻微的散景虚化效果，色调偏暖。
完整保留产品本身的颜色、反光和比例，不做任何修改。
桌面上可以散落一些与产品相关的自然元素作为点缀。

4.4 季节变换

编辑场景：一张夏天的街景照片
遮罩区域：覆盖整个背景（保留建筑轮廓）

提示词：
将这个夏天的街景转换为梦幻的冬日雪景。
屋顶和人行道上覆盖着新鲜的积雪，空中飘着轻柔的雪花，
商店橱窗透出温暖的金色灯光，树枝上结着霜花。
街灯在雪地上投射出温暖的光晕。天空是暮色蓝紫色调。
整体氛围温馨浪漫，像一张圣诞贺卡。

4.5 人物造型变换

编辑场景：一张人物半身照
遮罩区域：覆盖服装部分

提示词：
将人物的现有服装替换为一套中国传统汉服：
上衣为交领右衽的浅蓝色丝绸衫，绣有白色梅花暗纹，
外搭一条深靛蓝色的宽袖外衫。
衣领和袖口有精致的金色云纹镶边。
保持人物的面部表情、姿势和原始光线完全不变。
服装的褶皱和光影要与人物的身体姿态自然贴合。

🎨 五、风格控制提示词大全

5.1 写实摄影风格

📷 专业人像摄影

提示词：
一张20岁中国年轻美女的人像摄影作品，短发波波头，自然妆容。
使用佳能EOS R5相机，85mm f/1.4镜头拍摄。
柔和的自然窗光从左侧照射，形成优雅的伦勃朗光效。
浅景深，背景呈现奶油般的柔美散景。
色彩调校：高光偏暖，阴影区略微降低饱和度。
8K分辨率，杂志封面级画质。
RAW照片风格，无过度修图痕迹。

在这里插入图片描述

/**
 * 人像摄影生成示例
 */
@GetMapping("/demo/portrait")
public ResponseEntity<byte[]> generatePortrait() {
    String prompt = """
           一张20岁中国年轻美女的人像摄影作品，短发波波头，自然妆容。
            使用佳能EOS R5相机，85mm f/1.4镜头拍摄。
            柔和的自然窗光从左侧照射，形成优雅的伦勃朗光效。
            浅景深，背景呈现奶油般的柔美散景。
            色彩调校：高光偏暖，阴影区略微降低饱和度。
            8K分辨率，杂志封面级画质。
            RAW照片风格，无过度修图痕迹。
            """;

    String b64 = imageService.generateImage(prompt, 1024, 1536, "high");
    byte[] bytes = Base64.getDecoder().decode(b64);

    return ResponseEntity.ok()
            .contentType(MediaType.IMAGE_PNG)
            .body(bytes);
}

📷 商业产品摄影

提示词：
一张高端腕表的商业产品照片。瑞士自动机芯计时码表，
午夜蓝色表盘，玫瑰金表壳，棕色鳄鱼皮表带。
无缝渐变灰色背景上拍摄。三点式影棚布光：
45度角主灯在表盘上形成精致反光，补光灯柔化阴影，
轮廓灯勾勒表壳边缘的高光线条。
焦点堆叠确保全局锐利。商业广告级画质。

在这里插入图片描述

📷 美食摄影

提示词：
一组日本怀石料理的俯拍美食摄影。
画面包含：蓝色陶瓷盘中精致摆放的刺身拼盘，
漆器碗中的味噌汤，烤鱼配柚子，以及时令蔬菜小碟。
所有餐具摆放在深色石板台面上，配以天然木质筷子。
柔和的散射自然光从右上方照射。
色彩鲜艳，鱼肉纹理清晰可见，味噌汤上方有轻微的蒸汽升腾。
45度角拍摄以体现层次感。
《架构源启-人间风味》杂志美食摄影风格。

在这里插入图片描述

📷 风光摄影

提示词：
一张壮观的风光摄影作品，展现中国张家界的砂岩柱林。
清晨时分，云海在石柱之间翻涌，阳光穿透云层形成耶稣光。
前景是一棵古松斜伸在悬崖边，松枝上挂着薄薄的晨露。
中景是层叠的砂岩柱，若隐若现于云雾之中。
远景是连绵的山峦轮廓，逐渐淡入天际。
使用尼康Z9相机，24-70mm f/2.8镜头的24mm端拍摄，
f/11光圈确保前后景都清晰。
色调偏青蓝，但晨光部分保留温暖的金色。
国家地理杂志级别的风光摄影水准。

在这里插入图片描述

前方高能干货继续放送，由于个人钱包率先扛不住压力，经费紧急告罄，后续就不额外插图了。省下算力留给大家练手，咱们文字照样把知识点讲透～

5.2 插画与动漫风格

🎌 日式动漫风格

提示词：
一个吉卜力工作室风格的动画场景。
一个长着飘逸赤褐色头发的少女站在一望无际的薰衣草花田中。
她穿着白色连衣裙，手持草帽，裙摆被风轻轻吹起。
天空中漂浮着巨大的积雨云，蔚蓝天色纯净透亮。
远处有一座欧式风车磨坊。
用宫崎骏电影特有的柔和水彩风格绘制。
温暖的午后黄金时刻光线。
充满怀旧感和梦幻氛围。
赛璐珞上色风格，可以看到细腻的笔触。

🎨 美式漫画风格

提示词：
一个漫威漫画风格的超级英雄角色设计。
一位女性英雄，双拳周围噼啪作响着电蓝色能量光弧。
她穿着流线型的深海军蓝配银色战衣，上面有几何图案纹路。
动态动作姿势，正在半空中跃起。
粗犷的墨线勾勒轮廓，用交叉排线营造阴影效果。
背景使用半调网点图案。鲜艳浓烈的漫画着色风格。
画面中有一个对话气泡，内容写着："够了！"

🖌️ 现代扁平插画

提示词：
一幅现代扁平风格插画，展示一个多元化团队在科技创业公司办公室里协作的场景。
画面包含：一位女性在双屏显示器前写代码，一位男性在平板上画设计稿，
两个人在贴满便签纸的白板前讨论方案。
使用等距（Isometric）透视角度。
干净的几何形状，限定配色方案（珊瑚色、青色、奶油色、炭灰色）。
无轮廓线，纯色块填充配以细微的阴影。
Dribbble/Behance 编辑插画风格。

🌸 水彩风格

提示词：
一幅威尼斯运河日落时分的水彩画。
几艘贡多拉停泊在古旧建筑旁，建筑外墙是赭石色和土红色。
水面上波光粼粼，倒映着天空和建筑。
使用松散、写意的水彩技法，保留可见的画纸纹理，
湿对湿技法形成的色彩自然渗透晕染效果，
留有刻意不上色的白色空间。边缘柔和，水洗般的通透质感。
配色：赭石、镉黄、天蓝、玫瑰红。

🖊️ 中国水墨画

提示词：
一幅传统中国水墨山水画。
远山如黛，层峦叠嶂，以淡墨渲染出空灵的雾气效果。
中景有一座小桥流水，桥上有一位身穿长衫的文人撑着油纸伞。
近景是几棵苍劲的松树，用浓墨粗笔勾勒枝干，
松针以散锋点染。溪流以留白手法表现水面。
右上角题有"山高水长"四字行书，
左下角盖有一方朱红印章。
构图遵循"三远法"——高远、深远、平远。
整体意境空灵悠远，符合"气韵生动"的美学追求。
宣纸质感，墨色五级——焦、浓、重、淡、清。

5.3 3D与科技风格

🎮 3D卡通渲染

提示词：
一个可爱的3D渲染角色：一个机器人咖啡师正在制作咖啡。
机器人有着圆润的白色身体，发光的蓝色护目镜作为眼睛，
小巧的关节手臂正握着咖啡手柄。
站在一台迷你意式咖啡机后面。
皮克斯风格的角色设计。
柔和的环境光遮蔽，白色塑料外壳上有次表面散射光效。
温暖的咖啡馆灯光氛围。
Octane/Blender Cycles级别的渲染质量。
干净的摄影棚背景，地面有轻微的倒影。

💎 毛玻璃设计风格（Glassmorphism）

提示词：
一个未来感的天气应用UI卡片悬浮在太空中。
磨砂玻璃面板，透明度约20%，背景是模糊的紫色到蓝色极光渐变。
卡片上显示的内容：
城市名"上海"使用白色半粗体字
温度"26°C"使用大号细字体
一个极简的太阳图标
"湿度 72% | 风速 12km/h"小字信息
卡片边缘有细微的白色发光边框，下方有柔和的投影。
卡片周围漂浮着一些小水滴，水滴折射着光线。
深色模式美学风格。

🔮 赛博朋克风格

提示词：
一个赛博朋克风格的新东京街景，时间设定在2089年。
狭窄的巷道两旁是高耸入云的建筑，外墙覆盖着全息投影广告，
广告内容有中文和日文。霓虹灯招牌的光芒倒映在地面的雨水中。
一个穿着连帽夹克的孤独身影背对镜头走向远方，
身影在霓虹灯光中形成剪影。
主色调：电光品红、青色、深紫色，与深沉的暗影形成强烈对比。
画面中有体积雾、雨丝效果和镜头光晕。
《银翼杀手》与《阿基拉》的美学融合。
超高细节，电影宽银幕比例。

5.4 艺术与复古风格

🖼️ 古典油画风格

提示词：
一幅荷兰黄金时代大师风格的油画静物。
深色木桌上摆放着：一个削了一半的柠檬，螺旋形的皮悬挂着；
一只盛着红酒的银质高脚杯；紫色的葡萄串；
一颗裂开的核桃；以及一朵即将凋谢的玫瑰。
光线从左上方照射，形成戏剧性的明暗对比效果。
画面高光处可见厚涂法（Impasto）的笔触肌理。
深赭色背景。博物馆收藏级构图。
蕴含虚空画（Vanitas）的象征寓意。

📺 像素艺术风格

提示词：
一个16位像素艺术风格的中世纪奇幻小镇广场场景。
画面包含：广场中央的石砌喷泉，带铁砧的铁匠铺，
橱窗里摆满彩色药瓶的魔药商店，以及在广场上来来往往的小镇居民。
鹅卵石铺就的地面。
风格参考经典SNES游戏（如《时空之轮》/《最终幻想6》）。
每个精灵图使用有限的调色板。
渐变效果使用抖动(Dithering)技法实现。
画布尺寸320×240像素，放大显示。

🎞️ 80年代复古风格

提示词：
一张1980年代复古未来主义风格的专辑封面。
一辆镀铬的德罗宁风格跑车行驶在霓虹网格公路上，
公路笔直延伸至地平线。公路两旁是剪影效果的棕榈树。
背景是一轮巨大的落日（粉色到橙色渐变），占据画面主体。
合成波/蒸汽波美学风格。
画面顶部用金属质感的80年代字体写着"午夜飞驰"，
文字上有水平扫描线效果。
配色：热粉色、电光紫、镀铬银、日落橙。

🇨🇳 敦煌壁画风格

提示词：
一幅敦煌莫高窟壁画风格的飞天仙女画作。
画面中央是一位体态优美的飞天仙女，长长的彩带随风飘动，
形成优雅的S形曲线。仙女身穿赭红色和石绿色的唐代服饰，
头戴宝冠，手持琵琶，在祥云间翩翩起舞。
背景是佛光和莲花纹样，色彩使用矿物颜料的质感——
石青、石绿、朱砂、赭石、土黄。
画面有岁月侵蚀的斑驳感和矿物颜料的颗粒质感。
整体构图参考莫高窟第112窟"反弹琵琶"飞天。

📐 六、高级构图与场景控制

6.1 精确空间布局

提示词：
一张精心构图的风景摄影，严格遵循三分法则布局：
- 左侧三分之一：一棵古老的橡树，树干苍劲，枝丫伸展
- 中间区域：一条蜿蜒的泥土小路通向画面深处
- 右侧三分之一：一座小型石砌农舍，烟囱冒着袅袅炊烟
- 前景：野花丛（罂粟花和雏菊混生）
- 中景：起伏的翠绿山丘，木栅栏蜿蜒其间
- 远景：笼罩在薄雾中的蓝色山峦，上方是戏剧性的多云天空
黄金时刻的光线从右侧照射。使用广角24mm镜头拍摄。
大景深，前后景都保持清晰。

6.2 多主体复杂场景

提示词：
一个热闹的台北夜市场景，包含多个焦点：
1. 左前方：一个摊贩正在烤台湾香肠，炭火的烟雾和蒸汽戏剧性地升腾，
   头顶一盏暖色吊灯照亮了摊位
2. 右前方：一对年轻情侣共同分享一杯珍珠奶茶，
   女生正笑着指向远处的什么东西
3. 中部上方：成排的红色灯笼如华盖般串挂在头顶，营造出喜庆的光影
4. 左侧背景：一座传统庙宇牌坊，飞檐翘角，雕梁画栋
5. 右侧背景：现代建筑上的LED广告牌，显示着中文广告内容
6. 散布其中：其他逛街的游客、一个手持气球的小孩
整体氛围：温暖、热闹、微微湿润（空气中可见的热气）。
混合光源：暖色灯笼光、冷色LED广告光、金色食物摊位灯光。
平视角度，35mm镜头，中等景深。

6.3 特殊视角控制

🔭 鸟瞰俯视视角

提示词：
一张正上方垂直俯拍（鸟瞰视角/俯视图）的照片，
拍摄一个完美圆形的日式枯山水禅意庭园。
以中央一块覆盖着苔藓的大石为圆心，沙砾上耙出了同心圆形的波纹。
四个方位各放置一块较小的石头。
右下象限的沙面上静静躺着一片红色枫叶。
正午阳光直射，每块石头下方投射出短小的正下方阴影。
无人机航拍风格，高度约60米。极简构图，充满禅意。

👁️ 仰视虫眼视角

提示词：
一张极端低角度仰拍（虫眼视角）照片，从地面直接向上拍摄，
穿过一片茂密的竹林。竹竿向中心的天空汇聚，
形成强烈的透视消失点效果。
阳光穿过竹叶形成丁达尔光线（耶稣光）。
画面中央偏上位置有一只飞行中的红色蜻蜓。
使用14mm超广角镜头拍摄，产生戏剧性的透视变形。
翠绿的竹冠与蓝天形成鲜明对比。

🔍 微距特写视角

提示词：
一张极致的微距摄影作品，拍摄一滴晨露停留在一片草叶尖端。
水滴内部折射出一个倒置的日出风景画面。
焦点堆叠确保水滴完全清晰，而草叶则逐渐虚化为柔美的散景。
水滴像一个天然的透镜。清晨金色的光线在水滴右上方
形成一个明亮的高光点。
水滴表面的表面张力形成的弯月面清晰可见。
放大比例5:1。绿色草叶与金色阳光形成冷暖对比。

🌈 七、高级光影与氛围控制

7.1 电影级光影

🎬 黑色电影风格（Film Noir）

提示词：
一个黑色电影风格的侦探场景。
一个戴着费多拉毡帽、穿着风衣的男人站在被雨水浸透的巷子里。
唯一的光源是一块闪烁的霓虹灯招牌，上面写着"旅馆"二字，
从右上方投射出刺目的红色光线。
浓重的阴影遮住了他半边脸。
一缕香烟的烟雾在光柱中袅袅上升。
背光中可以看到雨丝的条纹。水坑映出霓虹的倒影。
黑白画面，但霓虹招牌保留红色（选择性着色）。
高对比度，深沉的黑色调，压暗的阴影细节。
1940年代的神秘氛围。变形宽银幕镜头光晕。
胶片颗粒质感叠加。

🌅 魔幻时刻

提示词：
一位独奏的女大提琴手在海边悬崖顶上演奏，正值黄金时刻。
她的白色长裙在风中飘动。夕阳半隐在云层后方，
射出戏剧性的丁达尔光线（耶稣光）扇形地照射天空。
色彩方案：熔金色、温暖琥珀色、阴影中的柔和薰衣草紫、
海面上的深靛蓝色。
逆光在大提琴手和乐器边缘勾勒出一圈发光的轮廓光。
使用长焦镜头压缩背景。电影级2.39:1宽银幕比例。
空灵的、充满情感的氛围。

7.2 特殊光效

✨ 霓虹灯光效

提示词：
一张年轻女性面部的特写人像，面部被交叉的霓虹灯光分别照亮——
左侧是粉色霓虹光，右侧是蓝色霓虹光。
在鼻梁处两种色光交汇融合成紫色。
她的眼睛中可以看到霓虹灯管的倒影（眼神光）。
皮肤有轻微的水润光泽，可以捕捉彩色光线。
深色背景。面前有一面玻璃表面，上面有水滴，
每一滴水珠都折射出霓虹的色彩。
水滴上的浅景深效果。时尚杂志编辑摄影风格。

🕯️ 烛光氛围

提示词：
一个完全由烛光照明的亲密晚餐场景。
圆桌上放着三根铜烛台中的细长蜡烛。
温暖的、摇曳的烛光在身后有纹理的灰泥墙上投射出跳动的影子。
桌上有：两杯红酒在烛火背光下如红宝石般闪亮，
一盘意大利面，一个小花瓶里插着干花。
光线迅速衰减——房间的角落完全沉浸在黑暗中。
暖色温约2700K。墙上呈现伦勃朗式的三角光斑。
油画般的质感和氛围。

🌙 月光场景

提示词：
一座中国江南古镇的月夜景色。
圆月高悬天际，月光如水银般洒满整个画面。
古镇的白墙黛瓦在月光下呈现冷蓝色调，
小桥下的河水映着月亮的倒影，水面微波荡漾。
一艘乌篷船静静停泊在河边，船上挂着一盏昏黄的灯笼，
是画面中唯一的暖色光源。
远处有几户人家的窗户透出微弱的暖光。
整体色调以冷蓝、银灰为主，暖黄为点缀。
宁静、诗意的氛围。如同"月落乌啼霜满天"的意境。

🧠 八、高级提示词工程技巧

8.1 结构化提示词模板

最佳提示词结构（按优先级排列）：

【主体描述】  → 画面的核心内容（最重要！）
【风格指定】  → 艺术风格、媒介、参考作品
【构图控制】  → 视角、布局、比例
【光影氛围】  → 光源方向、色温、时间
【色彩方案】  → 主色调、配色关系
【细节补充】  → 材质、纹理、小物件
【技术参数】  → 相机、镜头、分辨率（写实风格时使用）
【否定描述】  → 明确不想要的元素（可选）

8.2 万能模板实战

按模板套用的完整提示词：

【主体描述】一位睿智的老年图书馆管理员坐在皮质扶手椅中，
正在阅读一本厚重的镶金页边的古书

【风格指定】采用古典写实主义油画风格绘制，油彩画布质感，
博物馆馆藏级作品水准

【构图控制】中景镜头，略微仰拍视角，
主体位于三分法左侧竖线位置

【光影氛围】温暖的室内照明，右侧台灯为主光源，
左侧高窗投入柔和的自然光作为辅助光，
傍晚时分，光束中可以看到空气中漂浮的微小灰尘

【色彩方案】浓郁的暖色调——勃艮第红、深森林绿、
古典金色、红木棕色。阴影区采用略微降低饱和度的冷色调

【细节补充】背景是从地板到天花板的书架，略微虚化。
扶手上蜷缩着一只姜黄色的猫正在睡觉。
老人的阅读眼镜推到了额头上。
书中夹着一枚皮质书签。旁边小桌上有一杯冒着热气的茶

【技术参数】等效50mm镜头效果，f/2.8光圈，
画面边缘有自然的暗角效果

【否定描述】不要出现任何现代元素，不要有电子屏幕，
不要使用明亮的人工照明

8.3 质量提升关键词速查表

通用质量提升词汇（中文提示词中也可混用英文术语）：

┌─────────────────────────────────────────────────────────┐
│ 分类         │ 关键词                                    │
├──────────────┼───────────────────────────────────────────┤
│ 分辨率/清晰度 │ 超高清、8K分辨率、极致细节、锐利对焦、       │
│              │ 细节丰富                                   │
├──────────────┼───────────────────────────────────────────┤
│ 专业品质      │ 专业摄影级、获奖作品、大师级、杂志级画质、    │
│              │ 商业广告品质、博物馆收藏级                   │
├──────────────┼───────────────────────────────────────────┤
│ 渲染质量      │ 光线追踪、全局光照、Octane渲染、             │
│              │ 虚幻引擎5品质                               │
├──────────────┼───────────────────────────────────────────┤
│ 光影效果      │ 体积光、丁达尔光线（耶稣光）、戏剧性光影、   │
│              │ 轮廓光、明暗对比法、黄金时刻光线              │
├──────────────┼───────────────────────────────────────────┤
│ 氛围情感      │ 大气磅礴、情绪感强烈、空灵飘渺、电影质感、   │
│              │ 史诗感、宁静祥和、奇幻梦幻                   │
├──────────────┼───────────────────────────────────────────┤
│ 细节纹理      │ 精细纹理、微妙的渐变过渡、可见的笔触（绘画）、│
│              │ 材质质感真实、肌理丰富                       │
└──────────────┴───────────────────────────────────────────┘

💡 九、实战场景提示词合集

9.1 电商产品图

👟 产品展示图

提示词：
一张高端无线降噪耳机的商业产品照片。
颜色：哑光午夜蓝，配以拉丝铝合金铰链。
耳机以15度微倾角度悬浮在干净的渐变灰白背景上。
三点式影棚布光：45度角主灯在耳罩上形成精致反光，
补光灯柔化阴影，轮廓灯勾勒铝合金边缘的高光线条。
其中一只耳罩略微旋转，展示内部蓬松的记忆海绵耳垫。
底部有一道轻微的阴影暗示耳机在悬浮状态。
苹果产品摄影风格。超级干净、极简、高端质感。
4K产品细节特写。

🧴 场景化产品图

提示词：
一瓶高端护肤精华液（磨砂玻璃瓶身，玫瑰金瓶盖），
放置在一块天然石板上，周围环绕着新鲜的原料：
切开的血橙片、迷迭香枝、从蜜勺上滴落的蜂蜜、
以及散落的粉红色喜马拉雅盐粒。
清晨阳光从窗户射入，形成明确的硬光阴影和明亮高光。
瓶身表面有几滴水珠，增添清新感。
纯净美容品牌美学风格。从上方30度角俯拍。
Aesop/Glossier品牌编辑摄影风格。

👗 服装展示图

提示词：
一件中国风改良旗袍的电商展示照片。
旗袍面料为深藏蓝色丝绸，上面有精致的手工刺绣白色梅花图案。
立领、盘扣细节清晰可见。旗袍展示在一个无头模特衣架上，
采用45度角侧面展示，可以同时看到正面和侧面的剪裁线条。
纯白色背景，柔和的影棚散射光照明。
面料的丝绸光泽和刺绣的立体质感要清晰体现。
淘宝/天猫高端女装商品图风格。

9.2 UI/UX设计

📱 手机App界面

提示词：
一个高端的iPhone 15 Pro样机（钛合金边框），
屏幕上显示着一款健身追踪App的UI界面。屏幕内容：
- 顶部显示"早上好，小雅"的问候语，配以挥手的emoji
- 一个圆形进度环显示"8,432步"，绿色到青色的渐变动效
- 心率卡片："72次/分"，配一条迷你折线图
- 睡眠卡片："7小时24分"，配月亮图标和质量条形图
- 底部导航栏：首页、运动、营养、个人中心
深色模式UI设计，OLED友好的纯黑背景。强调色：电光青色。
手机略微旋转10度，悬浮状态配以柔和阴影。
干净的白色/浅灰背景。Dribbble展示级作品。

🖥️ 数据仪表盘

提示词：
一个数据分析仪表盘界面，显示在27英寸iMac屏幕上。
仪表盘内容：
- 标题栏："营收概览 — 2024年第四季度"，配日期选择器
- 大型面积图展示月度营收趋势（蓝色渐变填充）
- 一排四个关键指标卡片：
  营收（240万 ↑12%）、用户数（4.8万 ↑8%）、
  转化率（3.2% ↑0.5%）、流失率（1.8% ↓0.3%）
- 左下方：分类营收环形图
- 右下方：Top10产品排行表，配迷你折线图
现代毛玻璃风格卡片，深色主题（#0F172A背景色），
强调色：电光蓝和翡翠绿。干净的数据可视化设计。
Figma/Linear设计品质。

9.3 自媒体/社交媒体

📸 小红书封面图

提示词：
一张白色大理石台面上的平铺摆拍（flat lay）照片。
画面中央是一本打开的笔记本，上面用整齐的黑色墨水手写着：
"2025年书单推荐 📚"
周围精心摆放的物品：
- 一杯有拉花的抹茶拿铁
- 一盆白色陶瓷小花盆里的多肉植物
- 三本叠放的莫兰迪色系封面书籍
- 一枚金色回形针和一卷和纸胶带
- 散落的干花花瓣（满天星）
- 一副金色圆框眼镜
柔和的散射自然光从上方照射。粉彩色和中性色调配色方案。
Instagram/小红书美学风格。正上方垂直俯拍角度。

🎬 YouTube缩略图

提示词：
一张戏剧性的YouTube视频缩略图，用于科技评测视频。
左侧：一个年轻亚洲男性的半身像，表情极度兴奋/震惊，
嘴巴张大，一只手指向画面外（右侧）。
右侧：一个全新的产品（透明概念手机），周围有发光的光环效果。
背景：从深蓝到电光紫的渐变色，配以几何图形和光线条纹。
画面上方有粗体黄色3D立体文字（带红色描边）：
"这彻底改变了一切！"
高饱和度，高对比度。爆款视频封面的冲击感，
但制作质量是专业级的。MrBeast/MKBHD风格。

📌 微信公众号封面图

提示词：
一张微信公众号技术文章的封面图，宽高比2.35:1。
深色背景（#1a1a2e），中间有一个发光的代码编辑器窗口，
窗口中显示着几行Java代码（内容模糊化处理，营造氛围即可）。
代码窗口周围有流动的蓝色和紫色光粒子效果。
图片下方三分之一处有大号白色标题文字：
"深入理解Reactor工作原理"
副标题（较小灰色文字）："从原理到实战的完整解析"
整体科技感十足，暗色调高级感。

9.4 建筑与室内设计

🏠 室内设计概念图

提示词：
一张逼真的日式极简（Japandi）风格客厅室内渲染效果图。
设计要素：
- 低矮的胡桃木平台式沙发，搭配燕麦色亚麻坐垫
- 落地窗直通一个极简风格的庭院，可以看到竹子
- 一个侘寂风格的陶瓷花瓶放在悬浮搁板上，插着一枝干花
- 浅色橡木人字拼花地板上铺着榻榻米地毯
- 一盏野口勇风格的纸灯笼吊灯
- 天花板边缘的暖色LED隐藏灯带
色彩方案：温暖的中性色（米色、浅灰、杏色），
配以胡桃木色和苔藓绿点缀。
充足的自然日光填满空间。超逼真的建筑可视化渲染品质。
V-Ray/Corona渲染器风格。

🏗️ 建筑概念设计

提示词：
一座未来感公共图书馆的建筑概念渲染效果图。
建筑采用流动的有机形态，灵感来自一本翻开的书——
弯曲的白色混凝土墙面如书页般向外展开。
其中一面"书页"墙是巨大的玻璃幕墙，
透过玻璃可以看到内部多层的书架，内部灯光温暖。
另一面"书页"是实体墙面，覆盖着蕨类和苔藓组成的垂直绿植墙。
建筑前方是一个倒映着建筑全景的水面景观。
有行人正沿着弧形入口坡道步行。
暮色天空，建筑内部发出温暖的光芒。
扎哈·哈迪德与安藤忠雄美学的融合。
建筑获奖摄影级画质。

9.5 游戏与概念设计

⚔️ 游戏角色设计

提示词：
一张奇幻RPG游戏的角色概念设定图，
展示一位精灵族女游侠的三视图：正面、四分之三侧面、背面。
角色设计细节：
- 尖耳朵，佩戴银色耳饰
- 不对称铠甲：左肩是刻有发光绿色符文的木质肩甲，
  右臂缠绕着皮质绑带
- 深翠绿色连帽披风，边缘破损磨损，兜帽放下
- 背后背着箭筒，箭尾有羽毛
- 复合弓由骨骼和木材制成
- 皮质长靴配以叶片形状的护膝
- 面部表情坚毅，左眉有一道疤痕，琥珀色瞳孔，
  银白色头发编成实用的辫子
画风：半写实奇幻插画风格。干净的白色背景。
全身可见。角色转面设定图排版，适合作为3D建模参考。

🗺️ 游戏场景概念

提示词：
一张奇幻游戏环境概念设定画。
场景是建造在巨大火山洞穴内部的古代矮人锻造厂。
中心是一座巨型铁砧形状的锻造炉，
四周有流淌的熔岩河为其提供光源和热能。
石桥横跨在熔岩河上，桥上有铁质栏杆，连接不同的工坊层级。
洞穴顶部悬挂着巨大的齿轮和锁链，部分仍在缓慢转动。
石柱上刻着矮人符文，符文发出橙色光芒。
蒸汽喷口和火花效果增添氛围。
比例参考：桥上有几个矮小的矮人工匠剪影。
宏大的史诗级空间感。下方熔岩的戏剧性暖光与冷灰色岩石形成对比。
3A级游戏品质概念设定画。数字绘画写意风格。

🎴 游戏卡牌设计

提示词：
一张奇幻卡牌游戏的稀有级卡牌设计。
卡牌框架：华丽的金色浮雕边框，上方有蓝色宝石镶嵌。
卡牌名称区域写着"时空裂隙"四个字，使用古朴的金色字体。
卡牌插画区域：一道撕裂空间的裂缝悬浮在半空中，
裂缝中泄漏出紫色和蓝色的能量光芒，
周围的建筑和树木被吸入裂缝中正在扭曲变形。
地面的碎石和尘土向裂缝方向飘浮。
卡牌底部有属性信息："消耗：5 | 攻击：8 | 防御：3"
整体风格参考《万智牌》/《炉石传说》的卡牌美术设计。

9.6 教育与科普

提示词：
一张科普教育信息图（Infographic），主题是"太阳系行星"。
深蓝色星空背景上，八大行星按照到太阳的距离从左到右排列，
大小比例基本正确（木星最大，水星最小）。
每颗行星下方有中文标注名称和关键数据：
"水星 - 直径4,879km"
"金星 - 表面温度462°C"
"地球 - 生命家园"
"火星 - 红色星球"
"木星 - 太阳系最大行星"
"土星 - 壮观的环系统"
"天王星 - 侧卧旋转"
"海王星 - 最强风暴"
左上角有标题文字"探索太阳系"。
各行星有轨道线连接。干净的信息图设计风格，
扁平化但有光影质感。教科书级插图品质。

📊 十、提示词效果对比与调优技巧

10.1 提示词精细度对比

❌ 模糊提示词（效果不可控）：
"画一只猫"

⚠️ 一般提示词（基本可用）：
"一只橘猫坐在窗台上看外面的风景"

✅ 精细提示词（效果优秀）：
"一只毛色鲜亮的橘猫慵懒地蜷坐在白色窗台上，
透过雨滴斑驳的玻璃窗望向外面的花园。
窗外是模糊的绿色景色和细雨。
猫的眼睛是琥珀色，半眯着，表情慵懒满足。
柔和的自然散射光从窗户照入，在猫毛上形成温暖的轮廓光。
窗台上有一本翻开的书和一杯冒着热气的咖啡。
温馨的室内环境，暖色调。照片写实风格，
使用85mm镜头、f/2.0光圈的浅景深效果。"

结论：提示词越具体、结构越清晰，生成效果越接近预期。

10.2 常见问题与解决方案

问题	原因	解决方案
文字渲染不准确	提示词中文字描述不够明确	用引号明确框住要渲染的文字内容
多个人物属性混淆	属性没有明确绑定到具体人物	用"左边的男人穿着…右边的女人穿着…"明确对应
风格不够像	风格描述太笼统	引用具体的艺术家/品牌/作品名作为参考
构图不合预期	缺少空间位置描述	使用"前景/中景/远景""左侧/右侧/中央"明确布局
光影效果平淡	没有描述光源	明确光源方向、类型、色温和时间段
色彩不协调	没有指定配色方案	给出具体的颜色名称甚至十六进制色值
细节不够丰富	缺少材质纹理描述	添加材质描述（丝绸、木纹、金属拉丝等）
分辨率/清晰度不够	没有指定质量要求	添加"超高清"“8K”"极致细节"等质量提升词

🎓 十一、总结

提示词编写黄金法则

┌─────────────────────────────────────────────────────────┐
│          GPT-Image-2 中文提示词编写黄金法则              │
│                                                         │
│  1. 📝 越具体越好      → 避免"好看的""漂亮的"等模糊词     │
│  2. 🏗️ 结构化描述     → 主体→风格→构图→光影→色彩→细节    │
│  3. 🔤 文字用引号      → 图片中需渲染的文字用引号框住      │
│  4. 🎯 风格要具体      → 引用具体的艺术家/品牌/作品风格    │
│  5. 📐 空间要明确      → 用前景/中景/远景、左/中/右定位    │
│  6. 📷 技术参数加分    → 写实风格时指定相机/镜头/光圈      │
│  7. 🎨 色彩给色值      → 精确的颜色名称或十六进制色值      │
│  8. 🚫 说明不要什么    → 排除不想要的元素                  │
│  9. 🔄 迭代优化        → 基于生成结果逐步调整提示词        │
│  10. 🌏 中英文混用     → 专业术语可用英文，效果更精准      │
└─────────────────────────────────────────────────────────┘

Spring AI集成要点

┌─────────────────────────────────────────────────────────┐
│          Spring AI + GPT-Image-2 集成要点               │
│                                                         │
│  ✅ 模型名使用 "gpt-image-1"                            │
│  ✅ 质量参数：low（草稿）/ medium（日常）/ high（商业）   │
│  ✅ 尺寸选择：根据用途选择合适的宽高比                    │
│  ✅ 响应格式：b64_json 获取Base64编码                    │
│  ✅ 异常处理：捕获内容安全策略拒绝异常                    │
│  ✅ 成本控制：使用限流器控制API调用频率                   │
│  ✅ 存储策略：生成的图片及时保存到OSS/本地文件系统         │
└─────────────────────────────────────────────────────────┘

💬 互动交流

如果你在使用过程中遇到问题，欢迎：

📝 在评论区留言讨论，我会逐一回复
👀 关注我的公众号，获取更多AIGC实战教程
⭐ 如果这篇文章对你有帮助，请点赞、收藏、转发三连

你的支持是我持续创作的最大动力！

📚 参考资料

版权声明：本文为原创文章，转载请注明出处。
技术栈版本：Spring Boot 3.5.3 + Spring AI 1.1.4 + GPT-Image-2
更新时间：2026年4月26

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

别再把护网当打游戏！2026护网行动全攻略，从小白到蓝队老手实战干货

AtomGit开源社区

企业级解决方案九-商品图片自动检索与自动上架

AtomGit开源社区

我如何用Python搭建GEO监控系统：黄小宇的大模型可见度实验

我叫黄小宇，过去主要从事市场运营、渠道赋能、用户增长和数字化营销工作。最近我开始搭建一个GEO监控系统，用于测试国内大模型对个人、品牌和公开内容源的识别、提及和引用偏好。GEO，即Generative Engine Optimization，可以理解为生成式引擎优化或大模型可见度优化。随着DeepSeek、Kimi、通义千问、豆包、文心一言等大模型成为新的信息入口，用户获取信息的方式正在改变。这意