在代购、分销、ERP 与跨平台铺货场景中,淘宝、1688、京东的商品字段命名、结构与业务逻辑差异显著,直接导致数据聚合、价格监控、库存同步与订单履约频繁出错。构建统一商品数据模型 + 标准化字段映射,是实现多平台货源一体化管理的核心方案。本文从模型设计、平台差异、映射规则、落地实践四个维度,给出可直接复用的映射策略。


一、统一商品模型设计(核心标准)

采用SPU+SKU分层架构,公共信息放 SPU,销售维度放 SKU,避免冗余与不一致。

1. 统一 SPU 层(商品公共信息)

  • 平台来源、来源商品 ID、商品标题、副标题
  • 品牌、一级 / 二级 / 三级类目、商品标签
  • 主图、详情图、商品描述、上架状态
  • 发货地、售后规则、店铺信息、更新时间

2. 统一 SKU 层(库存销售单元)

  • 来源 SKU ID、SKU 编码、规格组合(颜色 + 尺寸 + 材质)
  • 销售价、划线价、活动价、成本价
  • 库存数量、是否有货、重量 / 体积
  • 条形码、SKU 图片、限购规则

3. 扩展字段(代购专用)

  • 代购费率、税费预估、物流方式、时效、是否支持代发
  • 限购、禁运标识、平台佣金、比价权重

二、三大平台字段差异与核心特征

淘宝(含天猫)

  • SPU 为主体,多 SKU 挂载同一商品 ID
  • 关键字段:num_iid、sku_id、title、price、quantity、pic_url
  • 特点:SKU 属性灵活,活动价与原价分离,库存实时性高

1688

  • 批发属性强,起批量、混批规则为核心字段
  • 关键字段:product_id、sku_id、subject、price、amount、unit
  • 特点:价格按批量阶梯,运费模板复杂,工厂 / 商家信息权重高

京东

  • SKU 为主体,不同 SKU 常对应不同链接
  • 关键字段:skuId、wareName、jdPrice、stockState、imagePath
  • 特点:自营 / POP 字段差异大,会员价、区域价逻辑复杂,库存精度高

三、核心字段映射表(直接复用)

表格

统一标准字段 淘宝字段 1688 字段 京东字段 映射说明
source_platform taobao 1688 jd 枚举值固定
source_spu_id num_iid productID spuId 商品父 ID
source_sku_id sku_id skuId skuId 销售规格 ID
title title subject wareName 截断超长字符
brand brand brand brandName 统一品牌词典
category category category category 映射到内部类目
main_image pic_url imageURL imagePath 取最高清主图
sale_price price price jdPrice 取到手实际价
market_price original_price market_price marketPrice 划线价
stock quantity amount stockState 转数值:有货 = 1,无货 = 0
spec props_name specInfo saleAttr 拼接为 “颜色:红;尺寸:M”
weight weight weight weight 统一单位 kg
shop_name nick companyName shopName 店铺 / 商家名称
status approve_status status saleState 统一为上架 / 下架 / 违规

四、映射执行策略与规则

1. 强制必选字段映射

  • 来源 ID、标题、主图、价格、库存、规格、链接
  • 缺失则标记异常,禁止进入代购流程

2. 价格映射优先级

  • 淘宝:活动价 → 销售价 → 原价
  • 1688:最小起批量价 → 阶梯价 → 市场价
  • 京东:到手价 → 会员价 → 原价

3. 库存映射规则

  • 淘宝:quantity>0 为有货
  • 1688:amount≥起订量为可代购
  • 京东:stockState = 正常为有货

4. 规格标准化

  • 统一分隔符:;
  • 统一键名:颜色、尺寸、容量、材质
  • 过滤无效属性(如 “包邮”“礼盒装”)

5. 图片归一化

  • 统一尺寸、去水印、压缩存储
  • 主图优先取平台官方首图

五、落地实现方案

1. 架构分层

  • 采集层:调用平台 API / 爬虫获取原始字段
  • 适配层:按映射表转换、清洗、校验
  • 商品中心:统一模型存储,作为唯一数据源
  • 应用层:代购、比价、铺货、订单履约

2. 自动化处理

  • 配置化映射字典,支持平台扩展
  • 定时同步与增量更新,保证数据新鲜度
  • 异常监控:价格突变、库存清零、标题违规

3. 去重与匹配

  • 品牌 + 型号 + 规格为唯一键
  • 结合图片指纹与标题分词,合并同款商品
  • 建立商品唯一编码,贯穿全链路

六、常见问题与避坑

  1. 京东 SPU/SKU 混淆:京东多 SKU 对应多链接,必须按 skuId 关联,避免价格错乱。
  2. 1688 批量价:必须记录起批量与阶梯价,防止代购成本计算错误。
  3. 淘宝活动价:区分优惠券、满减、秒杀,取用户实际支付价。
  4. 字段缺失:平台接口变更导致字段为空,需设置默认值与告警。
  5. 类目不统一:建立内部类目映射表,避免前端筛选失效。

七、总结

多平台代购商品统一建模的核心,是用一套标准模型屏蔽平台差异。通过 SPU+SKU 分层、标准化字段映射、自动化适配与校验,可实现淘宝 / 1688 / 京东货源的一站式管理,大幅降低数据错误率,提升代购效率与履约稳定性。

该方案可直接用于代购系统、分销 ERP、跨平台铺货工具与价格监控系统,后续只需新增平台映射字典即可快速扩展。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐