在代购、分销、ERP 与跨平台铺货场景中,淘宝、1688、京东的商品字段命名、结构与业务逻辑差异显著,直接导致数据聚合、价格监控、库存同步与订单履约频繁出错。构建统一商品数据模型 + 标准化字段映射,是实现多平台货源一体化管理的核心方案。本文从模型设计、平台差异、映射规则、落地实践四个维度,给出可直接复用的映射策略。
一、统一商品模型设计(核心标准)
采用SPU+SKU分层架构,公共信息放 SPU,销售维度放 SKU,避免冗余与不一致。
1. 统一 SPU 层(商品公共信息)
- 平台来源、来源商品 ID、商品标题、副标题
- 品牌、一级 / 二级 / 三级类目、商品标签
- 主图、详情图、商品描述、上架状态
- 发货地、售后规则、店铺信息、更新时间
2. 统一 SKU 层(库存销售单元)
- 来源 SKU ID、SKU 编码、规格组合(颜色 + 尺寸 + 材质)
- 销售价、划线价、活动价、成本价
- 库存数量、是否有货、重量 / 体积
- 条形码、SKU 图片、限购规则
3. 扩展字段(代购专用)
- 代购费率、税费预估、物流方式、时效、是否支持代发
- 限购、禁运标识、平台佣金、比价权重
二、三大平台字段差异与核心特征
淘宝(含天猫)
- 以SPU 为主体,多 SKU 挂载同一商品 ID
- 关键字段:num_iid、sku_id、title、price、quantity、pic_url
- 特点:SKU 属性灵活,活动价与原价分离,库存实时性高
1688
- 批发属性强,起批量、混批规则为核心字段
- 关键字段:product_id、sku_id、subject、price、amount、unit
- 特点:价格按批量阶梯,运费模板复杂,工厂 / 商家信息权重高
京东
- 以SKU 为主体,不同 SKU 常对应不同链接
- 关键字段:skuId、wareName、jdPrice、stockState、imagePath
- 特点:自营 / POP 字段差异大,会员价、区域价逻辑复杂,库存精度高
三、核心字段映射表(直接复用)
表格
| 统一标准字段 | 淘宝字段 | 1688 字段 | 京东字段 | 映射说明 |
|---|---|---|---|---|
| source_platform | taobao | 1688 | jd | 枚举值固定 |
| source_spu_id | num_iid | productID | spuId | 商品父 ID |
| source_sku_id | sku_id | skuId | skuId | 销售规格 ID |
| title | title | subject | wareName | 截断超长字符 |
| brand | brand | brand | brandName | 统一品牌词典 |
| category | category | category | category | 映射到内部类目 |
| main_image | pic_url | imageURL | imagePath | 取最高清主图 |
| sale_price | price | price | jdPrice | 取到手实际价 |
| market_price | original_price | market_price | marketPrice | 划线价 |
| stock | quantity | amount | stockState | 转数值:有货 = 1,无货 = 0 |
| spec | props_name | specInfo | saleAttr | 拼接为 “颜色:红;尺寸:M” |
| weight | weight | weight | weight | 统一单位 kg |
| shop_name | nick | companyName | shopName | 店铺 / 商家名称 |
| status | approve_status | status | saleState | 统一为上架 / 下架 / 违规 |
四、映射执行策略与规则
1. 强制必选字段映射
- 来源 ID、标题、主图、价格、库存、规格、链接
- 缺失则标记异常,禁止进入代购流程
2. 价格映射优先级
- 淘宝:活动价 → 销售价 → 原价
- 1688:最小起批量价 → 阶梯价 → 市场价
- 京东:到手价 → 会员价 → 原价
3. 库存映射规则
- 淘宝:quantity>0 为有货
- 1688:amount≥起订量为可代购
- 京东:stockState = 正常为有货
4. 规格标准化
- 统一分隔符:;
- 统一键名:颜色、尺寸、容量、材质
- 过滤无效属性(如 “包邮”“礼盒装”)
5. 图片归一化
- 统一尺寸、去水印、压缩存储
- 主图优先取平台官方首图
五、落地实现方案
1. 架构分层
- 采集层:调用平台 API / 爬虫获取原始字段
- 适配层:按映射表转换、清洗、校验
- 商品中心:统一模型存储,作为唯一数据源
- 应用层:代购、比价、铺货、订单履约
2. 自动化处理
- 配置化映射字典,支持平台扩展
- 定时同步与增量更新,保证数据新鲜度
- 异常监控:价格突变、库存清零、标题违规
3. 去重与匹配
- 以品牌 + 型号 + 规格为唯一键
- 结合图片指纹与标题分词,合并同款商品
- 建立商品唯一编码,贯穿全链路
六、常见问题与避坑
- 京东 SPU/SKU 混淆:京东多 SKU 对应多链接,必须按 skuId 关联,避免价格错乱。
- 1688 批量价:必须记录起批量与阶梯价,防止代购成本计算错误。
- 淘宝活动价:区分优惠券、满减、秒杀,取用户实际支付价。
- 字段缺失:平台接口变更导致字段为空,需设置默认值与告警。
- 类目不统一:建立内部类目映射表,避免前端筛选失效。
七、总结
多平台代购商品统一建模的核心,是用一套标准模型屏蔽平台差异。通过 SPU+SKU 分层、标准化字段映射、自动化适配与校验,可实现淘宝 / 1688 / 京东货源的一站式管理,大幅降低数据错误率,提升代购效率与履约稳定性。
该方案可直接用于代购系统、分销 ERP、跨平台铺货工具与价格监控系统,后续只需新增平台映射字典即可快速扩展。