图神经网络 GNN 在需求预测中的应用：超越传统时间序列

几十年来，需求预测一直是零售运营、库存管理和供应链物流的基石。传统的方法在很大程度上依赖于单变量或多变量时间序列模型——从经典的 ARIMA 和指数平滑法到现代深度学习架构如 LSTM 和 Transformer。然而，这些模型共享一个根本性的缺陷：它们将库存单位（SKU）视为独立的实体，或者充其量视为并行的数据流。在现实世界的零售场景中，产品存在于复杂的关联网络中。某款特定智能手机的销售很可能会影响其兼容配件的销售；有机牛奶的促销可能会蚕食普通牛奶的销量。这就是图神经网络（Graph Neural Networks, GNNs）改变游戏规则的地方。

独立性假设的局限性

传统的时间序列预测模型假设变量的未来值主要取决于其历史值，可能还包括一些外部协变量（如天气或节假日）。虽然这在孤立的系统中有效，但它无法捕捉产品目录中内在的“空间”或“关系”依赖性。

在典型的供应链中，产品通过多种因素相互联系：

层级结构：产品属于特定的类别、子类别和品牌。
替代效应：如果产品 A 缺货，客户会购买产品 B。
互补效应：产品 A 通常与产品 B 一起购买。
地理位置：同一地区的商店共享相似的需求模式。

当我们使用 n1n.ai 集成先进的 LLM 来从产品描述中提取特征时，我们开始看到这些关系是如何被量化的。然而，标准的 Transformer 无法原生处理由数百万个交易边链接的 50,000 个 SKU 的图结构。这就是为什么 GNN 正成为追求最前沿准确性的企业的首选。

GNN 如何将需求建模为网络

图神经网络将整个产品目录表示为一个图 G = (V, E)。

节点 (V)：代表单个 SKU 或“商店-SKU”对。每个节点包含一个特征向量，其中包括历史销量、价格点和元数据。
边 (E)：代表 SKU 之间的关系。这些边可以根据相关性的强度或共同购买的频率进行加权。

消息传递与聚合机制

GNN 的核心机制是“消息传递”（Message Passing）。在网络的每一层中，一个节点都会从其邻居节点收集信息。对于需求预测而言，这意味着特定 SKU 的预测不仅受其自身历史的影响，还受到相关 SKU 发送的“消息”的启发。

如果“高端游戏笔记本电脑”的销量激增，GNN 会将此信息传播到“游戏鼠标”和“笔记本散热垫”节点，即使这些配件的历史数据尚未显示出激增。这种前瞻性的调整是传统 LSTM 在没有手动特征工程的情况下根本无法实现的。

实现指南：构建 GNN 预测器

为了实现用于需求预测的 GNN，开发者通常使用 PyTorch Geometric (PyG) 或 DGL 等库。以下是一个针对需求特征量身定制的图卷积层的概念性实现。

import torch
from torch_geometric.nn import GCNConv
import torch.nn.functional as F

class DemandGNN(torch.nn.Module):
    def __init__(self, num_node_features, hidden_channels, out_channels):
        super(DemandGNN, self).__init__()
        # GCN 层用于捕捉空间关系
        self.conv1 = GCNConv(num_node_features, hidden_channels)
        self.conv2 = GCNConv(hidden_channels, hidden_channels)

        # 线性层映射到预测跨度（例如未来 7 天）
        self.regressor = torch.nn.Linear(hidden_channels, out_channels)

    def forward(self, data):
        x, edge_index = data.x, data.edge_index

        # 1. 通过消息传递获取节点嵌入
        x = self.conv1(x, edge_index)
        x = F.relu(x)
        x = self.conv2(x, edge_index)

        # 2. 节点级回归输出
        out = self.regressor(x)
        return out

在实际场景中，您会将此 GNN 与时间组件（如 GRU 或时间卷积网络 TCN）结合使用。这种混合架构通常被称为 时空图神经网络 (Temporal Graph Neural Network, TGN)，它同时处理时间轴和图轴的数据。

传统方法与 GNN 方法的对比

特性	ARIMA / Prophet	LSTM / Transformer	图神经网络 (GNN)
数据结构	单变量	多变量（扁平）	关系型（图）
蚕食效应	被忽略	难以捕捉	天然建模
冷启动问题	无法处理	表现不佳	表现强劲（通过邻居）
可扩展性	高	中	高（配合采样技术）
可解释性	高	低	中（通过边权重分析）

专家建议：解决冷启动难题

零售业最大的挑战之一是预测新产品的需求（即“冷启动”问题）。由于新 SKU 没有历史销量，时间序列模型几乎无能为力。然而，通过使用 n1n.ai 访问高性能的嵌入模型，您可以根据属性将新 SKU 映射到现有的图中。因为 GNN 理解“新手机 X”与“旧手机 Y”具有相似性，它可以“借用”邻居的需求模式，从而提供高度准确的首日预测。

利用 n1n.ai 进行扩展

构建这些模型需要海量的干净数据，并且通常需要从非结构化文本或图像中提取补充特征。通过利用 n1n.ai，团队可以自动化其 SKU 图的丰富过程。例如，您可以使用 LLM API 对产品进行分类或从评论中提取情感，这些信息随后可作为 GNN 中的动态节点特征。

此外，GNN 的推理阶段可能计算量巨大。利用 n1n.ai 推荐的优化基础设施，可以确保您的预测流水线即使在产品目录增长到数百万个节点时，依然保持极高的响应速度。这种高性能的 API 接入能力对于需要实时库存调整的企业至关重要。

总结

需求预测不再仅仅是一个数学问题；它是一个拓扑问题。通过从时间序列的“孤岛”视角转向 GNN 的“网络”视角，企业可以捕捉到驱动现实世界商业的细微相互作用。无论是管理全球电子商务巨头的库存，还是优化本地制造商的供应链，GNN 都提供了以前无法达到的精度水平。在未来的竞争中，能够理解并利用产品间复杂关联的企业将占据绝对优势。

获取免费 API 密钥，请访问 n1n.ai

参考来源：https://towardsdatascience.com/time-series-isnt-enough-how-graph-neural-networks-change-demand-forecasting/