AI dự báo nhu cầu giúp cắt tồn kho thừa ~30% — cách làm và số liệu

Thay điểm reorder trong Excel bằng model dự báo tại ba kho 3PL Việt Nam — hit rate, vốn lưu động giải phóng, và những đợt stockout bạn vẫn phải chịu.

Tồn kho thừa khiến nhà vận hành logistics mất 20–30% vốn lưu động hàng năm. Dự báo nhu cầu bằng AI thay đổi công thức này bằng cách dự đoán nhu cầu tương lai với độ chính xác 90%+, giúp kho bãi chỉ tồn những gì bán được và trì hoãn những gì không cần.

Vấn đề: dự báo thủ công vỡ khi lên quy mô

Hầu hết nhà vận hành 3PL và kho bãi vẫn dự báo nhu cầu bằng:

  • Trung bình lịch sử (tháng 1 năm ngoái → tháng 1 năm nay)
  • Cảm tính của đội sales
  • Cam kết từ khách hàng (thay đổi hàng tuần)

Những phương pháp này hoạt động khi số SKU dưới 100 và hành vi khách hàng ổn định. Chúng thất bại khi chạm 500+ SKU, biến động theo mùa, hoặc phân phối đa kênh.

Kịch bản lỗi điển hình: Đặt dư hàng chạy chậm (vốn bị kẹt, lãng phí diện tích kho) và đặt thiếu hàng chạy nhanh (hết hàng, mất doanh thu, phải gửi hàng gấp tốn kém).

AI dự báo hoạt động như thế nào

Mô hình dự báo nhu cầu thu thập:

  1. Dữ liệu bán hàng lịch sử — số lượng bán theo từng SKU theo ngày/tuần
  2. Tín hiệu theo mùa — ngày lễ, khuyến mãi, thời tiết
  3. Sự kiện bên ngoài — chỉ số kinh tế, sản phẩm đối thủ ra mắt, gián đoạn chuỗi cung ứng
  4. Biến động thời gian giao hàng — thực tế nhà cung cấp giao hàng mất bao lâu

Mô hình xuất phân phối xác suất nhu cầu cho từng SKU trong 4–12 tuần tới. Bộ phận mua hàng dùng kết quả này để:

  • Đặt nhiều hơn các mặt hàng chắc chắn bán chạy
  • Trì hoãn các SKU độ tin cậy thấp
  • Gắn cờ bất thường (đột biến nhu cầu có thể là lỗi dữ liệu)

Kết quả đo lường từ khách hàng Woka

WOKA triển khai AI dự báo nhu cầu cho ba nhà vận hành kho tại Việt Nam (fulfilment thương mại điện tử, phân phối bán buôn, gom hàng xuyên biên giới). Kết quả sau 6 tháng:

Chỉ sốTrướcSauCải thiện
Độ chính xác dự báo72%94%+22pp
Tồn kho thừa28% tổng hàng18% tổng hàng-36%
Tỷ lệ hết hàng8.5%3.2%-62%
Vốn lưu động khóa trong tồn kho$2.1M$1.5M-29%

Cải thiện lớn nhất: vận hành được nhiều đơn hơn với lượng tồn kho trên tay thấp hơn. Nhờ đó giải phóng diện tích kho cho các SKU biên lợi cao hơn và giảm chi phí vốn kẹt ở hàng chạy chậm.

Cách tiếp cận kỹ thuật

Pipeline dự báo của WOKA:

  1. Thu thập dữ liệu — Lấy dữ liệu bán hàng, tồn kho, đơn hàng từ WMS/ERP qua REST API hoặc database replication
  2. Tạo đặc trưng (feature engineering) — Trung bình trượt, chỉ số theo mùa, tốc độ luân chuyển SKU, phương sai thời gian giao của nhà cung cấp
  3. Huấn luyện mô hình — Mô hình time-series (ARIMA, Prophet) cho SKU ổn định; cây gradient-boosted (XGBoost) cho SKU biến động với nhiều feature bên ngoài
  4. Phục vụ dự đoán — Endpoint suy luận FastAPI; làm mới dự báo hàng ngày và đẩy lên dashboard mua hàng
  5. Giám sát — Theo dõi lỗi dự đoán theo thời gian; huấn luyện lại khi độ chính xác giảm dưới 85%

Độ trễ: p95 dưới 200ms cho mỗi lần dự báo một SKU. Throughput: 10.000 SKU được dự báo trong chưa đầy 2 phút trên một máy ảo cloud tối ưu CPU.

Khi nào AI dự báo không giúp được

Ba tình huống dự báo thủ công vẫn thắng:

  • Ra mắt sản phẩm mới — Không có dữ liệu lịch sử; mô hình không thể dự báo nhu cầu cho SKU chưa tồn tại quý trước
  • Danh mục nhỏ (dưới 50 SKU) — Chi phí vận hành mô hình lớn hơn lợi ích so với dự báo thủ công
  • Đơn B2B tuỳ biến cao — Khi mỗi đơn là một cuộc đàm phán riêng, pattern lịch sử không chuyển giao được

Trong các trường hợp đó, nên kết hợp: người xử lý SKU mới hoặc đơn đặt hàng đặc thù; AI lo phần đuôi dài của nhu cầu lặp lại.

Bước tiếp theo

Nếu bạn đang vận hành kho với trên 200 SKU và thấy trên 15% tồn kho thừa hoặc trên 5% tỷ lệ hết hàng, AI dự báo có khả năng hoàn vốn chi phí triển khai trong 3–6 tháng.

Liên hệ info@woka.io để trao đổi scope dự án. WOKA sẽ xem lịch sử đơn hàng và ước lượng độ chính xác dự báo trước khi bạn cam kết bất kỳ điều khoản nào.