Tồn kho thừa khiến nhà vận hành logistics mất 20–30% vốn lưu động hàng năm. Dự báo nhu cầu bằng AI thay đổi công thức này bằng cách dự đoán nhu cầu tương lai với độ chính xác 90%+, giúp kho bãi chỉ tồn những gì bán được và trì hoãn những gì không cần.
Vấn đề: dự báo thủ công vỡ khi lên quy mô
Hầu hết nhà vận hành 3PL và kho bãi vẫn dự báo nhu cầu bằng:
- Trung bình lịch sử (tháng 1 năm ngoái → tháng 1 năm nay)
- Cảm tính của đội sales
- Cam kết từ khách hàng (thay đổi hàng tuần)
Những phương pháp này hoạt động khi số SKU dưới 100 và hành vi khách hàng ổn định. Chúng thất bại khi chạm 500+ SKU, biến động theo mùa, hoặc phân phối đa kênh.
Kịch bản lỗi điển hình: Đặt dư hàng chạy chậm (vốn bị kẹt, lãng phí diện tích kho) và đặt thiếu hàng chạy nhanh (hết hàng, mất doanh thu, phải gửi hàng gấp tốn kém).
AI dự báo hoạt động như thế nào
Mô hình dự báo nhu cầu thu thập:
- Dữ liệu bán hàng lịch sử — số lượng bán theo từng SKU theo ngày/tuần
- Tín hiệu theo mùa — ngày lễ, khuyến mãi, thời tiết
- Sự kiện bên ngoài — chỉ số kinh tế, sản phẩm đối thủ ra mắt, gián đoạn chuỗi cung ứng
- Biến động thời gian giao hàng — thực tế nhà cung cấp giao hàng mất bao lâu
Mô hình xuất phân phối xác suất nhu cầu cho từng SKU trong 4–12 tuần tới. Bộ phận mua hàng dùng kết quả này để:
- Đặt nhiều hơn các mặt hàng chắc chắn bán chạy
- Trì hoãn các SKU độ tin cậy thấp
- Gắn cờ bất thường (đột biến nhu cầu có thể là lỗi dữ liệu)
Kết quả đo lường từ khách hàng Woka
WOKA triển khai AI dự báo nhu cầu cho ba nhà vận hành kho tại Việt Nam (fulfilment thương mại điện tử, phân phối bán buôn, gom hàng xuyên biên giới). Kết quả sau 6 tháng:
| Chỉ số | Trước | Sau | Cải thiện |
|---|---|---|---|
| Độ chính xác dự báo | 72% | 94% | +22pp |
| Tồn kho thừa | 28% tổng hàng | 18% tổng hàng | -36% |
| Tỷ lệ hết hàng | 8.5% | 3.2% | -62% |
| Vốn lưu động khóa trong tồn kho | $2.1M | $1.5M | -29% |
Cải thiện lớn nhất: vận hành được nhiều đơn hơn với lượng tồn kho trên tay thấp hơn. Nhờ đó giải phóng diện tích kho cho các SKU biên lợi cao hơn và giảm chi phí vốn kẹt ở hàng chạy chậm.
Cách tiếp cận kỹ thuật
Pipeline dự báo của WOKA:
- Thu thập dữ liệu — Lấy dữ liệu bán hàng, tồn kho, đơn hàng từ WMS/ERP qua REST API hoặc database replication
- Tạo đặc trưng (feature engineering) — Trung bình trượt, chỉ số theo mùa, tốc độ luân chuyển SKU, phương sai thời gian giao của nhà cung cấp
- Huấn luyện mô hình — Mô hình time-series (ARIMA, Prophet) cho SKU ổn định; cây gradient-boosted (XGBoost) cho SKU biến động với nhiều feature bên ngoài
- Phục vụ dự đoán — Endpoint suy luận FastAPI; làm mới dự báo hàng ngày và đẩy lên dashboard mua hàng
- Giám sát — Theo dõi lỗi dự đoán theo thời gian; huấn luyện lại khi độ chính xác giảm dưới 85%
Độ trễ: p95 dưới 200ms cho mỗi lần dự báo một SKU. Throughput: 10.000 SKU được dự báo trong chưa đầy 2 phút trên một máy ảo cloud tối ưu CPU.
Khi nào AI dự báo không giúp được
Ba tình huống dự báo thủ công vẫn thắng:
- Ra mắt sản phẩm mới — Không có dữ liệu lịch sử; mô hình không thể dự báo nhu cầu cho SKU chưa tồn tại quý trước
- Danh mục nhỏ (dưới 50 SKU) — Chi phí vận hành mô hình lớn hơn lợi ích so với dự báo thủ công
- Đơn B2B tuỳ biến cao — Khi mỗi đơn là một cuộc đàm phán riêng, pattern lịch sử không chuyển giao được
Trong các trường hợp đó, nên kết hợp: người xử lý SKU mới hoặc đơn đặt hàng đặc thù; AI lo phần đuôi dài của nhu cầu lặp lại.
Bước tiếp theo
Nếu bạn đang vận hành kho với trên 200 SKU và thấy trên 15% tồn kho thừa hoặc trên 5% tỷ lệ hết hàng, AI dự báo có khả năng hoàn vốn chi phí triển khai trong 3–6 tháng.
Liên hệ info@woka.io để trao đổi scope dự án. WOKA sẽ xem lịch sử đơn hàng và ước lượng độ chính xác dự báo trước khi bạn cam kết bất kỳ điều khoản nào.