Machine Learning không phải "hộp đen thần kỳ" — đó là công cụ tìm pattern trong dữ liệu lịch sử để dự đoán xác suất xảy ra trong tương lai. Bài viết này hướng dẫn quy trình thực tế từ A đến Z.
Chất lượng dữ liệu quyết định 80% hiệu quả của mô hình. Dữ liệu cần có:
Look-ahead bias — dùng dữ liệu tương lai để train mô hình. Luôn đảm bảo mô hình chỉ thấy dữ liệu đã xảy ra tại thời điểm ra tín hiệu.
Features là các đặc trưng được tính toán từ dữ liệu thô để mô hình học. Một số features hiệu quả trong trading:
Với dữ liệu thị trường, các mô hình sau thường cho kết quả tốt:
Không dùng accuracy làm metric chính — thay vào đó dùng Sharpe Ratio và Maximum Drawdown trên dữ liệu test chưa từng thấy (out-of-sample). Backtest phải qua ít nhất 500 trades mới có ý nghĩa thống kê.
Bot ml_logger.py của hệ thống chạy inference mỗi khi nến đóng, ghi kết quả vào ml_signal.json để các bot giao dịch đọc và ra quyết định.
Truy cập AI Trading Pro Dashboard