Pipeline

Phases du Pipeline

Étape	Outils/Méthodes	Description
Chargement	`pd.read_csv()`	Import du dataset Bitcoin avec parsing automatique des dates
Nettoyage	`pd.dropna()` + Masques booléens	Gestion des valeurs manquantes et outliers
Feature Engineering	Volatilité, MACD, Lags Fear_Greed	Création de 15+ indicateurs techniques et décalages temporels
Analyse Univariée	KPSS, ADFuller, ACF/PACF	Tests de stationnarité et analyse d’autocorrélation
Analyse Bivariée	Matrice de corrélation, Lag Analysis	Identification des relations entre features et target
Préprocessing	`RobustScaler()`	Normalisation robuste aux outliers

Étape	Outils/Méthodes	Description
Création de Séquences	`SequenceTransformer`	Transformation en séquences temporelles (60 jours)
Split Temporel	`TimeSeriesSplit(n_splits=5)`	Validation croisée temporelle (80/20)
Architecture Modèle	`build_advanced_model()`	CNN-LSTM avec couches configurables
Optimisation Hyperparamètres	`Optuna (50 essais)`	Recherche automatique des meilleurs paramètres (unités, couches, dropout)
Callbacks Intelligents	`EarlyStopping`, `ReduceLROnPlateau`	Arrêt précoce et ajustement dynamique du learning rate
Entraînement Final	`Adam` optimizer, `Huber loss`	Entraînement sur données complètes (300 epochs)

Étape	Outils/Méthodes	Description
Inverse Scaling	Matrices Dummy + `scaler.inverse_transform`	Transformation des prédictions en USD
Nettoyage des Données	Masque booléen + `np.isnan()`	Filtrage des valeurs aberrantes et NaN
Visualisation	`matplotlib`, `plotly`	Comparaison graphique prix réel vs prédictions (données nettoyées)
Métriques de Performance	`MAE`, `RMSE`, `Directionnal Accuracy`	Calcul des erreurs en USD et précision directionnelle
Sauvegarde	`model.save()` + `joblib`	Export du modèle et du pipeline de préprocessing