Visualisation Détaillée des Datasets
Vue d’ensemble
La fonctionnalité de visualisation détaillée des datasets offre une interface complète et moderne similaire à Kaggle pour explorer en profondeur les caractéristiques d’un dataset. Cette interface provide un "effet wow" avec des informations riches, des graphiques interactifs et une présentation visuelle soignée.
Architecture
Composants Frontend
DatasetDetailComponent
Composant principal de visualisation situé dans frontend/src/app/pages/datasets/dataset-detail.component.ts
.
Responsabilités : - Chargement des données détaillées du dataset - Gestion de l’interface utilisateur avec onglets - Affichage des métriques de qualité et alertes - Navigation entre les différentes vues
Données chargées : - Dataset complet avec métadonnées étendues - Aperçu des données avec statistiques - Métriques de qualité calculées - Datasets similaires - Analyses de distribution et corrélations
Structure des Onglets
Onglet | Description |
---|---|
Vue d’ensemble |
Statistiques générales, informations métier, métriques de qualité, conformité éthique |
Fichiers et Structure |
Liste des fichiers du dataset, détails des colonnes, métadonnées techniques |
Aperçu des Données |
Échantillon de données tabulaires, statistiques descriptives par colonne |
Analytics |
Corrélations entre features, patterns de données manquantes, distribution des classes |
Modèles de Données
Interfaces TypeScript Étendues
// Interface principale pour la vue détaillée
interface DatasetDetailView extends Dataset {
files: DatasetFileMetadata[];
quality_metrics: DatasetQualityMetrics;
distribution_analysis: DataDistributionAnalysis;
usage_examples?: UsageExample[];
related_datasets?: RelatedDataset[];
download_stats?: DownloadStats;
}
// Métriques de qualité
interface DatasetQualityMetrics {
overall_score: number;
completeness: number;
consistency: number;
accuracy: number;
timeliness: number;
ethical_compliance: number;
missing_data_impact: number;
outliers_percentage: number;
pii_exposure_risk: number;
}
// Aperçu des données
interface DatasetPreview {
dataset_id: string;
file_name: string;
sample_data: { [column: string]: any }[];
total_rows: number;
columns_info: ColumnInfo[];
}
Services API
DatasetService - Nouvelles Méthodes
// Récupération des détails complets
getDatasetDetails(id: string): Observable<DatasetDetailView>
// Aperçu des données
getDatasetPreview(id: string, fileId?: string, limit?: number): Observable<DatasetPreview>
// Métriques de qualité
getDatasetQualityMetrics(id: string): Observable<DatasetQualityMetrics>
// Analyse de distribution
getDataDistributionAnalysis(id: string): Observable<DataDistributionAnalysis>
// Statistiques des colonnes
getColumnStatistics(datasetId: string, fileId: string): Observable<ColumnStatistics[]>
// Datasets similaires
getSimilarDatasets(id: string, limit?: number): Observable<Dataset[]>
Interface Utilisateur
Design System
Header Héroïque
-
Gradient de fond avec pattern de données
-
Informations principales du dataset en évidence
-
Score de qualité circulaire avec animation
-
Boutons d’action (télécharger, favoris, partager)
-
Tags pour domaines et tâches ML
Fonctionnalités Avancées
Aperçu Interactif des Données
Analytics Avancés
Corrélations entre Features
-
Tableau des corrélations les plus fortes (> 0.1)
-
Barres de progression pour visualiser l’intensité
-
Types de corrélation (Pearson, Spearman, Kendall)
-
Classification par force (forte > 0.7, moyenne > 0.3)
Navigation et Routing
Performance et Optimisations
Internationalisation
Clés de Traduction
Structure organisée dans assets/i18n/
:
{
"DATASET_DETAIL": {
"TABS": {
"OVERVIEW": "Vue d'ensemble",
"FILES_STRUCTURE": "Fichiers et Structure",
"DATA_PREVIEW": "Aperçu des Données",
"ANALYTICS": "Analytics"
},
"QUALITY_ALERTS": {
"TITLE": "Alertes de Qualité",
"MISSING_DATA": "Données manquantes importantes"
}
}
}
Intégration Backend
Endpoints API Requis
Endpoint | Méthode | Description |
---|---|---|
|
GET |
Données complètes du dataset avec métriques |
|
GET |
Aperçu des données avec statistiques |
|
GET |
Métriques de qualité détaillées |
|
GET |
Analyse de distribution et corrélations |
|
GET |
Statistiques détaillées par colonne |
|
GET |
Datasets similaires recommandés |
Tests et Validation
Tests Unitaires
Tests à implémenter pour : - Chargement des données et gestion d’erreurs - Calcul des alertes de qualité - Navigation entre onglets - Formatage des données
Évolutions Futures
Fonctionnalités Prévues
Graphiques Interactifs
-
Histogrammes des distributions
-
Matrices de corrélation visuelles
-
Graphiques de dispersion
-
Heatmaps de données manquantes
Maintenance
Logs et Monitoring
-
Tracking des vues de datasets
-
Métriques de performance de chargement
-
Erreurs d’affichage et API
Mise à jour des Données
-
Cache des métriques de qualité
-
Synchronisation des aperçus de données
-
Invalidation automatique
Cette fonctionnalité represent un élément clé de l’expérience utilisateur ExAI, offrant une exploration riche et intuitive des datasets disponibles avec un design moderne et des informations actionables.