Class DataFrame


  • public class DataFrame
    extends Object
    Une classe représentant un DataFrame pour la manipulation de données tabulaires.
    • Constructor Detail

      • DataFrame

        public DataFrame​(Object[][] data,
                         String[] columns)
        Constructeur prenant des données et des colonnes en tant que paramètres.
        Parameters:
        data - Les données du DataFrame.
        columns - Les noms des colonnes.
      • DataFrame

        public DataFrame​(String csvFilePath)
                  throws IOException
        Constructeur prenant un chemin de fichier CSV comme paramètre pour charger les données.
        Parameters:
        csvFilePath - Le chemin du fichier CSV.
        Throws:
        IOException - En cas d'erreur lors de la lecture du fichier.
    • Method Detail

      • getData

        public List<Object[]> getData()
        Obtient les données du DataFrame.
        Returns:
        Les données du DataFrame.
      • displayFirst

        public void displayFirst​(int numRows)
        Affiche les premières lignes du DataFrame.
        Parameters:
        numRows - Le nombre de lignes à afficher.
      • displayLast

        public void displayLast​(int numRows)
        Affiche les dernières lignes du DataFrame.
        Parameters:
        numRows - Le nombre de lignes à afficher.
      • display

        public void display()
        Affiche toutes les données du DataFrame.
      • selectRows

        public DataFrame selectRows​(int[] indices)
        Sélectionne les lignes spécifiées par les indices.
        Parameters:
        indices - Les indices des lignes à sélectionner.
        Returns:
        Un nouveau DataFrame contenant les lignes sélectionnées.
      • selectColumns

        public DataFrame selectColumns​(String[] labels)
        Sélectionne les colonnes spécifiées par les labels.
        Parameters:
        labels - Les noms des colonnes à sélectionner.
        Returns:
        Un nouveau DataFrame contenant les colonnes sélectionnées.
      • calculateMean

        public double calculateMean​(String columnName)
        Calcule la moyenne des valeurs dans la colonne spécifiée.
        Parameters:
        columnName - Le nom de la colonne pour laquelle calculer la moyenne.
        Returns:
        La moyenne des valeurs de la colonne.
      • calculateMinimum

        public double calculateMinimum​(String columnName)
      • calculateMaximum

        public double calculateMaximum​(String columnName)
        Calcule la valeur maximale dans la colonne spécifiée.
        Parameters:
        columnName - Le nom de la colonne pour laquelle calculer la valeur maximale.
        Returns:
        La valeur maximale de la colonne.
      • calculateSum

        public double calculateSum​(String columnName)
        Calcule la somme des valeurs dans la colonne spécifiée.
        Parameters:
        columnName - Le nom de la colonne pour laquelle calculer la somme.
        Returns:
        La somme des valeurs de la colonne.
      • filter

        public DataFrame filter​(String columnName,
                                double seuil)
        Filtrer les lignes du DataFrame en fonction d'une condition simple.
        Parameters:
        columnName - Le nom de la colonne à filtrer.
        seuil - Le seuil à comparer.
        Returns:
        Un nouveau DataFrame contenant les lignes filtrées.
      • groupBy

        public Map<Object,​DataFrame> groupBy​(String columnName)
        Regroupe les données du DataFrame selon les valeurs d'une colonne spécifiée.
        Parameters:
        columnName - Le nom de la colonne selon laquelle effectuer le regroupement.
        Returns:
        Un Map où les clés sont les valeurs uniques de la colonne et les valeurs sont les DataFrame correspondants.
      • aggregate

        public Map<Object,​Double> aggregate​(String operation,
                                                  String columnName,
                                                  String groupByColumn)
        Applique une opération d'agrégation à chaque groupe de données.
        Parameters:
        operation - L'opération à appliquer (par exemple : moyenne, somme, minimum, maximum).
        columnName - Le nom de la colonne sur laquelle appliquer l'opération.
        groupByColumn - Le nom de la colonne à utiliser pour le regroupement (si nécessaire).
        Returns:
        Un Map où les clés sont les valeurs uniques de la colonne de regroupement et les valeurs sont les résultats de l'opération.