Viduran Apputhurai

Viduran Apputhurai
    Spark 3 : Adaptive Query Execution, explication et optimisation

    Spark 3 : Adaptive Query Execution, explication et optimisation

    Publié le Modifié le

      J’ai assisté à un webinar Cloudera sur le tuning des performances d’applications Spark proposé par François Reynald, un des Senior Technical Instructor de Cloudera, il a d’ailleurs écrit cet article sur comment Spark 3 améliore les performances des SQL workloads. Et dans l’un des précédents articles du blog Cyrès, j’avais évoqué les principales nouveautés …

    Lire la suite

    Architecture Druid

    Architecture Druid

    Publié le Modifié le

    Apache Druid est une base de données analytique axé temps réel offrant la possibilité de persister des quantités de données immenses et d’en extraire de l’information à une vitesse hallucinante, le tout couvrant de nombreux use cases, Druid aurait donc tout pour plaire. Creusons l’architecture d’apache Druid ensemble. La dernière version stable de Druid est …

    Lire la suite

    L’évolution prometteuse de Spark 3.0

    L’évolution prometteuse de Spark 3.0

    Publié le Modifié le

    Novembre 2019, alors que je continuais à préparer ma présentation sur Spark en interne pour présenter cette technologie à mes collègues, j’ai été agréablement surpris de voir que Spark 3.0 a été annoncé en preview. Au fil des années, Spark a su s’imposer en tant que technologie majeur au niveau du data processing, et cette annonce appuie ce fait, de nombreuses nouveautés et changements ont été annoncés, ceci se traduisant par plus de 3000 tickets Jira, ce qui est énorme !

    Lire la suite