l’analyse de données est un enjeux majeur et prend de plus en plus d’ampleur. Pour arriver à extraire des informations pertinentes il est primordiale d’avoir une plateforme optimisée et réactive. Jetons un œil à ce qui à retenu notre attention en mars à ce sujet !
Analyse de données avec Python 3
Une introduction au Time-Series en Python 3 avec Panda : Time Series Visualization with Python 3
Via un Notebook Jupyter, on apprend en 5 étapes, comment utiliser la donnée et créer une visualisation appropriée et pertinente :
- Installation
- Chargement
- Indexation
- Traitement
- Visualiston
Impala Cookbook
Manipuler des données c’est bien, mais la plateforme est elle optimisée pour cela ?
On retrouve dans ce cookbook plusieurs axes de réflexion sur les améliorations des plateformes Big Data Hadoop utilisant Impala.
Voici quelques exemples :
- Problématique de performance
- Dimensionnement
- Multi tenant
- Data Optimisation de requête
Retrouvez ce fameux Cookbook sur le blog Cloudera.
Big Data Hebdo
C’est frais, c’est geek et c’est intéressant. De 13 minutes à plus d’une heure, voici des podcasts Big Data qui ne manques pas d’air !
Un avis technique sur les outils que l’on utilise au quotidien, et ceux de demain. A écouter ou réécouter : Big Data Hebdo
Restez au courant des parutions via twitter : @bigdatahebdo
Intéressé ?
Si des problématiques d’optimisation de plateforme ou d’analyse de données vous intéressent, contactez nous pour en discuter !
Soit sur Twitter via @cyres ou directement sur notre site
___
Explore, enrich, make data yours !
___