Le PHP Tour Nantes 2012 c’est bientôt !

le 29 et 30 novembre prochain, se tiendra l’une des conférences majeures du PHP en France et traitera en arrière plan de « l’Open Data ». Comme chaque année, se pose le dilemme du choix des sessions. Il y en aura pour tous les goûts : de l’AOP aux solutions d’intégrations et de déploiements en passant par le réseau puis #phptour nantes du coté des bases de données NoSQL pour repartir sur le test unitaire avec Atoum et bien d’autre encore. Bref comme chaque année : un choix cornélien parfois frustrant car on aimerait assister à toutes les conférences. Je ne peux que vous conseiller de venir à deux collaborateurs !

Pour ma part, ce sera une première et j’aurais l’honneur de présenter « Les technologies du BigData au service de l’OpenData ». Je vous présenterai Hadoop, un framework dédié au stockage de données massives qui implémente le pattern « Map / Reduce ». Nous verrons comment utiliser PHP au travers de la lib « Hadoop-streaming » pour intégrer nos données dans le cluster. Au travers d’une démo, nous verrons également les technologies qui permettent d’extraire et de manipuler ces données structurées.

Je vous recommande de participer aux conférences suivantes qui vous permettront d’avoir une vision technique globale sur la chaine du BigData :
- « Gearman, Les rouages du travail distribué » permettant de jouer le rôle de SCHEDULER !
- « Ciel ! Mes données ne sont plus relationnelles » et « Hybridation de bases de données » qui traiteront des bases de données NoSQL largement employées au sein de plate-forme Analytics.

#phptour nantes 2012 jyserai

Caching avancé et stratégie d’optimisation pour des applications web à forte charge

Avant de détailler les systèmes de caching que l’on peut trouver au sein d’une infrastructure, je vous recommande de lire le billet sur le système de cache fichier pour bien appréhender le mécanisme d’optimisation sous-jacent.

pour répondre aux problématiques de montée en charge des services, on aura recourt à plusieurs niveaux de cache. Cette stratégie d’optimisation est faîte de manière globale et prend en compte tous les paramètres de l’infrastructure et de l’application pour être optimale. Ces moyens permettent de soulager l’infrastructure et de résorber des goulots d’étranglements. Le design et l’intégration de ces solutions imposent tout de même d’avoir les réflexions suivantes :

  • Est-ce que nous devons tout mettre en cache ?
  • Est-ce que tout est cachable ?
  • Le mécanisme d’invalidation du cache peut-il remettre en cause le choix technique ou impose-t-il des développements complémentaires ?

Lire la suite

Les systèmes de cache pour améliorer les performances de vos applications web

Un système de cache ou « caching system » améliore dans certaines conditions la performance des applications web. Son rôle est de retourner à l’application des éléments (objets php, requêtes SQL, pages HTML, Bloc de contenu dynamique …) déjà calculés ou précompilés. Cela évite de refaire le travail à chaque itération. La mise en place d’une gestion optimisée du système de cache améliore de manière significative les performances de vos applications !

Lire la suite

Gearman fait son job

Gearman est un service de «pool request». Il reçoit d’un côté les demandes de traitement à faire (jobs) et transmet les ordres d’exécution aux workers qui réaliseront la tâche demandée.

    Les «jobs» demandés à Gearman peuvent être :

  • synchrone : le client attend que Gearman renvoie le résultat de l’exécution de la tâche,
  • asynchrone : le client demande à faire faire un traitement par Gearman en tache de fond et n’attend aucun résultat en retour.

Lire la suite