A Framework for High Availability Based on a Single System Image
High availability (HA) is today an important issue in the domain of cluster computing, clusters being more and more larger, introducing a lot of failures. Today, the literature provides a lot of different HA strategies to tolerate application failures (applications being sequential or parallel). Unfortunately, it is still difficult to implement these HA policies inside a real system, and therefore the study of these policies is most of the time just theoretic, without real implementation. Therefore, a framework to ease the implementation of such policies is interesting. Moreover, a single system image (SSI), thanks to mechanisms for the global management of cluster resources, is a good candidate to provide such a framework. This paper presents the preliminary study of this framework on top of the Kerrighed SSI. \\ La haute disponibilité est aujourd'hui un problème important pour les grappes de calculateurs, ceux-ci ayant une taille de plus en plus grande, introduisant de nombreuses fautes. Pour cela, la littérature offre de nombreuses stratégies permettant de tolérer les fautes d'applications (que les applications soient séquentielles ou parallèles). Malheureusement, la mise en \oe uvre de ces politiques de haute disponibilité est toujours difficile et leur étude est donc très souvent limité à une étude théorique, sans réelle mise en oeuvre. Un environnement dédié simplifiant la mise en oeuvre de telles politiques est donc intéresant. De plus, un Système à Image Unique (Single System Image - SSI), grâce à ses mécanismes de gestion globale des ressources de la grappe, est un bon candidat pour offrir un tel environnement. Ce document présente l'étude préliminaire d'un tel environnement fondé sur le SSI Kerrighed.