LAL PCs are volunteer, by default, to participate to XWHEP platform.
A simple mail to “xtremweb /a|t lal.in2p3.fr” is sufficient to decline participation.This article describes deployment over LAL PCs. XtremWeb-HEP is a global computing platform developed by LAL to harness new computing power. This platform is in the grid family, aggregating volunteer individual computers to create a new powerful computing facility.
XtremWeb-HEP is based on XtremWeb, developed by LRI.
A volunteer community
The platform is constructed over a set of heterogeneous volunteer personal computer running Linux, Windows or Mac OS X.
These aggregated computers are not dedicated to our platform; they remain their owner property and are only used by our platform without disturbing normal owner usage. These conditions are the activation policy which is entirely customizable. For example, they may be used when the CPU is idle, when the screensaver is running, or accordingly to a scheduler, at night for instance. The platform automatically frees PCs as soon as the activation rules are not validated. The running job, if any, is stopped, the CPU is freed, as well as the RAM and disk.
A new service
L’intérêt de construire une telle plate-forme réside dans l’utilisation de la puissance potentielle que représentent les ordinateurs individuels disséminés au sein du laboratoire. Notre plate-forme permet de gérer cette puissance potentielle et de la mettre au service de tous sans la détourner de sa destination première : rester à l’entière disposition de leur propriétaire respectif.
Du point de vue de l’utilisateur, ce nouveau service peut être vu comme un nouveau cluster de calcul. Les utilisateurs ont à leur disposition un service client permettant de soumettre des tâches de calcul, de surveiller leur évolution et de récupérer les résultats obtenus. Ce service client est un service « nomade » qui peut être installé sur n’importe quel ordinateur, même portable, et exécuté de n’importe où pour peu qu’il soit connecté à l’Internet. On peut très bien soumettre des tâches du bureau, sur une machine, puis les surveiller depuis une machine personnelle, à la maison ou en déplacement, et même en récupérer les résultats intermédiaires, et plus tard, les résultats finaux. Les tâches et leurs résultats sont gardés par la plate-forme tant que l’utilisateur ne les efface pas explicitement. On comprend malgré tout qu’une politique doit être mise en place afin d’éviter l’engorgement ; le serveur XtremWeb ne peut (et ne doit pas) être considéré comme un espace de stockage. Les résultats ne sont donc gardés qu’une semaine ; après quoi, ils sont automatiquement effacés. Notons que l’espace disque de notre serveur XtremWeb n’est pas pris en charge par le service de backup du laboratoire ; en cas de problème disque, tout sera perdu.
Du point de vue de l’administrateur, ce service est un service de virtualisation des ressources de calcul. Les ressources utilisées sont des ordinateurs individuels dont le taux de panne est une donnée inhérente. Une ressource peut arrêter un calcul sans autre forme de procès (le propriétaire est revenu, il a bougé sa souris et a donc interrompu le calcul en cours). Une tâche interrompue est automatiquement redémarrée (depuis le début) dès qu’une autre ressource de calcul est disponible.