This thesis focuses on flexibility in distributed IT infrastructure for administrators and users. From users point of view, they need on-demand resources fitting their application needs. For administrators, they set policies for resource allocation (policies for resource usage and safety) in order to meet the user application needs. We studied the issue of flexibility in the context of grids and clouds. First, we designed and implemented the Saline system. Saline is based on virtualization technology for the execution of besteffort jobs in grids. We also proposed the Grillade system which combines flexibility mechanisms provided by grids and clouds. This allow, firstly, to dynamically extend a grid with virtual resources provided by a cloud and secondly, to build IaaS clouds by federating resources provided by multiple sites. Grillade extends the XtreemOS grid system. It also allows to use single system image technology to provide to users virtual machines run on an aggregation of nodes. Finally, we propose a formalism to classify the resource management systems and to provide flexibility to define rules for combining them. Tropicbird system, based on this formalism, implements on-demand virtual platforms specified by users on the physical infrastructure. ; Cette thèse s'intéresse à la flexibilité dans les infrastructures informatiques distribuées du point de vue de leurs administrateurs et utilisateurs. Pour les utilisateurs, il s'agit de trouver au moment où ils en ont besoin des ressources matérielles adaptées avec un environnement personnalisé à l'exécution de leur application. Pour les administrateurs, il s'agit de définir les politiques d'allocation des ressources (politiques d'usage et de sécurité) pour les applications des utilisateurs. Nous avons étudié la problématique de la flexibilité dans le contexte des grilles et des centrales numériques (CN). Tout d'abord, nous avons conçu et mis en oeuvre le système Saline qui s'appuie sur la virtualisation pour permettre l'exécution de tout type de tâche en ...
This thesis focuses on flexibility in distributed IT infrastructure for administrators and users. From users point of view, they need on-demand resources fitting their application needs. For administrators, they set policies for resource allocation (policies for resource usage and safety) in order to meet the user application needs. We studied the issue of flexibility in the context of grids and clouds. First, we designed and implemented the Saline system. Saline is based on virtualization technology for the execution of besteffort jobs in grids. We also proposed the Grillade system which combines flexibility mechanisms provided by grids and clouds. This allow, firstly, to dynamically extend a grid with virtual resources provided by a cloud and secondly, to build IaaS clouds by federating resources provided by multiple sites. Grillade extends the XtreemOS grid system. It also allows to use single system image technology to provide to users virtual machines run on an aggregation of nodes. Finally, we propose a formalism to classify the resource management systems and to provide flexibility to define rules for combining them. Tropicbird system, based on this formalism, implements on-demand virtual platforms specified by users on the physical infrastructure. ; Cette thèse s'intéresse à la flexibilité dans les infrastructures informatiques distribuées du point de vue de leurs administrateurs et utilisateurs. Pour les utilisateurs, il s'agit de trouver au moment où ils en ont besoin des ressources matérielles adaptées avec un environnement personnalisé à l'exécution de leur application. Pour les administrateurs, il s'agit de définir les politiques d'allocation des ressources (politiques d'usage et de sécurité) pour les applications des utilisateurs. Nous avons étudié la problématique de la flexibilité dans le contexte des grilles et des centrales numériques (CN). Tout d'abord, nous avons conçu et mis en oeuvre le système Saline qui s'appuie sur la virtualisation pour permettre l'exécution de tout type de tâche en mode préemptif dans les grilles. Nous avons également proposé le système Grillade qui combine les mécanismes de flexibilité offerts par les grilles et les CN pour d'une part, étendre dynamiquement une grille avec des ressources virtuelles fournies par des CN et d'autre part, construire des nuages de type IaaS fédérant les ressources de plusieurs sites. Grillade étend le système de grille XtreemOS. Il permet en outre grâce à la technologie de système à image unique de proposer aux utilisateurs des machines virtuelles exécutées sur une agrégation de nœuds. Enfin, nous proposons un formalisme permettant de classer les systèmes de gestion de ressources offrant de la flexibilité et de définir des règles pour les combiner. Le système Tropicbird qui s'appuie sur ce formalisme met en œuvre, à la demande, des plates-formes virtuelles spécifiées par les utilisateurs sur une infrastructure matérielle.
This thesis focuses on flexibility in distributed IT infrastructure for administrators and users. From users point of view, they need on-demand resources fitting their application needs. For administrators, they set policies for resource allocation (policies for resource usage and safety) in order to meet the user application needs. We studied the issue of flexibility in the context of grids and clouds. First, we designed and implemented the Saline system. Saline is based on virtualization technology for the execution of besteffort jobs in grids. We also proposed the Grillade system which combines flexibility mechanisms provided by grids and clouds. This allow, firstly, to dynamically extend a grid with virtual resources provided by a cloud and secondly, to build IaaS clouds by federating resources provided by multiple sites. Grillade extends the XtreemOS grid system. It also allows to use single system image technology to provide to users virtual machines run on an aggregation of nodes. Finally, we propose a formalism to classify the resource management systems and to provide flexibility to define rules for combining them. Tropicbird system, based on this formalism, implements on-demand virtual platforms specified by users on the physical infrastructure. ; Cette thèse s'intéresse à la flexibilité dans les infrastructures informatiques distribuées du point de vue de leurs administrateurs et utilisateurs. Pour les utilisateurs, il s'agit de trouver au moment où ils en ont besoin des ressources matérielles adaptées avec un environnement personnalisé à l'exécution de leur application. Pour les administrateurs, il s'agit de définir les politiques d'allocation des ressources (politiques d'usage et de sécurité) pour les applications des utilisateurs. Nous avons étudié la problématique de la flexibilité dans le contexte des grilles et des centrales numériques (CN). Tout d'abord, nous avons conçu et mis en oeuvre le système Saline qui s'appuie sur la virtualisation pour permettre l'exécution de tout type de tâche en mode préemptif dans les grilles. Nous avons également proposé le système Grillade qui combine les mécanismes de flexibilité offerts par les grilles et les CN pour d'une part, étendre dynamiquement une grille avec des ressources virtuelles fournies par des CN et d'autre part, construire des nuages de type IaaS fédérant les ressources de plusieurs sites. Grillade étend le système de grille XtreemOS. Il permet en outre grâce à la technologie de système à image unique de proposer aux utilisateurs des machines virtuelles exécutées sur une agrégation de nœuds. Enfin, nous proposons un formalisme permettant de classer les systèmes de gestion de ressources offrant de la flexibilité et de définir des règles pour les combiner. Le système Tropicbird qui s'appuie sur ce formalisme met en œuvre, à la demande, des plates-formes virtuelles spécifiées par les utilisateurs sur une infrastructure matérielle.
Président Daniel Herman IRISA/Université de Rennes 1-Rennes Rapporteurs Isabelle Demeure GET/ENST-Paris Hervé Guyennet LIFL/Université de Franche Comté-Besançon Examinateurs Françoise André IRISA/Université de Rennes 1-Rennes Bertil Folliot LIP6/Université Pierre et Marie Curie-Paris Maria-Teresa Segarra GET/ENST Bretagne-Brest ; Mobile computing is a domain in great expansion. Wireless networks (GSM, satellite, etc) and Portable Information Appliances PIAs (laptops, PDAs, cellular phones, etc) are developing very rapidly. These environments present particular features: (i) due to size and weight limitations, a PIA is resources-limited, (ii) wireless networks have a low bandwidth suffering of variations and disconnections and (iii) due to the mobility, environment of a PIA always change such as when stations/resources/peripherics appear or disappear. Goal of this thesis is to propose generic method for the use of external resources by distribution techniques. So, we propose an adaptive distribution system for applications in a mobile context. We have built a generic architecture with framework and toolkit. Framework is composed of functionalities commonly used for mobile environment management. Toolkit is made up of implementations used to specialize functionalities . In our framework, we have particularly developed two functionalities. Dynamic adaptation and reaction functionality specifies an auto-adaptive entity model where designers can dynamically specialize (i) possible adaptations of the entity and (ii) an adaptation strategy, describing the behavior to adopt in case of variation of execution conditions. Resources management and applications distribution functionality specifies mobile environment features and applications needs by a resource/offers - entity/demands model. Five services are developed to implement this functionality: (i) the environment management service, (ii) the local environment management service, (iii) the detection and notification service, (iv) the distribution service and (v) the adaptations control service. These ones are made up of adaptive policies, based on entity model, which can be dynamically specialized by designers. A prototype, AeDEn, has been developed and tested with many experiments which proved that distribution in mobile environments saves resources of PIA and improve performances of applications. ; L'informatique mobile est un domaine en plein essor qui profite des percées technologiques dans le domaine des ordinateurs portables et dans le domaine des réseaux de communication sans-fil. Ces environnements mobiles présentent des particularités : (i) dû à des limitations de taille et de poids, un terminal portable offre peu de ressources et celles-ci sont susceptibles de varier, (ii) les réseaux sans fil offrent une bande passante plus faible, sujette à des variations importantes et de fréquentes déconnexions dues aux interférences avec l'environnement, et (iii) l'environnement d'un terminal portable change suite à ses déplacements, avec l'accès, ou la disparition de l'accès, à un certain nombre de stations (mobiles ou non) et de périphériques (imprimantes, scanner, etc). L'objectif de cette thèse est de proposer une méthode qui généralise l'utilisation des ressources extérieures à un terminal portable au moyen de techniques de distribution prenant en compte ces critères de la mobilité. Nous proposons donc un système adaptatif de distribution des applications en environnements mobiles. Pour cela, nous avons construit une architecture générique se décomposant en un cadre de conception et une boîte à outils. Le cadre de conception comporte des fonctionnalités couramment utilisées pour la gestion des environnements mobile. La boîte à outils comporte des implantations permettant aux concepteurs d'applications de spécialiser les fonctionnalités avec un comportement défini. Dans ce cadre, nous avons plus précisément développé deux fonctionnalités. La fonctionnalité d'adaptation et de réaction dynamique définit, en particulier, un modèle d'entité auto-adaptative, dans laquelle les concepteurs peuvent dynamiquement spécialiser (i) les adaptations possibles de l'entité et (ii) la stratégie d'adaptation, correspondant aux changements de comportement à adopter en cas de variations dans les conditions d'exécution. La fonctionnalité de gestion des ressources et de distribution des applications caractérise les particularités de l'environnement mobile et les besoins des applications au sein d'un modèle d'utilisation de type offres / demandes. Cinq services mettent en oeuvre cette fonctionnalité : (i) le service de gestion de l'environnement, (ii) le service de gestion de l'environnement local, (iii) le service de détection et notification, (iv) le service de distribution et (v) le service de contrôle de la propagation des adaptations. Ceux-ci comportent des politiques adaptatives, basées sur le modèle de l'entité, qui peuvent être dynamiquement spécialisées par les concepteurs. Un prototype, AeDEn, a été développé et plusieurs expériences ont confirmé que la distribution en environnement mobile permet d'économiser les ressources des terminaux portables et d'améliorer les performances des applications.
Président Daniel Herman IRISA/Université de Rennes 1-Rennes Rapporteurs Isabelle Demeure GET/ENST-Paris Hervé Guyennet LIFL/Université de Franche Comté-Besançon Examinateurs Françoise André IRISA/Université de Rennes 1-Rennes Bertil Folliot LIP6/Université Pierre et Marie Curie-Paris Maria-Teresa Segarra GET/ENST Bretagne-Brest ; Mobile computing is a domain in great expansion. Wireless networks (GSM, satellite, etc) and Portable Information Appliances PIAs (laptops, PDAs, cellular phones, etc) are developing very rapidly. These environments present particular features: (i) due to size and weight limitations, a PIA is resources-limited, (ii) wireless networks have a low bandwidth suffering of variations and disconnections and (iii) due to the mobility, environment of a PIA always change such as when stations/resources/peripherics appear or disappear. Goal of this thesis is to propose generic method for the use of external resources by distribution techniques. So, we propose an adaptive distribution system for applications in a mobile context. We have built a generic architecture with framework and toolkit. Framework is composed of functionalities commonly used for mobile environment management. Toolkit is made up of implementations used to specialize functionalities . In our framework, we have particularly developed two functionalities. Dynamic adaptation and reaction functionality specifies an auto-adaptive entity model where designers can dynamically specialize (i) possible adaptations of the entity and (ii) an adaptation strategy, describing the behavior to adopt in case of variation of execution conditions. Resources management and applications distribution functionality specifies mobile environment features and applications needs by a resource/offers - entity/demands model. Five services are developed to implement this functionality: (i) the environment management service, (ii) the local environment management service, (iii) the detection and notification service, (iv) the distribution service and (v) the ...
Président Daniel Herman IRISA/Université de Rennes 1-Rennes Rapporteurs Isabelle Demeure GET/ENST-Paris Hervé Guyennet LIFL/Université de Franche Comté-Besançon Examinateurs Françoise André IRISA/Université de Rennes 1-Rennes Bertil Folliot LIP6/Université Pierre et Marie Curie-Paris Maria-Teresa Segarra GET/ENST Bretagne-Brest ; Mobile computing is a domain in great expansion. Wireless networks (GSM, satellite, etc) and Portable Information Appliances PIAs (laptops, PDAs, cellular phones, etc) are developing very rapidly. These environments present particular features: (i) due to size and weight limitations, a PIA is resources-limited, (ii) wireless networks have a low bandwidth suffering of variations and disconnections and (iii) due to the mobility, environment of a PIA always change such as when stations/resources/peripherics appear or disappear. Goal of this thesis is to propose generic method for the use of external resources by distribution techniques. So, we propose an adaptive distribution system for applications in a mobile context. We have built a generic architecture with framework and toolkit. Framework is composed of functionalities commonly used for mobile environment management. Toolkit is made up of implementations used to specialize functionalities . In our framework, we have particularly developed two functionalities. Dynamic adaptation and reaction functionality specifies an auto-adaptive entity model where designers can dynamically specialize (i) possible adaptations of the entity and (ii) an adaptation strategy, describing the behavior to adopt in case of variation of execution conditions. Resources management and applications distribution functionality specifies mobile environment features and applications needs by a resource/offers - entity/demands model. Five services are developed to implement this functionality: (i) the environment management service, (ii) the local environment management service, (iii) the detection and notification service, (iv) the distribution service and (v) the adaptations control service. These ones are made up of adaptive policies, based on entity model, which can be dynamically specialized by designers. A prototype, AeDEn, has been developed and tested with many experiments which proved that distribution in mobile environments saves resources of PIA and improve performances of applications. ; L'informatique mobile est un domaine en plein essor qui profite des percées technologiques dans le domaine des ordinateurs portables et dans le domaine des réseaux de communication sans-fil. Ces environnements mobiles présentent des particularités : (i) dû à des limitations de taille et de poids, un terminal portable offre peu de ressources et celles-ci sont susceptibles de varier, (ii) les réseaux sans fil offrent une bande passante plus faible, sujette à des variations importantes et de fréquentes déconnexions dues aux interférences avec l'environnement, et (iii) l'environnement d'un terminal portable change suite à ses déplacements, avec l'accès, ou la disparition de l'accès, à un certain nombre de stations (mobiles ou non) et de périphériques (imprimantes, scanner, etc). L'objectif de cette thèse est de proposer une méthode qui généralise l'utilisation des ressources extérieures à un terminal portable au moyen de techniques de distribution prenant en compte ces critères de la mobilité. Nous proposons donc un système adaptatif de distribution des applications en environnements mobiles. Pour cela, nous avons construit une architecture générique se décomposant en un cadre de conception et une boîte à outils. Le cadre de conception comporte des fonctionnalités couramment utilisées pour la gestion des environnements mobile. La boîte à outils comporte des implantations permettant aux concepteurs d'applications de spécialiser les fonctionnalités avec un comportement défini. Dans ce cadre, nous avons plus précisément développé deux fonctionnalités. La fonctionnalité d'adaptation et de réaction dynamique définit, en particulier, un modèle d'entité auto-adaptative, dans laquelle les concepteurs peuvent dynamiquement spécialiser (i) les adaptations possibles de l'entité et (ii) la stratégie d'adaptation, correspondant aux changements de comportement à adopter en cas de variations dans les conditions d'exécution. La fonctionnalité de gestion des ressources et de distribution des applications caractérise les particularités de l'environnement mobile et les besoins des applications au sein d'un modèle d'utilisation de type offres / demandes. Cinq services mettent en oeuvre cette fonctionnalité : (i) le service de gestion de l'environnement, (ii) le service de gestion de l'environnement local, (iii) le service de détection et notification, (iv) le service de distribution et (v) le service de contrôle de la propagation des adaptations. Ceux-ci comportent des politiques adaptatives, basées sur le modèle de l'entité, qui peuvent être dynamiquement spécialisées par les concepteurs. Un prototype, AeDEn, a été développé et plusieurs expériences ont confirmé que la distribution en environnement mobile permet d'économiser les ressources des terminaux portables et d'améliorer les performances des applications.
The implementation of a grid network to support large-scale epidemiology analysis (based on distributed medical data sources) and medical data sharing require medical data integration and semantic alignment. In this thesis, we present the GINSENG (Global Initiative for Sentinel eHealth Network on Grid) network that federates existing Electronic Health Records through a rich metamodel (FedEHR), a semantic data model (SemEHR) and distributed query toolkits. A query interface based on the VIP platform, and available through the e-ginseng.com web portal helps medical end-users in the design of epidemiological studies and the retrieval of relevant medical data sets. ; À ce jour, les mesures de risque des cancers ou d'efficacité de leur suivi, se font à partir de recueils de données médicales spécifiques initiés par les médecins épidémiologistes. Ces recueils disposent néanmoins de certaines limites : perte d'information, biais de déclaration, absence de données pour un risque non connu, biais de mesure (par exemple pour les données de nature médico-économiques). Le partage sécurisé de données médicales entre différentes structures médicales publiques et/ou privées est à ce jour en pleine mutation technologique. Les technologies proposées doivent rendre possible un partage électronique et sécurisé de ces données de manière à les rendre disponible à tout instant dans le cadre de l'observation sanitaire à l'évaluation de prises en charge ou de politiques de santé. Pour répondre à ces besoins, l'infrastructure GINSENG se base sur des informations produites dans le cadre des soins, sans nouvelles modalités de recueil, permettant à la fois une vitesse d'accès à l'information et une exhaustivité accrue. Ce recueil se fait par ailleurs avec de meilleures garanties d'anonymat et un chaînage de l'information médicale pour chaque patient. Une autorisation de la CNIL a été octroyée à l'infrastructure informatique du projet ainsi qu'à son utilisation pour le suivi des cancers en octobre 2013. Depuis le portail web e-ginseng.com, les médecins habilités s'authentifient grâce à leur Carte de Professionnel de Santé (CPS). Chaque patient, dont les données médicales sont réparties dans les établissements de santé, est identifié avec son accord, par les attributs suivants : nom, prénom, année et mois de naissance ainsi que son code postal de résidence avant d'être assigné à un numéro d'identification unique et anonyme. La mise à jour des données médicales de chaque patient est réalisée une fois par semaine ; chaque médecin peut alors consulter toutes les informations médicales relatives à chaque patient par une simple connexion au réseau. Ces informations lui apparaissent sous forme d'une arborescence d'évènements médicaux. Par exemple, un médecin chargé du suivi des patients dans le cadre du dépistage organisé pourra accéder directement depuis le portail web aux informations médicales dont il aura besoin pour établir une fiche médicale exhaustive du parcours du patient pour lequel un cancer aurait été détecté ou bien une suspicion de cancer qui se serait avérée négative suite à plusieurs examens médicaux. Un médecin épidémiologiste peut également réaliser des requêtes statistiques d'envergure sur les données médicales afin de répondre à des questions d'intérêt en santé publique. Pour aller plus loin, les requêtes épidémiologiques lancées sur les données médicales peuvent être couplées à des informations d'utilité publique recueillies sur d'autres bases de données en accès libre sur internet. L'infrastructure informatique GINSENG est actuellement déployée pour le suivi des cancers en région Auvergne entre les structures de gestion du dépistage organisé du cancer (SGDO) et le cabinet d'anatomie et cytologie pathologiques (ACP) Sipath-Unilabs. Le recours à un hébergeur de données de santé (HADS), nommé Informatique de sécurité (IDS), est également proposé pour le stockage des informations confidentielles des patients. Cette infrastructure permet actuellement de collecter toutes les informations médicales d'intérêt pour le suivi des cancers et l'évaluation des pratiques médicales. Les équipes de bio-statistiques et de santé publique du CHU de Clermont-Ferrand établissent actuellement les analyses épidémiologiques d'intérêt à partir des données collectées par le réseau.
The implementation of a grid network to support large-scale epidemiology analysis (based on distributed medical data sources) and medical data sharing require medical data integration and semantic alignment. In this thesis, we present the GINSENG (Global Initiative for Sentinel eHealth Network on Grid) network that federates existing Electronic Health Records through a rich metamodel (FedEHR), a semantic data model (SemEHR) and distributed query toolkits. A query interface based on the VIP platform, and available through the e-ginseng.com web portal helps medical end-users in the design of epidemiological studies and the retrieval of relevant medical data sets. ; À ce jour, les mesures de risque des cancers ou d'efficacité de leur suivi, se font à partir de recueils de données médicales spécifiques initiés par les médecins épidémiologistes. Ces recueils disposent néanmoins de certaines limites : perte d'information, biais de déclaration, absence de données pour un risque non connu, biais de mesure (par exemple pour les données de nature médico-économiques). Le partage sécurisé de données médicales entre différentes structures médicales publiques et/ou privées est à ce jour en pleine mutation technologique. Les technologies proposées doivent rendre possible un partage électronique et sécurisé de ces données de manière à les rendre disponible à tout instant dans le cadre de l'observation sanitaire à l'évaluation de prises en charge ou de politiques de santé. Pour répondre à ces besoins, l'infrastructure GINSENG se base sur des informations produites dans le cadre des soins, sans nouvelles modalités de recueil, permettant à la fois une vitesse d'accès à l'information et une exhaustivité accrue. Ce recueil se fait par ailleurs avec de meilleures garanties d'anonymat et un chaînage de l'information médicale pour chaque patient. Une autorisation de la CNIL a été octroyée à l'infrastructure informatique du projet ainsi qu'à son utilisation pour le suivi des cancers en octobre 2013. Depuis le portail web e-ginseng.com, les médecins habilités s'authentifient grâce à leur Carte de Professionnel de Santé (CPS). Chaque patient, dont les données médicales sont réparties dans les établissements de santé, est identifié avec son accord, par les attributs suivants : nom, prénom, année et mois de naissance ainsi que son code postal de résidence avant d'être assigné à un numéro d'identification unique et anonyme. La mise à jour des données médicales de chaque patient est réalisée une fois par semaine ; chaque médecin peut alors consulter toutes les informations médicales relatives à chaque patient par une simple connexion au réseau. Ces informations lui apparaissent sous forme d'une arborescence d'évènements médicaux. Par exemple, un médecin chargé du suivi des patients dans le cadre du dépistage organisé pourra accéder directement depuis le portail web aux informations médicales dont il aura besoin pour établir une fiche médicale exhaustive du parcours du patient pour lequel un cancer aurait été détecté ou bien une suspicion de cancer qui se serait avérée négative suite à plusieurs examens médicaux. Un médecin épidémiologiste peut également réaliser des requêtes statistiques d'envergure sur les données médicales afin de répondre à des questions d'intérêt en santé publique. Pour aller plus loin, les requêtes épidémiologiques lancées sur les données médicales peuvent être couplées à des informations d'utilité publique recueillies sur d'autres bases de données en accès libre sur internet. L'infrastructure informatique GINSENG est actuellement déployée pour le suivi des cancers en région Auvergne entre les structures de gestion du dépistage organisé du cancer (SGDO) et le cabinet d'anatomie et cytologie pathologiques (ACP) Sipath-Unilabs. Le recours à un hébergeur de données de santé (HADS), nommé Informatique de sécurité (IDS), est également proposé pour le stockage des informations confidentielles des patients. Cette infrastructure permet actuellement de collecter toutes les informations médicales d'intérêt pour le suivi des cancers et l'évaluation des pratiques médicales. Les équipes de bio-statistiques et de santé publique du CHU de Clermont-Ferrand établissent actuellement les analyses épidémiologiques d'intérêt à partir des données collectées par le réseau.
The implementation of a grid network to support large-scale epidemiology analysis (based on distributed medical data sources) and medical data sharing require medical data integration and semantic alignment. In this thesis, we present the GINSENG (Global Initiative for Sentinel eHealth Network on Grid) network that federates existing Electronic Health Records through a rich metamodel (FedEHR), a semantic data model (SemEHR) and distributed query toolkits. A query interface based on the VIP platform, and available through the e-ginseng.com web portal helps medical end-users in the design of epidemiological studies and the retrieval of relevant medical data sets. ; À ce jour, les mesures de risque des cancers ou d'efficacité de leur suivi, se font à partir de recueils de données médicales spécifiques initiés par les médecins épidémiologistes. Ces recueils disposent néanmoins de certaines limites : perte d'information, biais de déclaration, absence de données pour un risque non connu, biais de mesure (par exemple pour les données de nature médico-économiques). Le partage sécurisé de données médicales entre différentes structures médicales publiques et/ou privées est à ce jour en pleine mutation technologique. Les technologies proposées doivent rendre possible un partage électronique et sécurisé de ces données de manière à les rendre disponible à tout instant dans le cadre de l'observation sanitaire à l'évaluation de prises en charge ou de politiques de santé. Pour répondre à ces besoins, l'infrastructure GINSENG se base sur des informations produites dans le cadre des soins, sans nouvelles modalités de recueil, permettant à la fois une vitesse d'accès à l'information et une exhaustivité accrue. Ce recueil se fait par ailleurs avec de meilleures garanties d'anonymat et un chaînage de l'information médicale pour chaque patient. Une autorisation de la CNIL a été octroyée à l'infrastructure informatique du projet ainsi qu'à son utilisation pour le suivi des cancers en octobre 2013. Depuis le portail web e-ginseng.com, ...
Generally, Operating Systems control and execute applications based on a best effort policy. As long as resources are sufficient, applications are normally executed but when resources become scarce, control mechanisms (graceful degradation) are necessary to maintain acceptable QoS. This thesis aims to manage the QoS of distributed applications. The first part of the thesis proposes a fully decentralized middleware to control the use of resources of distributed applications. This approach is based on a resource borrowing schema and an approximate scheduling in order to improve the overall QoS provided by the system. Using this borrowing schema, each node locally constructs a comprehensive view of resources availability in the system. The local knowledge of resources availability makes it possible for each node to make decisions and to schedule the execution of the applications. To finely control execution, the second part of the thesis adds a support for behavior adaptation of applications. The middleware interprets a general model of applications as an execution graph enriched with resources requirements. Each application must be designed according to this model to be manageable by the middleware (intrusive approach). A path in the graph is a possible execution of application with a certain utility. These paths provide degrees of freedom needed by the middleware to adapt resource consumption to the context. During the QoS management process, applications cooperate with the middleware at admission and execution phase. The middleware guides and controls the execution of applications actions (edges in the execution graph). To validate our approach, a prototype based on agents has been implemented using JADE. The results show the interest of our approach. ; Les systèmes d'exploitation utilisent très généralement une politique de « meilleur effort » (Best-effort) pour exécuter les applications. Tant que les ressources sont suffisantes, les applications s'exécutent normalement mais quand les ressources deviennent insuffisantes, des mécanismes de contrôle sont nécessaires pour continuer à obtenir des services de qualité acceptable. Cette thèse a pour objectif de gérer la QoS des applications distribuées. La première partie propose un middleware totalement décentralisé pour contrôler l'utilisation des ressources des applications distribuées. Cette approche se fonde sur une planification approximative et un schéma d'emprunt de ressources afin d'améliorer la QoS globale du système. Via ce schéma d'emprunt, chaque nœud construit localement une vue détaillée de la disponibilité des ressources dans le système. La présence da la connaissance de la disponibilité des ressources en local permet à chaque nœud de prendre localement des décisions et de planifier les tâches des applications. Pour un contrôle plus fin de l'exécution, la deuxième partie ajoute un support pour l'adaptation du comportement des applications. Le middleware utilise un modèle général des applications sous forme de graphe d'exécution décoré avec les besoins en ressources. Un chemin dans le graphe est une exécution possible de l'application avec une certaine utilité, et ce sont ces chemins qui fournissent les degrés de liberté dont le middleware a besoin pour adapter la consommation des ressources au contexte. Les applications coopèrent avec le middleware dans le processus de gestion de la QoS lors de l'admission puis durant toute l'exécution. Le middleware est le chef d'orchestre et c'est lui qui pilote et c'est lui qui pilote l'exécution des actions des applications (arcs dans le graphe) Pour valider notre approche, un prototype à base d'agents a été réalisé. Les résultats démontrent l'intérêt de notre approche.
Generally, Operating Systems control and execute applications based on a best effort policy. As long as resources are sufficient, applications are normally executed but when resources become scarce, control mechanisms (graceful degradation) are necessary to maintain acceptable QoS. This thesis aims to manage the QoS of distributed applications. The first part of the thesis proposes a fully decentralized middleware to control the use of resources of distributed applications. This approach is based on a resource borrowing schema and an approximate scheduling in order to improve the overall QoS provided by the system. Using this borrowing schema, each node locally constructs a comprehensive view of resources availability in the system. The local knowledge of resources availability makes it possible for each node to make decisions and to schedule the execution of the applications. To finely control execution, the second part of the thesis adds a support for behavior adaptation of applications. The middleware interprets a general model of applications as an execution graph enriched with resources requirements. Each application must be designed according to this model to be manageable by the middleware (intrusive approach). A path in the graph is a possible execution of application with a certain utility. These paths provide degrees of freedom needed by the middleware to adapt resource consumption to the context. During the QoS management process, applications cooperate with the middleware at admission and execution phase. The middleware guides and controls the execution of applications actions (edges in the execution graph). To validate our approach, a prototype based on agents has been implemented using JADE. The results show the interest of our approach. ; Les systèmes d'exploitation utilisent très généralement une politique de « meilleur effort » (Best-effort) pour exécuter les applications. Tant que les ressources sont suffisantes, les applications s'exécutent normalement mais quand les ressources deviennent insuffisantes, des mécanismes de contrôle sont nécessaires pour continuer à obtenir des services de qualité acceptable. Cette thèse a pour objectif de gérer la QoS des applications distribuées. La première partie propose un middleware totalement décentralisé pour contrôler l'utilisation des ressources des applications distribuées. Cette approche se fonde sur une planification approximative et un schéma d'emprunt de ressources afin d'améliorer la QoS globale du système. Via ce schéma d'emprunt, chaque nœud construit localement une vue détaillée de la disponibilité des ressources dans le système. La présence da la connaissance de la disponibilité des ressources en local permet à chaque nœud de prendre localement des décisions et de planifier les tâches des applications. Pour un contrôle plus fin de l'exécution, la deuxième partie ajoute un support pour l'adaptation du comportement des applications. Le middleware utilise un modèle général des applications sous forme de graphe d'exécution décoré avec les besoins en ressources. Un chemin dans le graphe est une exécution possible de l'application avec une certaine utilité, et ce sont ces chemins qui fournissent les degrés de liberté dont le middleware a besoin pour adapter la consommation des ressources au contexte. Les applications coopèrent avec le middleware dans le processus de gestion de la QoS lors de l'admission puis durant toute l'exécution. Le middleware est le chef d'orchestre et c'est lui qui pilote et c'est lui qui pilote l'exécution des actions des applications (arcs dans le graphe) Pour valider notre approche, un prototype à base d'agents a été réalisé. Les résultats démontrent l'intérêt de notre approche.
Generally, Operating Systems control and execute applications based on a best effort policy. As long as resources are sufficient, applications are normally executed but when resources become scarce, control mechanisms (graceful degradation) are necessary to maintain acceptable QoS. This thesis aims to manage the QoS of distributed applications. The first part of the thesis proposes a fully decentralized middleware to control the use of resources of distributed applications. This approach is based on a resource borrowing schema and an approximate scheduling in order to improve the overall QoS provided by the system. Using this borrowing schema, each node locally constructs a comprehensive view of resources availability in the system. The local knowledge of resources availability makes it possible for each node to make decisions and to schedule the execution of the applications. To finely control execution, the second part of the thesis adds a support for behavior adaptation of applications. The middleware interprets a general model of applications as an execution graph enriched with resources requirements. Each application must be designed according to this model to be manageable by the middleware (intrusive approach). A path in the graph is a possible execution of application with a certain utility. These paths provide degrees of freedom needed by the middleware to adapt resource consumption to the context. During the QoS management process, applications cooperate with the middleware at admission and execution phase. The middleware guides and controls the execution of applications actions (edges in the execution graph). To validate our approach, a prototype based on agents has been implemented using JADE. The results show the interest of our approach. ; Les systèmes d'exploitation utilisent très généralement une politique de « meilleur effort » (Best-effort) pour exécuter les applications. Tant que les ressources sont suffisantes, les applications s'exécutent normalement mais quand les ressources deviennent ...
Virtual Screening (VS) is a computational technique used in the drug discovery process to select the most promising candidate drugs for in vitro testing from millions of chemical compounds. This method can offer an efficient alternative to reduce the cost of drug discovery and platform. The Natural Products Chemistry Institute of the Academy of Sciences of Vietnam (INPC) collects samples from local biodiversity and determines the 3D structure of single molecules. Their challenge is to set up a virtual screening platform on grid computing for their chemists to process their data. However, as the number of users who might have a wide range of virtual screening applications (in terms of the number of tasks and execution time) increases with limited available computing resources, it becomes crucial to devise an effective scheduling policy that can ensure a certain degree of fairness, user satisfaction and overall system throughput. In this context, the thesis focuses on an effective scheduling policy for the virtual screening workflow where multiple users with varying numbers of tasks are actively sharing a common system infrastructure. We have researched in theory and proposed some candidate policies. With the simulation results and the experimentation results in real system, we proposed the best policy for the fairness between users, which can be applied to INPC virtual screening platform. ; L'Institut National des Produits Chimiques de l'Académie des Sciences du Vietnam (INPC) développe depuis plusieurs années une activité autour de la recherche de nouveaux médicaments issus de la biodiversité. Le développement d'un nouveau médicament prend de l'ordre d'une dizaine d'années et passe par plusieurs phases. Dans la phase de découverte, l'activité des composés chimiques sur une cible biologique est mesurée afin de mettre en évidence une action inhibitrice. Le développement d'approches in silico pour le criblage virtuel des composés chimiques est une alternative aux approches classiques in vitro beaucoup plus coûteuses à mettre en œuvre. L'utilisation de la grille a été identifiée comme une voie économiquement prometteuse pour accompagner la recherche de nouveaux médicaments au Vietnam. En effet, le développement de nouvelles stratégies basées sur l'utilisation de plates-formes de soumission de tâches (DIRAC, HTCaaS) a permis d'améliorer considérablement le taux de succès et le confort des utilisateurs, ouvrant la voie à une démocratisation de la grille.Dans ce contexte, l'objectif poursuivi dans le cadre de cette thèse est d'étudier dans quelle mesure des plates-formes multidisciplinaires pouvaient répondre aux besoins des chimistes de l'INPC. Le travail s'est concentré sur les modalités d'un partage équitable d'une plate-forme de soumission de tâches sur la grille par une ou plusieurs communautés d'utilisateurs. L'ordonnancement des tâches sur un serveur commun doit permettre que les différents groupes aient une expérience positive et comparable. Sur les infrastructures de grille EGEE et EGI en Europe , on peut distinguer deux grandes catégories d'utilisateurs : les utilisateurs « normaux » qui vont solliciter les ressources pour des tâches requérant typiquement de quelques dizaines à quelques centaines d'heures de calcul, et les « gros » utilisateurs qui vont lancer des grandes productions nécessitant le traitement de plusieurs milliers de tâches pendant des dizaines, voire des centaines de milliers d'heures de calcul. Les stratégies d'ordonnancement déployées aujourd'hui sur les plates-formes comme DIRAC ou HTCaaS ne permettent pas de servir de façon optimale et simultanée ces deux familles d'utilisateurs.Le manuscrit présente une évaluation par simulation des performances de plusieurs stratégies d'ordonnancement des tâches d'une plate-forme soumettant des jobs pilotes. L'outil SimGrid a permis de simuler l'infrastructure de grille régionale déployée en Auvergne à partir de traces archivées de son utilisation. Après évaluation des performances de plusieurs politiques d'ordonnancement tirées de la littérature, une nouvelle politique a été proposée dans laquelle les utilisateurs normaux et les très gros utilisateurs sont gérés de façon indépendante. Grâce à cette politique, le ralentissement expérimenté par les très gros utilisateurs est réduit significativement sans pénaliser excessivement les utilisateurs normaux. L'étude a été étendue à une fédération de clouds utilisant les mêmes ressources et arrive aux mêmes conclusions. Les performances des politiques d'ordonnancement ont ensuite été évaluées sur des environnements de production, à savoir l'infrastructure de grille européenne EGI et l'infrastructure nationale de supercalculateurs de la Corée du Sud. Un serveur DIRAC a été adossé aux ressources de l'organisation virtuelle biomédicale d'EGI pour étudier les ralentissements observés par les utilisateurs de ce serveur. Pareillement, les ralentissements expérimentés par les utilisateurs de la plate-forme HTCaaS au KISTI ont été observés en excellent accord avec les résultats de simulation avec SimGrid.Ces travaux confirment la faisabilité et l'intérêt d'une plate-forme unique au Vietnam au service des communautés scientifiques consommatrices des ressources académiques de grille et de cloud, notamment pour la recherche de nouveaux médicaments.
Virtual Screening (VS) is a computational technique used in the drug discovery process to select the most promising candidate drugs for in vitro testing from millions of chemical compounds. This method can offer an efficient alternative to reduce the cost of drug discovery and platform. The Natural Products Chemistry Institute of the Academy of Sciences of Vietnam (INPC) collects samples from local biodiversity and determines the 3D structure of single molecules. Their challenge is to set up a virtual screening platform on grid computing for their chemists to process their data. However, as the number of users who might have a wide range of virtual screening applications (in terms of the number of tasks and execution time) increases with limited available computing resources, it becomes crucial to devise an effective scheduling policy that can ensure a certain degree of fairness, user satisfaction and overall system throughput. In this context, the thesis focuses on an effective scheduling policy for the virtual screening workflow where multiple users with varying numbers of tasks are actively sharing a common system infrastructure. We have researched in theory and proposed some candidate policies. With the simulation results and the experimentation results in real system, we proposed the best policy for the fairness between users, which can be applied to INPC virtual screening platform. ; L'Institut National des Produits Chimiques de l'Académie des Sciences du Vietnam (INPC) développe depuis plusieurs années une activité autour de la recherche de nouveaux médicaments issus de la biodiversité. Le développement d'un nouveau médicament prend de l'ordre d'une dizaine d'années et passe par plusieurs phases. Dans la phase de découverte, l'activité des composés chimiques sur une cible biologique est mesurée afin de mettre en évidence une action inhibitrice. Le développement d'approches in silico pour le criblage virtuel des composés chimiques est une alternative aux approches classiques in vitro beaucoup plus coûteuses à mettre en œuvre. L'utilisation de la grille a été identifiée comme une voie économiquement prometteuse pour accompagner la recherche de nouveaux médicaments au Vietnam. En effet, le développement de nouvelles stratégies basées sur l'utilisation de plates-formes de soumission de tâches (DIRAC, HTCaaS) a permis d'améliorer considérablement le taux de succès et le confort des utilisateurs, ouvrant la voie à une démocratisation de la grille.Dans ce contexte, l'objectif poursuivi dans le cadre de cette thèse est d'étudier dans quelle mesure des plates-formes multidisciplinaires pouvaient répondre aux besoins des chimistes de l'INPC. Le travail s'est concentré sur les modalités d'un partage équitable d'une plate-forme de soumission de tâches sur la grille par une ou plusieurs communautés d'utilisateurs. L'ordonnancement des tâches sur un serveur commun doit permettre que les différents groupes aient une expérience positive et comparable. Sur les infrastructures de grille EGEE et EGI en Europe , on peut distinguer deux grandes catégories d'utilisateurs : les utilisateurs « normaux » qui vont solliciter les ressources pour des tâches requérant typiquement de quelques dizaines à quelques centaines d'heures de calcul, et les « gros » utilisateurs qui vont lancer des grandes productions nécessitant le traitement de plusieurs milliers de tâches pendant des dizaines, voire des centaines de milliers d'heures de calcul. Les stratégies d'ordonnancement déployées aujourd'hui sur les plates-formes comme DIRAC ou HTCaaS ne permettent pas de servir de façon optimale et simultanée ces deux familles d'utilisateurs.Le manuscrit présente une évaluation par simulation des performances de plusieurs stratégies d'ordonnancement des tâches d'une plate-forme soumettant des jobs pilotes. L'outil SimGrid a permis de simuler l'infrastructure de grille régionale déployée en Auvergne à partir de traces archivées de son utilisation. Après évaluation des performances de plusieurs politiques d'ordonnancement tirées de la littérature, une nouvelle politique a été proposée dans laquelle les utilisateurs normaux et les très gros utilisateurs sont gérés de façon indépendante. Grâce à cette politique, le ralentissement expérimenté par les très gros utilisateurs est réduit significativement sans pénaliser excessivement les utilisateurs normaux. L'étude a été étendue à une fédération de clouds utilisant les mêmes ressources et arrive aux mêmes conclusions. Les performances des politiques d'ordonnancement ont ensuite été évaluées sur des environnements de production, à savoir l'infrastructure de grille européenne EGI et l'infrastructure nationale de supercalculateurs de la Corée du Sud. Un serveur DIRAC a été adossé aux ressources de l'organisation virtuelle biomédicale d'EGI pour étudier les ralentissements observés par les utilisateurs de ce serveur. Pareillement, les ralentissements expérimentés par les utilisateurs de la plate-forme HTCaaS au KISTI ont été observés en excellent accord avec les résultats de simulation avec SimGrid.Ces travaux confirment la faisabilité et l'intérêt d'une plate-forme unique au Vietnam au service des communautés scientifiques consommatrices des ressources académiques de grille et de cloud, notamment pour la recherche de nouveaux médicaments.
Résumé L'article s'efforce de préciser ce que peut être « l'émergence ». En prenant des exemples dans les sciences naturelles et physiques comme dans les sciences humaines, il s'efforce de démontrer qu'il y a plusieurs formes « d'émergence » et que très souvent, la notion « d'émergence », est utilisée à tort pour désigner un effet ou une construction dont on n'a pu comprendre, par le détail, la procédure d'élaboration. L'utilisation de la méthode spécifique de la « systémique des relations » appliquée à une situation de management et débouchant soi-disant sur une « émergence », permet de montrer la proximité d'une telle formalisation des échanges avec la conceptualisation des systèmes multi-agents des informaticiens. Si l'analyse d'un système interactionnel humain est bien faite, elle peut donc déboucher sur la mise en place d'une simulation par un système de simulation informatique. Ce rapprochement d'analyses disciplinaires éloignées signe le succès des formalisations utilisées et ouvre des pistes intéressantes de recherche. La déconstruction minutieuse d'un cas concret lié à une situation sociale d'échange amène à préciser ce que l'on pourrait appeler « émergence liée à une interaction » en sciences humaines. Mais, l'analyse faite amène aussi à montrer que la notion classique « d'interaction » est inadaptée pour comprendre en profondeur les mécanismes des émergences. L'article propose alors une redéfinition du concept « d'interaction » qui intègre mieux la complexité en tenant compte des phénomènes idéels et cognitifs.