Comme nous l’avons vu dans une précédente chronique consacrée aux serveurs d’application JEE, les solutions Open Source concurrencent désormais les solutions propriétaires sur leurs propres terrains.
En se basant sur une série d’études menée dans les domaines les plus représentatifs de l’informatique d’entreprise, Clever Age propose un décryptage des principales tendances du marché, des retours d’expériences significatifs, une présentation d’architectures types, ainsi qu’une sélection de critères permettant de se poser les bonnes questions au moment de choisir une solution.
Le deuxième volet de cette série est consacré aux solutions de gestion de contenus (CMS), le troisième sera consacré aux portails d’intégration.
Le marché des CMS [1] est en continuel mouvement. Depuis le début des années 2000, les fusions et les rachats se succèdent, laissant place à de nouveaux acteurs (éditeurs locaux ou solutions Open Source) qui prennent pied, peu à peu, dans la cour des grands.
On peut classer les outils de gestion de contenu selon quatre axes principaux :
Jusqu’au milieu des années 2000, le marché des CMS Open Source était l’apanage presque exclusif des solutions PHP, qui ont profité de la démocratisation de l’accès à internet et aux hébergeurs supportant cette technologie. Il s’agissait principalement de solutions de type "gestion de site Web" permettant de réaliser et d’administrer simplement des sites Web à fort contenu éditorial. Depuis quelques années, on assiste à l’émergence de solutions Java plus orientées "gestion d’infrastructure Web" et donc ciblant davantage les sites d’entreprises à fort trafic.
Sur le marché français, les solutions qui sortent du lot aujourd’hui sont :
Refonte du portail du gouvernement avec Spip-Agora
Le Service d’Information du Gouvernement (SIG) a lancé en 2004 un chantier de refonte du site Internet du Premier Ministre sur la base du logiciel libre Spip. C’est une version améliorée, baptisée Spip-Agora, qui a été conçue et réalisée pour les besoins du projet.
Depuis son lancement en 2004, le site a connu une fréquentation en hausse continue. Le site sert en moyenne de l’ordre de deux millions de pages par mois, avec un pic à 143 170 visites le 1er juin 2005 (nomination du gouvernement). Afin de répondre à cette forte demande, le SIG a choisi de s’appuyer sur des caches Akamaï placés devant trois serveurs frontaux de faible puissance (monoprocesseurs à 800 MHz), mais qui garantissent une tolérance aux pannes. La contribution est quant à elle assurée par un serveur dédié permettant à une soixantaine de journalistes de saisir leurs articles dans le Back Office.
Notons enfin que le portail du gouvernement est certifié WAI et AccessiWeb (accessibilité pour les personnes présentant un handicap) et qu’il a reçu le Clic d’Or 2005 dans la catégorie "Site institutionnel".
| Spip ou Spip-Agora ? Le projet Spip-Agora est issu des évolutions techniques et fonctionnelles majeures apportées à Spip (version 1.4) dans le cadre de la refonte du site du Premier Ministre. Ces évolutions ne pouvant être intégrées dans la branche principale de Spip pour des raisons de calendrier, il a été décidé de créer une branche parallèle, le temps que Spip puisse les intégrer. Aujourd’hui, dans sa version 1.9, Spip a largement rattrapé son retard sur Spip-Agora (hormis une ou deux fonctionnalités), et bénéficie surtout du dynamisme de sa communauté. Le projet Spip-Agora étant pratiquement arrivé à son terme, il est recommandé de partir directement sur Spip. |
Une grande mutuelle choisit eZ Publish pour la refonte de son site internet
Un client de Clever Age, actif dans le domaine des assurances, a souhaité remplacer l’outil de publication utilisé jusqu’alors (Lotus Notes), afin de permettre à un maximum de contributeurs de participer à l’animation du site, en parallèle d’une refonte globale du site Internet. A la suite d’une étude mettant en concurrence Spip, Drupal et eZ Publish, c’est ce dernier qui a été retenu, à la fois pour sa richesse fonctionnelle et sa facilité de prise en main.
Au final, le site est capable de servir 5 à 6 pages par seconde en pleine charge. Pour ce faire, un seul serveur (Bi-processeur Intel DualCore, 5 GO de RAM) héberge à la fois le serveur Web (Apache 2) et la base de données (MySQL 5). En plus du cache intégré à eZ Publish, un mécanisme de cache bas niveau PHP (XCache) a été mis en place afin de réduire les temps de chargement des pages.
Lotus Notes étant toujours utilisé abondamment pour d’autres besoins de ce client, il est prévu prochainement de mettre en place des connecteurs entre Notes et eZ Publish, à base d’export XML des contenus.
Architecture de type "Gestion de contenu Web"
Dans cette architecture, une base de contenus unique est partagée entre le Back Office (où se fait la contribution des contenus) et le Front Office (où se fait la restitution des contenus, à savoir le site Internet ou Intranet à proprement parler).
Les éventuels contenus extérieurs au site sont agrégés directement dans la base de contenus, au moyen de mécanismes d’import / export, de flux RSS, etc.
La plupart des CMS PHP sont bâtis selon cette architecture. Il est toutefois possible de la scinder en deux (une base pour la contribution, une autre pour la restitution), à condition de mettre en œuvre un mécanisme de synchronisation entre les bases. C’est par exemple ce qui a été fait pour le site France Télécom Entreprises (Oléane), réalisé avec Spip.
Architecture de type "Gestion d’infrastructure Web" Cette architecture repose sur un découplage fort entre le Back Office (qui sert à la contribution des contenus) et le Front Office (qui sert à la restitution). Un mécanisme de publication permet de publier tout ou partie d’un site (contenus, pièces jointes, gabarits de restitution, etc.) de l’un vers l’autre.
Cette architecture, plus contraignante que la précédente (le processus de mise à jour est plus lourd), a l’avantage de limiter les risques de piratage d’un site public, puisqu’il est possible d’isoler le serveur de contribution.
Comme pour tout choix de solution, le choix d’un CMS doit prendre en compte les aspects fonctionnels, techniques et économiques. Nous nous intéressons ici avant tout aux fonctionnalités (les aspects techniques et économiques étant plus ou moins communs à l’ensemble des familles de solutions). Les outils de gestion de contenu peuvent être étudiés selon huit axes principaux :
[1] Système de Gestion de Contenus, également appelé Content Management System.
[2] Le module WCM d’Alfresco est sorti en janvier 2007
Je tire mon chapeau à ces experts ayant effectuer cette etude, qui permettra surement à nombre d’ingenieur de mieux comprendre et connaitre les outils qu’ils utilisent couramment.
http://sirydata.blogspot.com/
France24 est passé à Drupal.
http://buytaert.net/france24-using-drupal
Denis
Je m’apercois que les outils CMS font désormais tout et n’importe quoi. Pour moi un CMS (système de gestion de contenu) doit gérer uniquement des contenus (de différents types) et leur workfow. Pourtant la plupart des "CMS" actuels intégrent la notion de VUE MVC afin de gérer aussi la partie affichage du front office. C’est délirant. En effet la plupart des sites pro ont une charte spécifique à leur identité et n’ont pas besoin qu’on leur propose de changer leur charte graphique. Je cherche donc un vrai CMS capable de s’interfacer avec les tables de ma base de données et de gérér uniquement l’insertion et la mise a jour/validation de types de contenus. Pouvez vous me conseiller ? Je sais que TypoLight s’approche de ces choix.
mister_ebene@yahoo.fr
"Je m’apercois que les outils CMS font désormais tout et n’importe quoi. Pour moi un CMS (système de gestion de contenu) doit gérer uniquement des contenus (de différents types) et leur workfow."
le reste est en effet superflus et souvent lié à la satisfaction de fantasme de "geek" et non de besoins de "end-users".