J’ai un ami chinois, un activiste comme ils disent là bas, qui a un petit blog. C’est un petit blog chinois comme il en existe des millions. En causant avec lui de Zope, un serveur d’application en Python et de Plone (le système de gestion de contenu communément utilisé avec Zope), il m’avait confié qu’il était passé à Django, au fil de la discussion, j’ai réalisé que son « petit blog » accueillait entre 50 et 80 000 visiteurs uniques par jours… c’est comme ça un petit blog chinois.
Aujourd’hui, à la lecture de ça, je suis un peu sur les fesses. France.fr, le portail sensé représenter la France dans le monde ne serait pas foutu d’accueillir 70% du trafic du blog de mon ami chinois… c’est dingue non ? Et comme le dit mon ami chinois avec sa sagesse toute confucéenne, « quand Apache se vautre, c’est qu’il est temps de passer à Nginx et quand Nginx se vautre, c’est qu’il est temps de relire ton code« . Nous en France, on est plus pragmatiques : un conseiller auprès du directeur du SIG déclarait sur France Info : “Un problème de configuration de serveurs, aggravé par une surprenante affluence dès 9h00, environ 50 000 visiteurs un jour férié.”
Ce que je ne vous ai pas dit, c’est que mon copain chinois, il a un petit serveur dédié, c’est un Pentium 4 avec 3Go de ram, ce qui représente là bas un investissement assez important d’environ 150 euros par ans, son uptime a dépassé les 700 jours. Nous pour France.fr, le budget du sites est de 1,6 millions d’euros, pour un uptime de… 3 heures ?
Le plus drôle c’est quand même l’excuse du jour férié… Leurs serveurs ne bossent pas le 14 juillet ? Les gens ne vont pas sur Internet habituellement ce jour ?
Mouai. Le site c'est planté lamentablement mais le proverbe chinois n'est pas hyper pertinent non plus.
J'ai du mal à imaginer que le passage de Apache à Nginx puisse changer quelque chose pour un site dynamique. Les consommateurs de ressource ici sont le langage de script et la base de données, à des années lumières devant le serveur HTTP, qui lui ne consomme rien du tout.
Concernant les 50 000 visiteurs / jour, c'est rien du tout. En assumant que tous les visiteurs arrivent sur un interval de 10 heures, ça fait 5 000 visiteurs par heure. Et en assumant qu'ils visitent chacun 10 pages (ce qui fait déjà une estimation très haute), ça fait 50 000 requêtes "lourdes", hors fichiers statiques, par heure, soit 14 requêtes par seconde. Le premier serveur virtuel venu est capable de soutenir une telle "charge".
14 requêtes par seconde !
Pour France.fr, c'était pas 50 000 visiteurs _simultanés_, plutôt ? 🙂
On ne dit pas "en assumant" mais "en supposant".
Sinon, il y a aussi des gens qui font des mathématiques formelles.
Et des gens qui font d’horribles anglicismes.
C’est les scripts qui bouffe certe, mais justement quand on a des sites de cette ampleurs, bin on s’arrange pour avoir des caches, et dans ces cas, le serveur HTTP deviens plus important que le langage de script. Surtout que là on est vraiment dans le cadre d’un contenu quasi-statique (Pas de système de commentaire par exemple).
Alors donc oui effectivement ici, pour s’effondrer comme ça, le problème était surement que php s’en prenez plein la gueule et réinterpréter tout… Mais c’est justement un défaut de configuration de Drupal et une mauvais utilisation…
Je serais pas étonné qu’ils tournent sous Windows Server. Le gouvernement à une tendance à préférer Microsoft et IIS.
Pas forcement vrai, cette critique..
Non non, c’est bien un Apache ^^
Là actuellement il est hébergé chez vert2all.net (le domaine a ses DNS chez integra.fr, site qui semble avoir des .htaccess en carton qui redirigent pas comme il faut)
Sinon oui comment dire… ils auraient pu prendre des conseils à Korben (d’ailleurs c’est un peu à cause de Korben qu’il y a eu une telle ruée, vu qu’il en avait fait un billet)
…sans oublier que c'est une ferme de 10 serveurs qui est tombée (je n'arrive malheureusement pas à remettre la main sur ma source)
Ça fait plusieurs fois qu'on me dit ça, si c'est vrai c'est juste énorme 😀
SI tu retrouves la source n'hésites pas à nous l'indiquer.
Ca devais être un tweet… mais j'en ai trouvée une autre, très intéressante même si les chiffres donnés par ce genre de médias sont à considérer avec beaucoup de précautions :
"[…]le nombre de serveurs du site est en train d’être doublé (de 11 on devrait passer à 22)"
France Info http://bit.ly/duzWnV et Libération http://bit.ly/9vw7UF
cool, très drôle, sinon les chinois ont de bons matos (même s'ils sont made in china) 🙂
Impressionnant, avec un P4 il arrive a faire tourner un tel site ?
C'est possible d'avoir le lien vers site de ton ami s'il te plait ?
Malheureusement non, du moins pas publiquement.
Ok, pas grave.
J'ai pensé tout pareil, affligeant vu le budget.
J'avais espéré que ça soit du asp + IIS pour troler un peu mais je viens de voir que c'est drupal qui aurait été retenu. Vu le budget, je m'attendais à un dev spécial tout compris, pas un CMS que même moi j'aurai pu installer et configurer sans souci ….
Je crois que le pire, c'est que 3 jours plus tard, les "techniciens" n'ont toujours pas trouvé de solution pour faire fonctionner le site, même au ralenti…
Drupal est avec Plone, à mon sens le seul CMS pro digne de ce nom, on en hoste pas mal, dont des très gros et on ne rencontre pas ce genre de problème. En revanche ce qui est vrai, c'est qu'une fois internationalisé, la DB est un peu moisie, d'où l'importance d'une pré-prod et un test de montée en charge.
Un uptime de 700 jours, ca veut dire aucun trous de secu kernel bouches. Pas top… A moins de faire tourner ksplice / uptrack, mais c'est trop nouveau, il y a 700 jours ca existait pas.
Qui a dit que c'était un GNU/Linux ?
ben un windows n'est pas capable de rester allumer aussi longtemps
OpenBSD et NetBSD ça te dit quelque chose ? 🙂
Quel est le pays qui trouve le moins de plaisir en mangeant du foin en cas de guerre?
le nombre de visiteurs peut atteindre 80 000 visits/jour ?!! Wow ça fait rever
Bah en même temps, ça sent l'amateurisme à plein nez ce site. Le site existe en double sur deux serveurs (www.france.fr et france.fr ne renvoient pas sur le même serveur) mais les deux semblent plantés.
Donc visiblement, on ne sait pas configurer un DNS chez ces gens la. On ne sait pas non plus faire un test de montée en charge. C'est pourtant la base de la base avant une mise en prod' .
Et alors, le plus feune, c'est qu'après s'être planté lamentablement, les techos semblent partit se faire bronzer à saint trop' .
ET si c'était pas un problème de serveurs mais plutôt une faille à combler dans le site internet !
Rappelez-vous qu'un internaute à publier une capture de l'écran d'administration du site http://www.france.fr et donc ils ne veulent peut-être pas laisser cette fuite dans la nature.
Un hack de ce site serait pas le bienvenue !
C'est une possibilité effectivement, mais je n'ai pas eu vent de ce screenshot, tu as une source ? c'est pas un fake ?
Enfin même un trou, ça se corrige pas en une semaine. Après si le site était pluggué à un autre système d'information, il y a peut être d'autres choses qui ont été compromises.
Je pense que l'analyse de Korben est bonne : http://www.korben.info/et-on-passe-encore-pour-de…
Ca sent bien la gestion de projet qui panique, je cite :
"Hmmm ça sent la grosse galère chez les admins de France.fr. Ou plutôt ça sent la société de presta qui s’embourbe et le chef de projet france.fr qui dans la panique stoppe tout et demande un audit à un autre prestataire pour remettre le bousin en marche. (j’imagine…)"
J'ai souris en lisant ça. Cette histoire de savoir configurer un serveur m'a toujours fait rire. D'un côté ceux qui ont le financement mais pas les compétences font tourner des bêtes de courses mal configurées et en cas de pic ça plante. De l'autre ceux qui n'ont pas une thune et qui font tourner des sites énormes en faisant des optimisations de malade avec du matos au rabais.
1,6 million le Drupal, je pense qu'on est proche du record du monde.
Seulement proche…. Car rien ne surpassera un Skyblog à 2 Millions d'euros…… http://www.korben.info/waka.html http://www.pcinpact.com/actu/news/57107-waka-comm…
Et celui là, il est dans le "Guiness book" pour des décennies ! 😀
Bon, quand c'est avec l'argent public, rien n'est assez cher !
Je me demande si avec Hapodi ça va fonctionner comme ça? S'ils ne sont pas foutus de gérer un serveur alors un DPI… Ça me fait rire et au même temps ça me préoccupe…
Le DPI ça se passe au niveau des FAI, pas de la HADOPI (du moins pas encore), ensuite oui, il y a de quoi avoir peur, car leur mettre ça ou BGP dans les mains, c'est un truc à se faire retirer le .fr par l'icann
Mouais, sur notre "petit" site e-commerce, qui tourne tranquillou, le matin des soldes on a entre 25 et 35 000 connexions dans les 5 min qui suivent l'ouverture. Ben ça tient. Même les jours fériés. Incroyable, non ?
🙂 Ben voilà vous aviez un router et un serveur non syndiqué, du coup même un jour férié, il achemine les paquets
c'est clair, moi femelle habituée des sites de ventes privées, le matin à 07.01, où il y a apparemment plus de 100.000 connexions simultanées et ca va marche toujourd impec…
mais je connais aussi pour une banque qui n'est pas foutue de patcher son serveur apache pour faire tourner leur nouvelle appli sur IE depuis plus 3 semaines, donc plus rien ne m'étonne…. :p
Ça devient lourd de passer pour les boulets du monde dans la plupart des domaines ><
quand on voit les brouzoufs qui partent dans des projets comme france.fr, HADOPI ou waka je sais pas quoi, on ne peut que constater qu'il y a vraiment quelque chose de pourri au royaume France…
En parlant de Waka, c'est normal que sur la page skyrock /waka (destinée aux jeunes / payé par nos impôts) il y ai des liens vers un jeu de poker ?? http://www.skyrock.com/waka/
dans le menu PLUS
étrange … depuis que le poker est labellisé, il devient acceptable sur ce type de site !
Je m'occupe d'un projet qui s'appel CCants ( anciennement TVants ), j'ecris des versions cross-platform et open-source. Parfois j'ai 15 000 visiteurs simultanes et le serveur fonctionne tres bien meme si il est en Chine. Le seul probleme c'est que le traffic est pourri en dehors de chine, la j'ai un peu de mal sans vpn sur le site de bluetouff mais par rapport a france.fr c'est certain que le fait qu'il soit en ligne soit du a leur incompetence dans tous les domaines.
/Cali
le site de ton ami lui a coûté moins de 3 centimes d'€ de l'heure, quant nous le site france.fr a coûté environ 533333€ de l'heure au contribuable et après il vienne nous dire qu'il faut faire des économies!!!
tu prends un site comme http://www.siteduzero.com
il font plusieurs millions de visiteur par jours (entre 5et 7 si je me souviens bien mais les stats sont publique)
et ils ont que 3 serveurs qui coute pas des millions ……
en plus il est super rapide
Qu'est-ce qu'il faut pas entendre comme conneries !
5 millions de visiteurs par jours… -_- http://www.siteduzero.com/publicite-440.html
Les stats sont ici et elles sont loin de ça :
# 14 000 000 pages vues mensuelles
# 2 000 000 visiteurs uniques mensuels
# Une communauté de 195 000 membres actifs