June 2019 statistics

🕒 4 month(s) ago

Bonjour,

Conformément à nos mentions légales, nous ne stockons pas les données de nos visiteurs pendant plus de 6 mois et nous nous autorisons à les consulter uniquement à des fins statistiques ou de maintenance technique.

Le site ayant été mis en ligne vers fin janvier (deux mois avant son ouverture officielle), nous estimons qu'il s'agit donc du moment idéal pour générer quelques statistiques sur notre plateforme.

Nous utilisons le logiciel libre GoAccess pour analyser les journaux hors-ligne aprÚs les avoir téléchargés depuis le serveur.

Site web

Nous commencerons par les statistiques sur notre site principal (42l.fr) ; nos journaux sont séparés par services.

Depuis la mise en ligne du site le 28 janvier 2019 jusqu'au 12 juin 2019, nous avons reçu 123 309 requĂȘtes envoyĂ©s par 14 597 visiteurs uniques.

Cela représente 3.44 Go de bande passante et 21.78 Mo de logs.

Voici un graphique reprĂ©sentant le nombre de visites (bleu) avec le nombre de visiteurs uniques (rouge). Notez que les deux courbes ne sont pas Ă  la mĂȘme Ă©chelle.

Nombre de visiteurs

Graphique visiteurs

Du 28 janvier au 6 mars, le site étant en construction, l'activité est principalement due à des robots.

Voilà à quoi correspondent chacun des pics d'activité sur ce graphique :

  • 7 mars : Publication de l'annonce de l'ouverture de notre site web sur Mastodon !
  • 10 mai : Ouverture des adhĂ©sions et du service mail
  • 11 mai : Mise en place du proxy DoH
  • 16 mai : Mise en place du raccourcisseur de liens
  • 23 mai : Article sur la mise en place des deux services ci-dessus
  • 25 mai : On tient un premier stand Ă  l'Ă©cole 42 !
  • 8 juin : Mise en place du service SchĂ©mas

Il est trĂšs encourageant de remarquer une augmentation progressive de la courbe rouge (visiteurs uniques) sur le long terme.

Navigateurs utilisés

Voici cette fois un graphique en barres présentant les navigateurs utilisés pour parcourir notre site web :

Graphique navigateurs

Ces données sont intriguantes : les utilisateurs de Chrome (versions 58, 38 et 47) sont les plus nombreux, mais ceux de Firefox (versions 66.0, 45.0 et 68.0) visitent beaucoup plus de pages (12 % de plus).

Cela voudrait dire que les utilisateurs de Firefox sont plus intéressés par le contenu sur notre site web que ceux de Chrome ?

SystÚmes d'exploitation utilisés

Graphique OS

Le systÚme d'exploitation le plus utilisé reste Windows (versions 7, 10 et... XP ?!!?!) suivi par GNU/Linux.

Nous avons quand mĂȘme un public particuliĂšrement Linuxien, il semblerait... :)

Codes HTTP

Nous renvoyons principalement (51 % des visites) des redirections (301), notamment pour rediriger les utilisateurs de 42l.fr Ă  42l.fr/Accueil, par exemple.

À part ça, 6 % des visites aboutissent sur un code 4xx (erreur client), dont une majoritĂ© (3 %) de codes 400, indiquant que le client a mal formĂ© sa requĂȘte. Il s'agit de requĂȘtes bizarrement formĂ©es par des bots qui cherchent des vulnĂ©rabilitĂ©s sur notre infrastructure.

Enfin, sur ces 6 mois, nous relĂšverons 0.43 % de codes 5xx (erreur serveur), dont une majoritĂ© (0.36%) de codes 503 dĂ»es Ă  un trop grand nombre de requĂȘtes envoyĂ©es par un seul client : il s'agit d'une mesure de protection.

Donc on peut dire que ça tourne bien pour le moment :)

Service DoH

Enfin, il nous semblait pertinent de publier des statistiques sur l'un de nos services libres les mieux accueillis : notre proxy DNS-over-HTTPS, que nous appelons "Service DoH".

Ce service permet de transmettre toutes les requĂȘtes DNS de nos utilisateurs vers les rĂ©solveurs DNS de FDN, un fournisseur d'accĂšs Ă  Internet associatif neutre.

Donc, pour chaque requĂȘte DNS de chaque utilisateur, nous recevons une requĂȘte HTTP... Et avec ces fichus sysadmins qui se disent que c'est une bonne idĂ©e de dĂ©finir le TTL de leur enregistrement DNS Ă  0, les requĂȘtes ne sont pas cachĂ©es dans le navigateur de nos utilisateurs... Ce qui gĂ©nĂšre beaucoup de trafic inutile.

Nous n'enregistrons pas le contenu des requĂȘtes, mais les mĂ©tadonnĂ©es de ces requĂȘtes (principalement le User-Agent) peuvent rĂ©vĂ©ler quelques informations.

En retirant les crawlers, instances Mastodon et autres bots de nos logs, nous avons un total de 1 060 955 requĂȘtes du 11 mai 2019 au 12 juin 2019 par seulement 530 visiteurs uniques, ce qui a gĂ©nĂ©rĂ© 169.37 Mo de logs et seulement 130.16 Mo de bande passante (le contenu des requĂȘtes est toujours trĂšs lĂ©ger).

Parmi ces 530 visiteurs uniques, nous avons environ 20 utilisateurs constants pour le moment.

Il est intéressant de remarquer que la quasi-totalité de ces 530 utilisateurs utilisent Firefox. C'est normal : Chrome ne propose pas la fonctionnalité DoH ;)

Enfin, nous rĂ©pondons un code d'erreur 503 pour 0.17 % des requĂȘtes que nous recevons, essentiellement lorsqu'un visiteur envoie beaucoup trop de requĂȘtes Ă  la seconde, ce qui arrive assez rarement.

Pour respecter la vie privée de nos utilisateurs, nous ne publierons pas plus de statistiques sur ce service.

Remarques

Il est facile de faire fausse route en Ă©tudiant les journaux : un serveur web est sollicitĂ© en permanence par de nombreux bots Ă  partir du moment oĂč il est connectĂ© Ă  Internet.

Les instances Mastodon ne facilitent vraiment pas l'analyse : lorsqu'un toot est postĂ© avec une adresse vers notre site web, des centaines d'instances nous envoient une requĂȘte chacune. C'est un peu comme une attaque par dĂ©ni de service distribuĂ©e... Donc ça fausse nos statistiques et il faut le prendre en compte lors de notre Ă©valuation.

La publication réguliÚre de statistiques s'ancre dans une démarche de transparence et fait aussi partie des critÚres demandés dans la charte CHATONS.

~ N&B