8 Mars 2018 / Objets, Champs, Images

La répartition des images en termes de répertoires dans iRods présente une difficulté : le nombre important d’images pour certains programmes et champs.

Dans cette étude, je ne considère que les images « t » et « r« , c’est-à-dire les images complètes réduites.

Nombre total d’images :2.014.920
Nombre d’images « t » et « r » :1.974.701
Autres images:40.219


Le nombre de champs par programme est raisonnable. Le plus conséquent est le programme « nr », pour Naines rouges, qui compte un peu plus de 500 champs (514). Le second plus important en termes de champs est « cg« , Centre galactique, qui compte 141 champs. Les autres sont à moins de 100 champs.

Consacrer un répertoire iRods par champ ne constitue donc pas un obstacle.

Le point délicat réside dans le nombre important d’images dans certains champs (en ignorant les programmes techniques (flats) ou trop particuliers) :

CodeProgrammesMinimumMaximum
ajAmas jeunes216944
bsBeta Scuti5.9056.513
cgCentre galactique16021.389
cpLMC-SMC Cepheides1.7902.697
gbGamma bursts15167
gnGamma Normae147410.685
gsGamma Scuti5.8946421
lmLarge Magellanic Cloud4.63310.779
nrNaines rouges8580
quQuasars16200
smSmall Magellanic Cloud15018.277
snSupernova16200
tmTheta Muscaelenses1.7978.657
vlVoie Lactee1616
xtTrous noirs285285

Pourquoi est-ce préoccupant ? D’abord parce que les systèmes de fichiers n’aiment pas trop les répertoires avec des milliers d’entrées. Ensuite parce que l’utilisateur qui explore les répertoires soit directement avec la commande ils, soit via un système graphique, risque d’être noyé sous les sorties.

On peut envisager 4 approches :

  1. Séparer les images par caméra. Cela réduira déjà par deux le nombre d’images par répertoire.
  2. Séparer les images par années et mois.
  3. Séparer arbitrairement les images par lot. Par exemple 500 ou 1000 images par répertoire.
  4. Ne rien faire, en laissant toutes les images d’un même champ ensemble, et faire confiance à iRods…

Le principal désavantage d’un tri des images est que cela va pénaliser les petits programmes

D’un autre côté, si on envisage des organisations différentiées, selon le nombre d’images, on risque d’aboutir à une organisation peu compréhensible.

Du point de vue de la logique, le tri par années semble le plus naturel. Il reste cependant encore 300 champs à plus de 1.000 images, et 20 à plus de 2.000. Le plus préoccupant est le Centre galactique qui a trois champs à plus de 3.000 images, dont 2, le 002 de l’année 2000 à 7.000 images.

Et même en sous-classant par mois, il reste 3 cas sérieux : TM Février 2003 Caméra 1 : 2.876 ; CG Juillet 2000, les deux caméras : > 4.000

Reste donc la répartition bloquée…

Ce contenu a été publié dans Non classé. Vous pouvez le mettre en favoris avec ce permalien.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *