Catàleg EDR3 de Gaia disponible per descarregar en un format de compressió més eficient

El grup Gaia de la Universitat de Barcelona (IEECICCUB), en col·laboració amb DAPCOM Data Services (una empresa tecnològica spin-off  de la UPC i la UB), ha publicat una còpia alternativa dels fitxers de dades amb el catàleg complert del Gaia EDR3 – la publicació anticipada del tercer catàleg de Gaia.

El Gaia EDR3 es va publicar ahir, 3 de Desembre de 2020. A més del catàleg on-line, es va posar a disposició de la comunitat una versió en fitxers CSV per a descàrrega – una opció interessant per a anàlisis exhaustius. Oficialment, aquests fitxers s’ofereixen en format “csv.gz“, és a dir, comprimits amb el conegut compressor gzip.

DAPCOM proporciona FAPEC, un programari professional de compressió de dades que ofereix altes relacions de compressió amb una gran rapidesa d’execució. Una de les opcions incloses és la compressió de fitxers de text tabulats (tipus CSV), com els del catàleg Gaia EDR3. Com a servei a la comunitat astronòmica internacional, i també com a mostra de les capacitats de FAPEC, DAPCOM i el Grup Gaia IEEC/ICCUB han convertit tots els fitxers CSV de la taula GaiaSource del Gaia EDR3 al format FAPEC, reduint-ne la mida total de 613 GB a 495 GB – és a dir, un 19% menys que amb gzip. Altres compressors de dades com bzip2, rar, Zstandard o 7-zip no arriben a aquestes xifres.

Podeu descarregar el Gaia EDR3 en format csv.fapec aquí:

Descàrrega del Gaia EDR3 en csv.fapec

Durant els propers dies, també es convertiran i publicaran la resta de les taules disponibles al catàleg Gaia EDR3.

Podeu obtenir llicències gratuïtes de descompressió FAPEC a la pàgina web de DAPCOM. DAPCOM està preparant una nova versió de FAPEC, la qual inclourà un descompressor descarregable gratuïtament, així com suport per al seu ús a Python.

¡Que ho disfruteu!