Open source e ricerca: il caso di GaiaOpen source and research: the case of GAIA

Traduzione e adattamento in inglese di un post già apparso sul sito

How important is the open-source software as part of the scientific research nowadays? Since I am an astronomical researcher, a lover and a user of open-source software, I’m very interested in trying to deepen this topic.

Well, an opportunity to talk about it now comes from the observation of software tools that are utilized in a big project to which I am also taking part, that is the definition of procedures for processing and analyzing the photometric data that will be generated by the ESA (European Space Agency) probe called GAIA (curiously, one of the first articles appeared on my italian blog was just about GAIA, in 2002). The probe will be launched in 2013, but the work for the definition of the appropriate procedures is already running at full capacity.

An artistic image of GAIA (Credit: ESA/Medialab)

In my opinion, even a simple, brief list of software tools used by the different teams of Gaia – coordinated through a European network of scientific institutes – would probably be enough to understand that the open-source software is doing great or – to put it in a more technical way – that it now can count on its own defined space essential for applications and fields, at least in scientific research.

To proof this, I’ve written down a list (incomplete) of the open source software currently used in the development of the Gaia data reduction procedures, made by simply thinking about the tools that are used, by me or my colleagues, for the daily work within the project itself…

So, this is the catalog:

  • Java: is the language of analysis software and data reduction. Following a decision of ESA, all procedures need to be written in Java. This involves a series of remarkable benefits in terms of independence from the hardware, portability, modularity, etc. … too long to be fully explained here.
  • Eclipse: is the highly recommended development environment  (which is to say, do what you like, but you don’t expect support with other environments…)
  • SVN: all the code is put under revision control, using subversion
  • MediaWiki: there is a wiki with restricted access, very large, in which is shown all the project documentation, the meetings and seminars for the various teams, the documentation. Briefly, a sort of mini thematic Wikipedia, devoted to people working on the project.
  • Hudson: a tool to automatically test the codes, at scheduled intervals, and submit reports on webpage
  • Cobertura: this tool is able to calculate the percentage of the code accessible to the test procedures
  • Mantis: is the chosen tool for controlling and managing bugs in the project
  • Grace: a useful tool to create graphics
  • Topcat: an interactive browser of tables and data editor
  • ant: a useful compilation tool in Java
  • Plastic (Platform for Astronomical Tool Interconnection) is a protocol of communication among different tools utilized mainly in astronomy (now is going replaced by SAMP)
  • And probably there’s something more that I cannot recall right now… 🙂

 The interesting thing is that all this software is released under the GPL (General Public License) or similar, which makes it much easier to spread and use the software itself: there is no need to obtain proprietary and restrictive licenses (or to make our own institutes acquire them…): you can download the software and begin to use it immediately. That’s it. It’s not bad, I’d say, both for the “personal scientific productivity” and for the undoubted advantage that this has as part of the real project. Can you imagine how much of the researcher’s time and of the taxpayer’s money should be spent if they had to obtain licenses (renewals, software keys…) for all these things?

(Kindly translated by Claudia Castellani from italian).

Un miliardo di stelle (di nuovo) …

L’articolo è in inglese, ed è la traduzione di un articolo apparso tempo fa. E’ una prima prova per una sezione anglofona 😉

First I would like to reassure my faithful readers: the question is much less vague than you think! The catalog we are talking about should be created by ESA’s mission GAIA that we have already discussed a few times.

GAIA spacecraft will be launched in May of 2013, and under the five years of activity planned, it will record the positions and velocities of a large amount of astral objects; mostly stars in our Milky Way (but not only). Thanks to the particular system of scanning the sky (derived from the same principles as Hipparcos probe) the eye of GAIA will scan a significant portion of the entire sky. Moreover, a large number of astral objects will be observed not once, but dozens of times. All to the advantage of the accuracy of data collected and the possibility of conducting studies about objects of variable brightness.

At the end of the mission it is expected a catalog of objects of about a billion “rows”; that’s not bad at all if we consider that the census of Hipparcos – to which we still owe much of our current understanding of the Galaxy – numbered “only” 120,000 objects!

Reserving the treatment of extragalactic objects for a next post, let’s see now what Gaia will be able to do for our knowledge of the Milky Way. The points which scientists expect to clarify are the following:

• distance and velocity distribution of all stellar populations of the Galaxy. We know that the Milky Way is a very wide and complex, where there are clusters of stars of different type and origin (even some with external shunt, engulfed by the gravitational pull of our galaxy). A detailed investigation will surely bring many fruits.

• spatial and cinematic structure of the disk and the halo, very important to understand the exact dynamics of formation of the Milky Way and so of galaxies similar to it (large spiral galaxies). a detailed map of the distribution of dark matter derived from analysis of the velocities and

•positions of the stars. Streams of stars in certain directions can say much about the distribution of gravity and consequently of matter, whether it be light or “dark”.

• a rigorous framework for studying stellar evolution and structure formation: studies of stellar evolution are becoming more and more detailed, and they require observational data even for samples of stars that are very “rare”, to verify the predictions concerning, e.g., fast or peculiar evolutionary stages. a large-scale survey of extra-solar planets and small bodies in the Solar System (even one quarter of a million): we will be able to determine the orbits, the rotation period, the main parameters, obtaining a range of information that are essential for understanding the formation of our Solar System and planets in general.

For each object in the catalog we will have, as mentioned, not only the location but also the color and the radial velocities. In case of partly superimposed objects along the line of sight, algorithms are being studied to be able to “separate” the luminous fluxes of the various sources. Will we get “basic” information also about the chemical composition of the stars observed, due to a wideband spectrometry.

Here then is the meaning of the question: what can we do with a billion stars? It’s more than likely, however, that the time taken to the astrophysics community to “digest” the data will be much longer than the time necessary for GAIA to acquire them.

Our own way of thinking about the Milky Way will be soon destined to change, under the pressure of all these new data.

Con un miliardo di stelle, cosa si può fare…?

Vorrei rassicurare subito i miei fedeli lettori: la domanda è meno vagabonda di quanto si possa pensare! Il catalogo di cui stiamo parlando è quello che dovrebbe essere prodotto dalla missiona GAIA di ESA, di cui abbiamo parlato in varie occasioni

La sonda GAIA sarà lanciata a maggio del 2013, e nei previsti cinque anni di attività si occuperà di registrare posizioni e velocità di una grande quantità di oggetti; principalmente stelle della nostra Via Lattea (ma non solo).  Grazie al particolare sistema di scansione del cielo (derivato dagli stessi principi della sonda Hipparcos) l’occhi di GAIA arriverà a scrutare una significative porzione dell’intero cielo.Di più, una gran quantità di oggetti sarà osservata non una, ma decine di volte. A tutto vantaggio della precisione dei dati raccolti, e della possibilità di condurre studi di oggetti di luminosità variabile.

Ci si attende alla fine della missione un catalogo di oggetti di circa un miliardo di “righe”; non è affatto poco se consideriamo che il censimento di Hipparcos – a cui dobbiamo pur tantissimo della nostra attuale visione della Galassia – contava “appena” 120.000 oggetti!

Una immagine artistica della sonda GAIA. Credits: ESA/AOES Medialab

Riservando ad un successivo post il trattamento degli oggetti extragalattici, vediamo rapidamente cosa potrà fare Gaia per la conoscenza della nostra Via Lattea. I punti che li scienziati si aspettano di chiarire, sono i seguenti:

  • distanza e distribuzione di velocità di tutte le popolazioni stellari della Galassia. Sappiamo che la Via Lattea è un ambiente molto ampio e complesso, in cui si trovano ammassi stellari di vario tipo e origine (alcuni anche di derivazione esterna, fagocitati dall’attrazione gravitazionale della nostra Galassia). Una indagine approfondita porterà sicuramente moltissimi frutti
  • struttura spaziale e cinematica del disco e dell’alone, importantissimo per comprendere l’esatta dinamica di formazione della Via Lattea e quindi di galassie simili ad essa (grandi galassie a spirale)
  • una mappa dettagliata della distribuzione di materia oscura derivata dall’analisi delle velocità e delle posizioni delle stelle. Flussi di stelle in determinate direzioni possono dire molto sulla distribuzione di gravità e quindi di materia, sia essa luminosa od “oscura”
  • un quadro rigoroso per gli studi di evoluzione stellare e formazione delle strutture: gli studi di evoluzione stellare si fanno sempre più approfonditi, e c’è bisogno di avere dati osservativi anche per campioni di stelle molto “rari”, per verificare le predizioni riguardanti, poniamo, fasi evolutive veloci o peculiari.
  • una indagine a larga scala di pianeti extrasolari  e di corpi minori del Sistema Solare (anche un quarto di milione): potremo determinarne le orbite, il periodo di rotazione, i parmetri principali, ottenendo una serie di informazioni cruciali per comprendere le formazione del nostro Sistema Solare e dei pianeti in generale.

Per ogni oggetto in catalogo avremo,come accennato, non solo la posizione, ma anche il colore, le velocità radiali. In caso di oggetti parzialmente sovrapposti lungo la linea di vista, si stanno studiando algoritmi per poter “separare” i flussi luminosi delle varie sorgenti. Riusciremo ad avere informazioni “di base” anche sulla composizione chimica delle stelle osservate, grazie ad unao spettrometria a banda larga.

Ecco il significato della domanda: con un miliardo di stelle, che ci facciamo? E’ più che probabile, insomma, che il tempo che ci vorrà alla comunità astrofisica per “digerire” i dati sarà decisamente superiore al tempo necessario a GAIA per acquisirli. Il nostro stesso modo di pensare la Via Lattea sarà ben presto destinato a mutare, sotto la spinta di tutti questi nuovi dati.

Il più grande censimento della Via Lattea

Avvicinandosi la data del lancio (maggio 2013, se non ci saranno ulteriori ritardi) vogliamo iniziare ad occuparci un pò più da vicino della sonda GAIA di ESA; il motivo molto semplice è che… lo scrivente fa parte del team di scienziati che si occupa della preparazione del software di riduzione dei dati inviati dalla sonda (ne abbiamo scritto anche in tempi non troppo remoti, per quanto in verità notizie su GAIA appaiono su GruppoLocale da ben prima che ciò avvenisse). E dunque, perché non approfittarne, per trasferire su questo sito – ogni tanto – le informazioni più interessanti per il pubblico più vasto? Per seguire più da vicino la preparazione e la messa in opera di un progetto così interessante ed ambizioso… ed anche (se volete) per rispondere a domande e curiosità “dal di dentro” di tale progetto?

Sul sito della sonda GAIA appare da qualche giorno una immagine assai interessante, che fa capire meglio di tante parole (o formule) la portata di quanto potrà fare GAIA (abbreviazione di Global Astrometric Interferometer for Astrophysics). Il catalogo di stelle atteso raggiunge infatti il miliardo: è una fetta significativa della popolazione della Galassia, ed è la prima volta che viene tentata un’impresa di questo genere. Basti pensare che il “padre” di GAIA, la sonda Hipparcos – a cui GAIA deve tantissimo per la concezione generale che per diversi dettagli implementativi – ha campionato “appena” 120.000 stelle (e ha comunque fornito un contributo strepitoso alla conoscenza della nostra Galassia, come ci si può accorgere soltanto scorrendo le relative pubblicazioni scientifiche).

La simulazione che mostra l'estensione del futuro catalogo di GAIA in rapporto alla Via Lattea

Avremo modo di parlare della scienza che si può fare con un catalogo di posizioni e velocità stellari così esteso. Per intanto, contentiamoci di “osservarlo”: quella illustrata è una rappresentazione “artistica” della Via Lattea con sovrapposta l’area campionata da GAIA; i colori indicano la “densità” attesa del catalogo, che va dal porpora per le regioni molto dense, intorno al Sole, fino ad arrivare al rosa che indica densità di stelle minori.

La simulazione è stata effettuata utilizzando il supercomputer Mare Nostrum, uno dei supercomputer più potenti in Europa.

Altre info a

Crediti: X. Luri & the DPAC-CU2. Simulations based on an adaptation for Gaia of the Besançon galaxy model (A. Robin et al.)


La sonda GAIA e i modelli della Via Lattea

Gli astronomi ritengono che i dati di GAIA daranno un forte impulso al perfezionamento dei modelli galattici….

Studi sulle popolazioni stellari risolte (ove si riescono a distinguere le stelle costituenti), come piu’ volte e’ stato sottolineato in queste pagine, offrono una grande opportunità per comprendere come le galassie si formano ed evolvono. Gli studi delle galassie ‘esterne’ ci hanno da tempo persuaso come per comprendere le galassie stesse, si debbano studiare separatamente le diverse componenti di cui sono formate: un nucleo, a volte una struttura a barra, un disco sottile, spesso accompagnato ad una struttura di disco spesso, un alone massivo e a volte povero in metalli. La Via Lattea, che può essere considerata un prototipo delle galassie che sono responsabili della gran parte della radiazione luminosa nell’universo, come e’ noto, possiede tutte queste componenti, e dunque una “mappatura” cinematica di tali componenti offrirebbe un’ opportunità unica per gettare luce su alcune questioni fondamentali dell’astronomia contemporanea.

GAIA e’ un ambizioso progetto dell’ Agenzia Spaziale Europea (ESA), che nasce con lo scopo di misurare le posizioni di un campione estremamente ampio di stelle galattiche, con una accuratezza mai raggiunta prima: GAIA dovrebbe riuscire a misurare, infatti, ben un miliardo di stelle appartenenti alla nostra Galassie e alle galassie più vicine. Oltre le posizioni, verra’ anche effettuata fotometria multicolore (in varie bande) e verranno misurate le velocita’ radiali. Tali dati saranno di grande utilita’ per gli astronomi interessati a migliorare il modello della struttura galattica.

Per quanto infatti i modelli galattici attuali abbiano raggiunto un buon grado di complessita’ e sofisticazione, molto ancora resta da comprendere sulle specifiche dinamiche di formazione delle diverse parti della galassia. Per molti versi preziose informazioni su questo sono portate dalle stelle piu’ vecchie e meno luminose, che ritengono memoria chimica/cinematica delle modalita’ di formazione della galassia stessa. La gran quantita’ di stelle investigate da GAIA, insieme alla capacita’ di risolvere anche stelle deboli, dovrebbe consentire notevoli progressi nella comprensione delle complesse dinamiche galattiche, come pure del ruolo eventuale delle piccole galassie nane nella formazione ed evoluzione delle popolazioni stellari delle galassie maggiori (tramite eventi di interazione mareale o di fusione).

Per far solo un esempio, capire meglio la struttura del disco spesso della Galassia, consentirebbe di ottenere informazioni sulla modalita’ di evoluzione della Galassie nonche’ sul possibile ruolo di incontri, nel corso degli ultimi miliardi di anni, con galassie piu’ piccole, quali le nane presenti in quantita’ numericamente rilevante nel Gruppo Locale. Altre importanti informazioni che si dovrebbero ottenere riguardano specificamente la galassia Andromeda (M31), una delle (poche) grandi galassie del Gruppo Locale.

In realta’ la grande quantita’ di dati di alta precisione che si attendono da GAIA porranno diversi problemi ai modelli teorici attuali, per cui la sfida consistera’ proprio nel modificare e perfezionare tali modelli, facendoli diventare via via piu’ sofisticati, con l’obiettivo di raggiungere una intesa soddisfacente con i dati che saranno forniti da GAIA.