Avoin julkaiseminen: oppia hiukkasfysiikasta

4.11.2015 klo 16.49, kirjoittaja
Kategoriat: Kosmokseen kirjoitettua , Kosmologia

Puhuin 21.10. Kirjastoverkkopäivillä tieteellisestä julkaisemisesta otsikolla ”Open publishing: lessons from particle physics”. Esitys on katsottavissa täällä (alkaen kohdasta 1.28), ja kalvot löytyvät täältä; ne ovat englanniksi. Kirjoitan tässä puheen tiimoilta, mutta en täysin samaa kuin puheessa. Olen aiemmin käsitellyt aihetta täällä ja täällä.

Hiukkasfyysikot ovat olleet tieteellisen tiedon välittämisen edelläkävijöitä. Hiukkasfysiikassa kokeiden ja teorian välinen vuorovaikutus on ollut nopeaa (viime vuosikymmeninä edistys on tosin hidastunut, kun kiihdyttimissä ei ole löytynyt uutta), ja tieteellisiä artikkeleita oli aikoinaan tapana lähettää paperilla kollegoille ennen niiden julkaisemista. 1990-luvun alussa siirryttiin sähköpostiin, ja 1991 otettiin käyttöön nettiarkisto arXiv. Samana vuonna CERNissä kehitettiin World Wide Web, ja arXivin tuli www-käyttöliittymä vuonna 1993. arXiv on laajentunut kattamaan fysiikan eri aloja sekä matematiikan, tilastotieteen, tietojenkäsittelytieteen, kvantitatiivisen biologian ja kvantitatiivisen taloustieteen. arXivissa on tänään yhteensä 1 088 379 artikkelia.

Joka arkipäivä arXivissä ilmestyvät edellisen päivän aikana jätetyt artikkelit (paitsi maanantaisin, jolloin ilmestyvät perjantain jälkeen jätetyt artikkelit), eli julkaisuviive on yksi päivä tai korkeintaan viikonloppu. Artikkelit ovat arXivissa pysyvästi – kirjoittajat eivät voi vetää niitä pois, vaikka haluaisivat. Artikkeleita voi päivittää koska tahansa, mutta kaikki versiot jäävät näkyviin. Artikkelien jättäminen arXiviin ja niiden lukeminen on ilmaista.

arXivin kustannukset ovat erittäin alhaiset. Vuonna 2014 arXiv julkaisi 97 517 artikkelia ja sen budjetti oli 643 274 dollaria, eli 6.6 dollaria artikkelia kohden. (Koska suurin osa työstä on automatisoitu, hinta per artikkeli laskee artikkelien määrän kasvaessa.) Summassa ei ole mukana epäsuoria kuluja, joita ei makseta arXivin budjetista, ja osa arXivin toimintaan osallistuvista ei saa erillistä korvausta.

Kyse ei ole palkattomasta työstä, vaan siitä, että akateemisissa instituutioissa työskenteleville tutkijoille ei makseta määritettyjen tehtävien suorittamisesta, toisin kuin useimmissa työpaikoissa. (Joitakin kiinnitettyjä velvollisuuksia on, merkittävimpänä opettaminen.) Sen sijaan he saavat käyttää aikaansa tieteen edistämiseen eri tavoin oman harkintansa mukaan. Yliopistotutkijoiden palkka on eräänlainen tieteilijöiden perustulo, joka mahdollistaa joustavan ja monipuolisen tieteellisen toiminnan, kuten arXivin kaltaisten projektien kehittämisen ja ylläpitämisen sekä tieteellisen vertaisarvioinnin. Usein tuntuu siltä, että tätä akateemisen vapauden luonnetta ja merkitystä tieteen kehitykselle ei ymmärretä, varsinkin kun puhutaan yliopistojen tehostamiseksi kutsutusta kurjistamisesta.

arXiv on mullistanut tieteellisen julkaisemisen fysiikassa ja läheisillä aloilla. arXivin ja tieteellisen lehtien roolien hahmottamiseksi on syytä katsoa sitä, mitä tarkoitusta tieteelliset lehdet ovat historiallisesti palvelleet tutkijoiden näkökulmasta. Lehtien kautta on hoidettu neljä asiaa tutkimuksesta:

  1. Rekisteröinti

    Tutkijoille on tärkeää pitää kirjaa siitä, kuka on tehnyt mitäkin ja koska. Tieteellisissä lehdissä ei vain julkaista tuloksia, niissä myös kerrotaan milloin lehti on tulokset vastaanottanut. Näillä päivämäärillä on ollut iso merkitys kunnian, tutkijoiden pääasiallisen valuutan, jakamisessa.

  2. Tiedonvälitys

    Se, että lehdet ovat välittäneet uusia tutkimustuloksia jatkuvasti tutkijayhteisölle on mahdollistanut tieteen nopean kehityksen.

  3. Arkistointi

    Jotta tulokset ovat kaikkien löydettävissä, ne pitää luetteloida ja säilöä saataville. Lehtien järjestelmällinen numerointi on tehnyt tämän helpoksi kirjastoille.

  4. Laadun arviointi

    Lehdillä on myös ollut tärkeä rooli tutkimuksen laadun tarkkailemisessa. Niiden kautta on järjestetty vertaisarviointi siten, että yksi tai useampi saman alan tutkija käy tutkimusta läpi ja antaa arvion siitä, voiko sen julkaista ja mitä muutoksia se mahdollisesti tarvitsee.

arXiv hoitaa nykyään tehtävät 1-3, lehtiä ei niihin tarvita. Rekisteröinnissä katsotaan arXiviin lähettämisen ajankohta ensisijaiseksi. Lehtiin verrattuna arXiv on parempi tapa välittää tutkimuksen sisältöä, koska artikkeleita on mahdollista päivittää, ja niihin liittyvän kokeellisen datan, koodien ja muun tiedon laittaminen saataville on suoraviivaista. Artikkelit järjestyvät automaattisesti arkistoon saman tien, ja niistä on paljon metadataa, mikä tarjoaa hyvän lähtökohdan mahdolliselle uudelleenjärjestelylle sekä arkiston tilastolliselle hyödyntämiselle.

Aiemmin lehdet ovat hoitaneet myös artikkelien kirjoittamisen puhtaaksi ja vastanneet taitosta. Nykyään tutkijat kirjoittavat artikkelinsa itse valmiiksi ladontaohjelma LaTeXilla, joka pitää huolta ulkoasusta automaattisesti. Lehdet tosin vieläkin tarkistavat artikkelin kieliasun ja ladonnan. Joskus tämä tekee niistä kieliopillisesti parempia, mutta se voi myös tuoda mukanaan virheitä niin tekstiin kuin yhtälöihin, ja tutkijoilla tuhlaantuu aikaa tarkistettujen artikkeleiden syynäämiseen lehden tekemiä virheitä etsien.

Lehtien ainoaksi tarpeelliseksi tehtäväksi on jäänyt vertaisarvioinnin järjestäminen. Tosin on kyse vertaisarvioinnista vain suppeasti ymmärrettynä. Artikkelien paikkansapitävyyden todellinen arviointi tapahtuu siten, että ne ovat vapaasti luettavissa arXivista, ja kokeiden tapauksessa data on kaikkien saatavilla, niin että yhteisö voi toistaa tutkimuksen. Niin kosmisen mikroaaltotaustan kylmän läikän selityksen kuin BICEP2-ryhmän väittämän gravitaatioaaltohavainnon tapauksessa virheet on korjannut yhteisö arXiviin laitettujen artikkeleiden perusteella. Etenkin BICEP2-ryhmän väitteiden tapauksessa lehtien vertaisarviointi tuli arXivissa julkaistun kritiikin jäljessä. Vertaisarvioinnin voisi järjestää paremminkin, esimerkiksi yhteistyökumppanillani Shaun Hotchkissillä oli mielenkiintoisia ehdotuksia, vaikka en olekaan täysin samaa mieltä.

Lehtien tekemän vertaisarvioinnin pääasiallinen merkitys on se, että se antaa työpaikkojen ja apurahojen hakua varten merkin siitä, että artikkelin laatu on jollain tapaa tarkistettu. Tämän suppean vertaisarvioinnin pääasiallinen kohde ei siis ole alan asiantuntijoiden yhteisö, joka arvioi tulosten oikeellisuuden itse, vaan sellaiset tahot, jotka tekevät päätöksiä tutkijoiden tulevaisuudesta tutustumatta heidän työnsä yksityiskohtiin (eli lähes kaikki, jotka päättävät työpaikoista ja apurahoista).

Julkaisukäytäntöjä ei ole päivitetty ottamaan huomioon lehtien merkityksen supistumista. Olen aiemmin kirjoittanut julkaisemisen vaiheista hiukkaskosmologiassa, lyhykäisesti ne ovat seuraavat:

0. Artikkeli julkaistaan arXivissa ilmaiseksi.
1. Kirjoittaja antaa artikkelin kustantajalle ilmaiseksi.
2. Referee vertaisarvioi artikkelin ilmaiseksi.
3. Editori päättää julkaisemisesta. (Editori saattaa saada palkkaa.)
4. Kirjoittaja saattaa joutua maksamaan kustantajalle artikkelin julkaisemisesta.
5. Lehti julkaisee artikkelin uudelleen ja myy sen tutkijoiden instituuteille.

On sikäli harhaanjohtavaa sanoa, että kirjoittaja tai refereet tekisivät työnsä ilmaiseksi, että he saavat omalta yliopistoltaan (tai muulta tieteelliseltä instituutiltaan) kiinteää palkkaa, kuten yllä mainitsin. Se tarkoittaa vain sitä, että kustantaja ei maksa heille mitään. Sen sijaan kustantaja pitää kaikki voitot.

Kyse ei ole pikkusummista. Kirjastot maksavat tieteellisistä lehdistä vuosittain yhteensä 7.6 miljardia euroa. Ongelmana ei ole niinkään lehtien suuri lukumäärä kuin kustantajien korkeat hinnat, sekä myyntikäytännöt, joiden takia ei usein ole mahdollista tilata haluamiaan lehtiä yksittäin. Kirjastot maksavat yhdestä artikkelista keskimäärin jotain 3800 ja 5000 euron väliltä – summa on saatu laskemalla yhteen kaikkien kirjastojen kustantajille maksamat rahat ja jakamalla artikkelien määrällä.

Voittomarginaalit ovat huikeita. Usein esimerkiksi nostetun pahamaineisen Elsevier-kustantamon tieteellisen, teknisen ja lääketieteellisen osaston voittomarginaali on kaikkina vuosina välillä 1991-2013 ollut yli 30%, vuonna 2013 se oli 39%. (Koko yrityksen voittomarginaali on ollut alhaisempi, vuonna 2013 se oli 22%.) Vertailun vuoksi mainittakoon, että samana vuonna Applen voittomarginaali oli 22%, Googlen 20% ja Microsoftin 28%.

Valtavat voitot on helppo ymmärtää: kustantajat saavat tuotteen ilmaiseksi ja myyvät sen isoon hintaan eteenpäin, ilman että niille tulee siitä suuria kuluja. (Joissakin tapauksissa kustantajalle jopa maksetaan siitä, että se ottaa tuotteen vastaan.) Nämä miljardit ovat poissa tieteen tekemisestä, mutta se ei tietenkään ole kustantajien ongelma. Suuri osa kustantajista on suuryrityksiä, joiden tavoitteena on tehdä mahdollisimman paljon voittoa, ja mahdollisesti käyttää tiedettä yrityksen brändin rakentamisessa.

Jotkut lehdet ovat akateemisten yhteisöjen julkaisemia, ja niiden tapauksessa tavoitteena saattaa olla myös tieteen tukeminen. Yhteisötkin tosin saattavat haavia kustantamisella voittoa yleishyödyllisen toimintansa rahoittamiseksi. Silloin kun tähän liittyy kohtuuttomia artikkelihintoja, niin kyse on mielenkiintoisesta ilmiöstä, jossa teknologian kehitys muuttaa tiedonvälityksen aiempia edistäjiä sen jarruttajiksi. Joka tapauksessa tiedejärjestöjen osuus kustantamisen ongelmissa ei ole hallitseva, vaikka niillä onkin fysiikassa isompi rooli kuin muilla aloilla.

Ratkaisuksi on tarjottu open accessia, eli sitä, että artikkelit olisivat kaikkien ilmaiseksi luettavissa. Yleensä erotellaan ’kultainen’ versio, jossa kustantajalle maksetaan siitä, että se laittaa julkaisemansa artikkelin vapaasti luettavaksi ja ’vihreä’ versio, jossa kustantaja julkaisee artikkelin vanhaan tapaan, mutta kirjoittaja laittaa sen myös avoimeen arkistoon, kuten arXiviin. On arvioitu, että tällaisessa kustantajakeskeisessä open access –mallissa artikkelien hinnan saisi pudotettua jonnekin 1100 ja 2000 euron välille, siis tekijällä 2-5 nykytilanteeseen verrattuna. Tämä tarkoittaisi miljardien säästöjä.

On kuitenkin syytä pitää mielessä, että artikkelien julkaiseminen lehdissä on täysin tarpeetonta. Lehtijulkaisun jälkeen arXiv-versio yleensä päivitetään vastaamaan lehdessä julkaistua artikkelia, ja jos näin ei tehdä, niin kyse on vain huolimattomuudesta (tai kustantajan kiristyksestä). Kustantajakeskeinen open access –malli pyrkii korvaamaan sen, että kustantajille maksetaan 7.6 miljardia euroa turhasta sillä, että niille maksettaisiin 1.7-4 miljardia euroa turhasta. CERNin johtama SCOAP3-hanke, josta olen kirjoittanut aikaisemmin, on tästä varoittava esimerkki.

Tieteilijöiden ei tarvitse ’muuttaa tieteellisen julkaisemisen bisnesmallia’, vaan lopettaa se. Jos julkaisut ovat joka tapauksessa luettavissa avoimesta arkistosta, niin miksi julkaista niitä lehdissä ollenkaan? Ongelmana ei ole open access –se on ratkaistu arXivin myötä vuosikymmeniä sitten– vaan vertaisarvioinnin järjestäminen kustannustehokkaasti.

Tämä on ideana ’timanttisessa’ open access –mallissa, jossa artikkelit julkaistaan ilmaisessa nettiarkistossa, ja tieteilijöiden pyörittämä lehti hoitaa vain vertaisarvioinnin. Lehdellä voi olla tavalliseen tapaan oma www-sivu, jonka kautta artikkeleita tarjotaan sinne ja vertaisarvioidaan ja jossa sen hyväksymät artikkelit listataan.

Tällaista vaihtoehtoa kartoitti kosmologian ja astrofysiikan alalla vuosina 2007-2008 RIOJA-projekti, jossa laadittiin tarvittava ohjelmisto ja tehtiin esimerkkinä lehden www-sivu. Projektissa myös selvitettiin tutkijoiden asenteita, ja oli huomattavaa, että monet tutkijat eivät ainakaan tuolloin olleet tietoisia siitä, kuinka paljon lehtien tilaukset tiedeyhteisön budjettia rasittavat. Tämä selittänee sen, miksi arXiv-pohjaiset lehdet eivät ole jo korvanneet perinteisiä julkaisuja. Muutos voi lähteä vain tieteilijöistä: tarvitaan arvostettuja tutkijoita, jotka antavat painoarvoa uudelle lehdelle toimimalla sen editoreina, ja lisäksi jotkut hoitamaan asian vaatimaton tekninen puoli.

Matemaatikot ovat menneet fyysikoiden edelle, ja ensi vuonna aloittaa tällainen arXiv-pohjainen lehti Discrete Analysis, jonka toimituskuntaan kuuluvat mm. Fields-mitalistit Tim Gowers ja Terence Tao. Ohjelmisto on peräisin Scholasticalta. Julkaisemisen kustannukset ovat 10 dollaria per artikkelia, siis noin 400-500 kertaa vähemmän kuin nykyinen julkaisumalli ja 100-200 kertaa vähemmän kuin kustantajakeskeisessä open access –mallissa.

Huhujen mukaan myös kosmologiaan on tulossa vastaava julkaisu. Joitakin kahvipöytälehtiä, kuten Naturea ja Scienceä, lukuun ottamatta kaikki vanhat tieteelliset julkaisut on nopeasti korvattavissa tällaisilla nykyaikaisilla lehdillä, jotka lähestyvät julkaisemista tutkijayhteisön tavoitteista, eivät kustantajien. Olen käsitellyt tilannetta hiukkaskosmologiassa ja matematiikassa, mutta ei ole mitään periaatteellista syytä, miksei julkaisemista voi päivittää nykyaikaan muillakin aloilla.

Kirjastoilla on tässä siirtymässä tärkeä rooli. Niiden pitäisi lopettaa tekohengityksen antaminen tarpeettomalle kaupallisen kustantamisen mallille open accessin nimissä. Sellaisten hankkeiden kuten SCOAP3 tukeminen on haitallista, koska se siirtää suuria rahasummia kustantajien taskuihin, ilman mitään tarpeellista vastinetta. Kirjastot voivat myös säästää lopettamalla sellaisten tarpeettomien lehtien tilaamisen, joissa julkaistut artikkelit on ilmaiseksi luettavissa. Sen sijaan kirjastojen tulisi tukea arXivia ja muita ilmaisia nettiarkistoja, sekä arkistopohjaisia lehtiä ja muita tapoja vertaisarvioinnin uudelleenjärjestämiseen.

Kirjastojen ja tutkijoiden kommunikaatio on oleellista. Kirjastojen pitää olla siirtymävaiheessa tarkkoja, että ne eivät lakkauta lehtien tilauksia tavalla, joka jättäisi tutkijat vaille sellaisia tärkeitä julkaisuja, joiden sisältö ei vielä ole avoimissa nettiarkistoissa. Toisaalta kirjastojen tulee kertoa tutkijoille, millaisesta taloudellisesta taakasta on kyse, jotta nämä osaavat suhtautua asiaan sen vaatimalla vakavuudella. Nyt lehtiä nimittäin halutaan pitää tilauksessa osittain vain vanhasta tottumuksesta, tai siksi, että kaikki eivät katso artikkelin lopullisen version laittamista arXiviin oleelliseksi.

Jos tutkijat joutuisivat maksamaan kirjoittamiensa artikkelien julkaisukulut omasta tutkimusbudjetistaan, niin asiaan suhtauduttaisiin toisin, enkä usko, että hiukkaskosmologiassa olisi vuosikymmenen loppuun mennessä enää ainuttakaan kaupallista lehteä. Nyt yhteisö liikkuu verkkaisemmin, mutta kaupalliset kustantajat menettävät joka tapauksessa otteensa tieteellisestä julkaisemisesta. Se tapahtuu sitä nopeammin, mitä tehokkaammin tutkijat ja kirjastot organisoituvat järjestämään julkaisemisen ja vertaisarvioinnin nykyaikaisella ja kustannustehokkaalla tavalla.

7 kommenttia “Avoin julkaiseminen: oppia hiukkasfysiikasta”

  1. Mari Katvala kirjoitti:

    Kiitos loistavasta kirjoituksesta!

    Lienet tietoinen tästä vertaisarviointiin avoimuutta tuovasta Jyväskylästä lähtöisin olevasta palvelusta, mutta laitanpa kuitenkin linkin. Peerage of Science https://www.peerageofscience.org/ toimii tällä hetkellä lähinnä evoluutiobiologian ja -ekologian aloilla, mutta toiveissa on toiminnan laajentuminen. //mari

  2. Syksy Räsänen kirjoitti:

    Mari Katvala:

    Kiitos, en tiennyt tuosta!

  3. Walter Rydman kirjoitti:

    Kirjoituksesi on naulan kantaan! Muutos julkaisemisessa on saamassa selvästi vauhtia. Juuri tänään tuli <a href="http://arstechnica.co.uk/science/2015/11/entire-editorial-staff-of-elsevier-journal-lingua-resigns-over-high-price-lack-of-open-access/" title="uutinen"), merkittävän Elsevierin julkaiseman kielitieteen lehden Linguan koko toimituskunta erosi.

    Toisaalla Figshare tekee tutkimusdatan julkaisemisesta helppoa, avointa ja viittauskelpoista.

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *