原文以Half of papers searched for online are free to read為標題
發(fā)布在2017年8月7日的《自然》TREND WATCH上
原文作者:Dalmeet Singh Chawla
一項關于開放研究的大規(guī)模研究分析了免費論文查找工具Unpaywall的讀者數據。
一項大規(guī)模研究跟蹤了今年6月份互聯網上的10萬次期刊論文搜索數據,發(fā)現人們想在網上獲取的學術論文中幾乎有一半存在免費、合法版本。
這項研究于8月2日發(fā)布在PeerJ Preprints上,它分析了來自名為Unpaywall的瀏覽器擴展的讀者數據,該擴展可以在互聯網上搜索付費論文的免費閱讀版。
該工具在今年4月份推出,其開發(fā)者正是這項研究的兩位作者Jason Priem和Heather Piwowar,二人在溫哥華共同創(chuàng)辦了非盈利公司Impactstory。Priem表示,Unpaywall已經被全球8萬人安裝,每天約有5萬次使用。
當Unpaywall用戶點擊一篇期刊文章時,該工具會查詢一個名為oaDOI的數據庫,然后向用戶報告這篇文章是否有免費閱讀版。oaDOI數據庫記錄了6700萬篇帶有數字對象標識符(DOI,學術出版界廣泛使用的一種標識編碼)的期刊文章,該數據庫的開發(fā)者同樣是這對合作搭檔。
研究作者分析了Unpaywall用戶在6月的一周內嘗試訪問的10萬篇論文的服務器日志,發(fā)現有47%的被訪問文章在網上存在合法的免費閱讀版。Priem說,這些可免費訪問的內容,約有一半是在最近兩年發(fā)表的。
目前這項研究尚未經過同行評審。荷蘭萊頓大學科學和技術研究中心副主任、《信息計量學期刊》(Journal of Informetrics) 編輯Ludo Waltman表示,這項研究是“嚴謹且廣泛的”。
研究作者表示,自2014年歐盟委員會公布了一份關于開放研究的報告以來,他們的研究是對開放研究狀況的第一次廣泛分析。兩項分析采取的方法不同,早先的分析使用自動化軟件在線搜索Scopus數據庫中隨機抽取的論文,此外還全面檢索Academia.edu及ResearchGate 等學術社交網站——Unpaywall研究則沒有包含這一部分。這項分析估計,2007-2012年間發(fā)表的經同行評審的研究論文有一半以上在當時可以免費在線閱讀。Piwowar認為,考慮到方法上的差異,可以說這個結果與新研究的結果大致相當。
新研究還深入分析了免費閱讀論文從何而來。通過Unpaywall搜索到的學術文章中,超過20%可以直接從期刊獲取,并有明確許可說明文章是否可以免費閱讀、下載或轉載。另外有9%以付費文章發(fā)表,但隨后作者將文章或文章的某種形式(如同行評審手稿)上傳至在線知識庫(參見“開放研究的狀態(tài)”)。
Credit: H. Piwowar et al. Preprint at http://dx.doi.org/10.7287/peerj.preprints.3119v1 (2017).
最值得注意的一類是在出版商網站上可以免費閱讀卻沒有任何明確開放許可的文章,這類免費文章占15%。作者說這種類型的開放獲取極少被討論,他們將其標為“銅色”,與廣泛使用的“金色”和“綠色”區(qū)分。
引用難題
為了解整個學術文獻中免費論文的普遍程度,作者從DOI注冊代理公司Crossref記錄的6700萬篇期刊文章中隨機選取10萬篇文章,通過oaDOI數據庫識別它們的發(fā)表狀態(tài)。樣本中28%的文章可以免費閱讀,由此估計全部文獻中有1900萬篇免費文章。在2015年(研究范圍中最近的年份)發(fā)表的文章中,有45%可免費獲取,這表明越新的文章越有可能是開放的。
該研究還調查了開放獲取文章比付費文章引用次數更高的說法。研究從2009年至2015年間Web of Science數據庫索引的800萬篇文章中隨機選取了10萬篇進行分析,發(fā)現在同一學科領域及同一出版年份,免費閱讀文章的被引次數比平均數高18%。
這個趨勢也得到了此前一些研究的支持,但也有人質疑這一效應是否真的存在。Waltman表示,很難斷定這些論文的高引用頻次僅僅是因為其開放性,想要證實這一假說,需要確認引用人是否有權獲得付費內容。
Priem說,這項研究的一個局限性是其樣本僅包括DOI標識的文章,而藝術和人文科學領域的出版商及發(fā)展中國家一般不使用DOI。
不論如何,“開放獲取的文獻比例依然在穩(wěn)步增長”,他說。這對學術圖書館可能產生一定影響。大學和出版商在機構訂閱套餐價格上的矛盾日趨升級,該研究認為,最新發(fā)現揭露最近發(fā)表的研究約有一半可以在網上免費獲取,這可能促使“某些機構逐步取消訂閱”。
對Priem來說,未來充滿可能。“未來幾十年,我們會看到幾乎所有的文獻都可以免費獲取。”?
Nature|doi:10.1038/nature.2017.22418
版權聲明: