...

2亿篇论文免费看!「微软学术」停用,OpenAlex要接班

2022-01-25

新智元报道

编辑:David 时光

【新智元导读】为了接替已下线的「微软学术搜索」,大型免费学术索引 OpenAlex 已于今年年初正式上线,它涵盖 2 亿篇科学文献,易学易用,完全免费,网站将于 2 月上线。

最近,大型免费学术资源索引 OpenAlex 宣布上线,该索引包含超过 2 亿份科学文献。

这个资源索引服务名为 OpenAlex,源自古代埃及亚历山大图书馆馆名。

创始人表示,该索引对出版物来源、作者信息和研究主题进行编目,旨在绘制这些数据点之间的联系,以创建一个全面的、相互关联的全球研究系统数据库。

去年 5 月,微软宣布将于当年年底关闭学术搜索知识图谱(MAG) ,让一些学者和其他使用其数据进行研究和开发的人感到担忧。

为应对 MAG 的下线,位于加拿大温哥华的非营利性学术服务公司 OurResearch 利用伦敦慈善机构 Arcadia Fund 提供的 450 万美元的一部分,创建了这项「伟大工程」。

今年 1 月 3 日推出的这个免费学术索引数据库,功能上与微软的 Academic Graph (MAG) 类似,MAG 是 Scopus、Dimensions 和 Web of Science 等学术订阅平台的免费替代品,已于 2021 年底停止运营。

据悉,该索引当前通过可执行复杂搜索的应用程序编程接口或 API 访问。

微软「学术图谱」接班人

无论是研究人员,还是开发者,都需要大量查阅论文、专著等学术成果。近年来,越来越多的人开始绕过学术出版商的「付费墙」,通过多种手段免费获取学术资源。

作为微软 MAG 的替代品,此前 OpenAlex 一直在从 MAG 获得论文、作者和其他数据实体。在 MAG 正式停止运营后,OpenAlex 开始自己从互联网收集更多新内容。

目前 OpenAlex 已经发布新的 REST API 。与之前下载安装的方式相比,可以更快、更简单地访问 OpenAlex 数据库,无需账户和令牌,完全免费。

目前,通过 API 可以获取单一实体、实体列表和实体组。

OpenAlex 数据集描述了 5 类学术实体以及这些实际之间的联系。每类实体分别对应其目标:

  • 成果:包括论文、书籍、数据集等,会引用其他成果

  • 作者:做出成果的人

  • 出处:刊载成果的期刊或资源库

  • 机构:(通过作者)与成果相关的大学或其他组织

  • 概念:以话题方式对成果进行标签

OpenAlex 表示,探索 OpenAlex 数据集的最简单方法是通过 Web 界面,无需编写代码即可探索 OpenAlex。不过目前网站开发尚未完成,预计在今年 2 月上线。

尽管 MAG 已停用,但作为其继任者和替代,OpenAlex 将继续维护 MAG 格式至今年 7 月 2 日,从 2022 年 7 月起,OpenAlex 将不再支持 MAG 格式。

由于目前尚处于早期开发阶段,各项功能尚待进一步完善,OpenAlex 将每日单个用户调用数量限制在 10 万次以下。

OpenAlex 三大优势

在综合比较各种数据库之后,小编发现,OpenAlex 具有明显的三大优势,这将带给用户美好的体验。

海量数据,覆盖面超 MAG

OurResearch 的联合创始人贾森·普里姆(Jason Priem)表示,「OpenAlex 的创立是为了实现与其他几个数据库互联互通,使其覆盖更加广泛全面。」

与某个单一数据库相比,OpenAlex 拥有更加开放的获取覆盖面,它拥有来自 Wikidata 标识符、MAG 、ORCID、Crossref、ROR、Unpaywall 等数据资源。

普里姆表示,「我们不仅可以给用户提供文章的免费版本,还可以告诉你该文章的授权和不同版本。」

简单易用,20 分钟就会

「OpenAlex 是在用一种聪明的方式,将大量的数据库整合在一起。」欧弗顿公司(Overton)的创始人尤安·阿迪(Euan Adie)说。

欧弗顿是家总部位于伦敦的公司,主要用于跟踪政策文件的引用。过去,欧弗顿公司从不同的来源获取数据,包括 MAG、ORCID、Crossref,也直接向个人获取。

现在,欧弗顿只使用 OpenAlex,寄希望于检索过程更加便捷,简单设置让人容易学会。

「我只需要 20 分钟就会使用 OpenAlex,而对比 MAG 却要3-4 天。」阿迪说。

「我花了大约 2 小时就学会了 OpenAlex,而开始用 MAG 却要一周。」另一位使用者 Roar Bakken Stovner 说。

Stovner 认为,对于更精通计算机的人来说,MAG 可能不算难,而对于那些想要自己尝试开发小项目的人来说,OpenAlex 将更容易开始。

不用登录,完全免费

OpenAlex 的底层代码在 CC0 版权许可下可以免费获得,任何人都可以在其上进行开发。

因此,贾森·普里姆(Jason Priem)表示,OpenAlex 每两周更新一次,比 MAG 更向前迈进了一步。

假如,哪一天 OpenAlex 停止运行,那么,任何人都可以从接着 Priem 停下的进度继续开发,而不必从头开始搭建数据库。

此前,MAG 的用户必须登录系统,并支付少量费用,才可以下载。而 OpenAlex 可以免费使用。

普里姆表示,这要感谢 Amazon Web Services 的赞助,不需要注册或登录,这使得使用过程更加友好。

不过,OpenAlex 可能会考虑为那些想要超快访问的用户,推出付费高级版本。

但,免费的版本总是可用的。

参考资料:

https://www.nature.com/articles/d41586-022-00138-y

https://www.nature.com/articles/d41586-022-00103-9

https://docs.openalex.org/


来源:新智元