您的位置:首页 >Nature杂志 > Nature杂志精选 >

控制虚拟化石的斗争

导读 十年前,古生物学家Jack Tseng开始寻宝。不是你可能想象的典型的靴子和镐斧事件,而是在他的领域中相对常见的事情。来自他在加利福尼亚州...

十年前,古生物学家Jack Tseng开始寻宝。不是你可能想象的典型的靴子和镐斧事件,而是在他的领域中相对常见的事情。来自他在加利福尼亚州洛杉矶县自然历史博物馆的基地,曾访问世界各地的博物馆,检查他们收藏的食肉动物的头骨。

每当他遇到一个时,他都会问他是否可以带走标本的三维扫描图像。Tseng自己的机构收藏了来自条纹鬣狗,猎豹,豺,狼蛛和猫鼬的骷髅,以及来自已灭绝的鬣狗和狗的头骨。但是当时的博士生Tseng需要更多的奇异化石来研究食肉动物如何进化出碾碎骨骼的能力。“我一直在寻找特别完整的头骨,”他说。所以,他旅行了。到了纽约,华盛顿特区,北京,伦敦,乌普萨拉,他去了古生物购物清单上的物品。Tseng不需要访问的地方是马德里的国家自然科学博物馆,尽管它拥有一个非常近乎完整的大型鬣狗颅骨。博物馆的食肉动物专家Manuel Salesa已经扫描了化石并直接将数据发送给了曾。

Salesa的慷慨给Tseng留下了深刻的印象,Tseng现在是纽约布法罗大学自己的进化生物学实验室的负责人。他仍然前往观看遥远的收藏品,但他的学习越来越依赖“虚拟化石”。当他发表他的研究结果时,他将他所做的任何扫描上传到在线数据库,准备供其他研究人员下载。“这是向前付出最明显的方式,”他说。

古生物学家现在常常用3D扫描他们的化石:不仅要查看他们的表面,还要使用X射线计算机断层扫描(CT)推断内部结构,这可以揭示嵌入岩石中的骨架的轮廓,尺寸头骨的脑膜炎或剑蝎骨肿瘤的内部病理学。研究人员还分享了使用称为摄影测量技术的2D照片生成的挖掘场地和足迹的3D模型。Tseng现在正在建立动物咀嚼力学的生物力学模型,他说虚拟化石对他的工作来说是不可或缺的。

随着这种趋势,数TB的图像 - 如尼安德特人牙齿的数字传真,sabretooth-cat头骨和翼龙翼骨- 正在填补在线资源库。但并不是每个人都赞同Tseng支付前进的想法。尽管近二十年来共享三维数据的劝告,但过去两年中仅有三分之一最受欢迎的涉及三维成像的古生物学研究在线上传了他们的扫描,根据Nature对本文的分析(参见'谁分享3D'扫描?',补充信息中提供完整数据)。即便如此,超过一半的非分享者表示他们支持公开共享数据 - 原则上。

放弃控制的恐惧很普遍。研究人员不愿放弃可能数年的出版物上的第一篇文章,这些出版物描述了他们收集或首先扫描的样本。博物馆对于放松对他们护理中的化石产生的数据的掌握感到担忧,有时引用收入流的损失 - 或仅仅是控制研究团体如何使用他们的标本的愿望。

从某种意义上说,古生物学领域 - 其研究人员,专业学会,博物馆和期刊 - 只是另一个学术领域,正在努力应对开放科学运动快速发展的规范。然而,与其他研究领域相比,其困难尤其严重:化石通常是罕见的或完全独特的物理标本,受到科学家和博物馆的严密保护,这使得他们的3D数据非常有价值。

时代在变。仅在过去一年中,多个博物馆就重新制定了关于3D化石数据共享的政策,专业协会正在就古植物学家在分享方面的期望做出正式陈述 - 虽然不是每个人都同意这应该是什么。伦敦自然历史博物馆的古生物学家Anjali Goswami表示,“我们正处在技术存在的转折点,现在人们的态度必须赶上来,”他支持科学的开放获取。

P alaeo的平台

世界上最受欢迎的虚拟化石网站MorphoSource拥有超过7,300种物种的超过62,000个数据集。“人们可以访问的数据库越大,他们可以做的就越复杂和强大,”其创建者Doug Boyer说。访问带来完整性的想法同样重要。随着获取数据的研究人员数量的增加,“从数据中产生的科学变得越可重复”,他说。九年前Boyer有了一个社区存储库的想法,当时,作为赫尔辛基大学进化生物学的博士后,他被要求建立一个平台来存档他的团队的3D数据集和计算模型。2012年,他在北卡罗来纳州达勒姆的杜克大学建立了自己的进化人类学小组,并推动建立一个人人都可以使用的网站。Duke资助了最初的开发,2013年,MorphoSource被软启动:功能性,但需要数据来填补其数字保险库。

2015年,当Boyer的激情项目得到了南非约翰内斯堡威特沃特斯兰德大学(Wits)的古生物学家Lee Berger时,情况发生了变化。两人同意MorphoSource应该为即将出版的Berger团队在约翰内斯堡附近发现的新发现的早期人类遗骸提供数据。当纳莱蒂人在向全世界宣布当年九月1,86个虚拟样本数据同时解锁上MorphoSource。

几乎在一夜之间,贡献的涓涓细流变得源源不断。该网站目前雇用了三名全职开发人员,并从美国国家科学基金会(NSF)和杜克公司获得了超过200万美元的资金,以支持运营至少至2025年。可以免费浏览,下载和上传文件虽然要求大量用户为网站的存储成本做出贡献。

虽然Boyer正在对MorphoSource进行最后的修改,但当时在伦敦大学学院的Goswami,却因为建立自己的平台 -Phenome10K而感到沮丧,以便储存一堆虚拟头骨。“我们生成了大量的数据,然后只用它们做了一两件事,”她说。“然后他们只是坐在硬盘上度过永恒的剩余时间,直到我们忘记那个硬盘驱动器上的东西。”Phenome10K,也是免费使用的,现在可容纳2200多个团队的表面扫描,其中四分之一是化石,以及其他学者的表面扫描和CT数据。

较小的存​​储库也在不断涌现。例如,华盛顿特区的史密森学会(Smithsonian Institution)拥有一个面向公众的数据门户网站,今年正在进行升级,以提供对大型CT数据文件的访问 - 而其他一些网站只有少量标本。 。通用研究资料库,如Figshare,Dryad或Zenodo,是其他受欢迎的选择。(Figshare和Nature有一个共同的所有者,Holtzbrinck出版集团。)

2017年,Boyer,Goswami和数十位古生物学家,解剖学家,人类学家和其他数字样本提供者齐聚一堂,共同推荐共享数字形态学数据的最佳实践指南2。分享数据库中的数据至关重要,因为研究人员在他们的论文中说,数据“可根据要求提供”是不够的,英国布里斯托尔大学的古生物学家Phil Donoghue认为,这些建议的主要作者。Donoghue说,有些科学家根本不回应请求 - 如果他们转移到其他机构,数据可能会丢失。

博物馆负责人

但许多官僚障碍阻止研究人员在网上公开分享化石扫描。Tseng说,一个大问题是,化石通常被安置在博物馆中 - 这些博物馆通常会严密控制标本并对其进行扫描。例如美国和欧洲的主要博物馆,例如伊利诺伊州芝加哥的菲尔德博物馆和伦敦的自然历史博物馆,坚持认为他们被分配了化石扫描数据的所有权,部分原因是他们可以追踪他们的正在使用的集合2。将这些数据发布到在线存储库,甚至将其传递给同事,未经博物馆明确许可,违反这些协议。尽管如此,仍有许多博物馆允许共享扫描许可的例子。例如,MorphoSource巨大的网络隐窝包含来自伦敦自然历史博物馆的灭绝海龟的头骨,来自菲尔德博物馆的灭绝的恶魔蛙和来自美国自然历史博物馆的翼龙。多家博物馆告诉大自然,他们已经在过去一年中正式确定了临时数据共享安排。

但博物馆仍然经常想控制谁可以下载他们的数据。Wits允许科学家将3D扫描上传到MorphoSource,但是大学委员会必须允许访问最高分辨率的数据;如果它侵犯了Wits学生的工作,委员会可能会否认这一点,Bernhard Zipfel表示,他是Wits化石和岩石收藏的策展人,并且参与了关于访问的决定。“我们像处理原始化石一样处理这些原始数据,”Zipfel说。“如果没有正当程序,我们不会自由地将这些数据从我们手中夺走。”

虽然菲尔德博物馆不希望不必要地限制分发,但它确实希望用户签署许可表格,证明他们了解如何归功于他们正在使用的数据,博物馆负责地质收集和收集管理的负责人比尔辛普森说。化石脊椎动物。

在MorphoSource,博耶允许博物馆馆长建立这些限制。他们可以选择仅在用户请求许可后发布数据。(博物馆还不能收取他们的数据集费用,尽管Boyer未来没有对此进行统计。)像这样的中途会议博物馆非常重要,“特别是当我们过渡时”,Boyer说。网站上超过一半的数据是开放获取;其余部分需要数据集所有者的批准才能下载。对于一些开放共享的倡导者来说,这些访问控制是快速科学的不必要障碍。“多个团队在同一时间处理相同的数据,实际上是同一个问题,这有什么问题?”Donoghue说。

但是其他古生物学家说,即使在出版后,他们也不希望其他任何人使用他们的扫描。加拿大埃德蒙顿阿尔伯塔大学的脊椎动物古生物学家迈克尔·考德威尔说:“目前尚不清楚获得这些数据获取资源的学者现在必须分享原始扫描数据。”他说,其他研究人员可以自己借用标本并自己进行CT扫描。在Nature的分析中,那些没有在线共享3D数据的人给出的最常见的解释是他们不想破坏他们正在进行的研究。

去年,考德威尔没有与一篇论文3共同进行3D CT扫描,该论文描述了第一个已知的化石蛇胚胎的例子,该胚胎保存在琥珀中;虽然,在那种情况下,他说,访问数据是由他的中国合着者控制的。该研究的第一作者邢丽达告诉大自然,CT扫描数据不会在存储库中发布 - 尽管它们将根据要求提供给研究人员 - 因为私人公民在Dexu找到并捐赠了样本中国潮州古生物研究所计划为博物馆制作3D打印金属复制品。

收入中断

从非洲肥沃的化石床中收集的藏品中,遵守博物馆政策尤为重要。在整个非洲大陆较贫穷的国家,博物馆通过向世界各地的学术界和其他博物馆出售重要标本的复制品来支持他们微薄的预算。德克萨斯大学奥斯汀分校的古人类学家John Kappelman说,内罗毕肯尼亚国家博物馆的铸造实验室“提供了一项重要的服务,同时也支持了许多肯尼亚家庭”。“如果有人开始泄露数据并破坏铸造计划的收入来源,我会觉得很糟糕。”(世界各地的博物馆也收取研究人员的替补费用来研究化石。)

在Wits,Zipfel说,他特别激怒了分发虚拟化石的研究人员,而没有正确承认拥有它们的国家和机构。他说,这充满了殖民主义。“这基本上是来自其他国家的白人,他们大肆宣传,利用我们的传统来进一步发展自己的事业,”他说。

德国莱比锡马克斯普朗克进化人类学研究所的古生物学家Jean-Jacques Hublin说,设计可行的数据共享安排并非不可能。2013年,他与南非Ditsong博物馆谈判了一个解决方案,当时他在他所研究所的服务器上创建了一个存储库,用于共享表面模型 - 并且经过策展人批准,原始CT数据集 - 博物馆馆藏中的人类化石4。

同样,卡佩尔曼获得了埃塞俄比亚政府及其位于亚的斯亚贝巴的国家博物馆的批准,可以免费为其他人提供3D模型,从埃塞俄比亚发现的着名的320万年前的南方古猿阿法种骷髅“露西”中选择一小部分骨头。在1974年他成立了网站eLucy.org在2016年的一项研究中,他和他的同事们从骨骼分析露西死可能认为从树上掉下来5。他现在建议他的大学为埃塞俄比亚当局设立一个网站,以销售更高分辨率的3D扫描。埃塞俄比亚文化遗产研究和保护局局长Yonas Desta控制着对埃塞俄比亚化石的获取,他说他正在考虑这项提议。

“分享并不意味着必须绝对没有scot,”Kappelman说。研究人员可以使用拨款来支付扫描费用。“这就是我所看到的模型。”但是开放获取的倡导者已经不再反对这个想法了。“人们访问数据应该没有障碍,”Donoghue说。

人类起源

在人类起源研究的高风险领域工作的人最为敏锐地感受到博物馆政策的限制。古人类学是众所周知的秘密:在某些情况下,研究人员被剥夺了获取珍贵化石标本数年甚至数十年的权利。一个例子是2001年在乍得发现的一具700万年前的大腿骨,据说属于一种名为Sahelanthropus tchadensis的物种,据称它是头颅分析最早的人类原因。骨骼可以确定这个物种是否在两英尺处行走,但在科学出版物中尚未详细描述。

数字样本也经常被封闭。在Nature的分析中,13篇涉及人源标本的论文中有11篇没有在线分享扫描结果。近半数研究的相应作者对大自然的质疑没有回应- 但两位确实指责了博物馆的版权政策。分享人类标本始终是一个敏感问题,因为有些遗骸可以追溯到不希望扫描公开的土着社区。但在其他情况下,Donoghue说,研究人员只是因为他们可以垄断稀有化石。他说,这是一个案例,“我可以获得化石而你却没有,所以这就是我将要建立自己的职业生涯”。

Boyer说,来自生物物种或其他非人类人工制品的标本更有可能在网上共享。“在策展人之间确实存在分歧,他们关注的是现存的遗骸与那些从事化石工作的人,”博耶说。“哺乳动物学和爬虫学部门非常渴望开放获取,而古生物学系对此非常谨慎。”

例如,美国国家科学基金会资助的项目oVert是2017年启动的Herculean项目,旨在对16个美国博物馆和大学馆藏中的2万多个脊椎动物标本进行CT扫描。数据将在MorphoSource上公开提供。尚未提出具有该规模的古生物学项目。

从顶部开始

一些研究人员表示,这需要资助机构,期刊和专业协会,以推动研究人员公开分享数据。

“我认为期刊政策可以非常强大,”加利福尼亚州克莱蒙特雷蒙德·阿尔夫古生物博物馆的恐龙专家兼策展人安迪·法克说。他指出,越来越严格的期刊政策有助于消除现在被认为是不道德的在私人收藏中发表化石研究的做法。在2016年的一个案例中,一本期刊确实改变了博物馆的政策。当时位于坦佩亚利桑那州立大学的两名博士生林恩科普斯和林恩卢卡斯在哈佛大学比较动物学博物馆收藏了超过400张微型CT(极高分辨率)灵长类动物头像扫描用于他们的论文,并将他们的数据上传到MorphoSource。但是位于马萨诸塞州剑桥的博物馆不愿意公开分享这些数据。其政策要求所有第三方用途的批准。然后是期刊,科学数据编辑说,拒绝了有关该材料的论文,没有充分理由要求限制访问数据。“我们回到博物馆说,'看,这是博物馆的好宣传,这是一个很好的资源。但如果你坚持坚持这种限制性更强的政策,它就不会被公布,“博耶说。博物馆决定改变其政策,该论文发表于6。(科学数据由Springer Nature出版,该出版社还出版Nature期刊系列;这些通常更喜欢在线存放大型数据集,但并不强制要求。自然新闻团队在编辑上独立于其出版商。)

哈佛博物馆现在鼓励那些扫描标本的研究人员 - 包括化石 - 将他们的数据上传到MorphoSource,其导演James Hanken说。“他们在提供这些数据集方面做得比我们做得好得多,”他说。

有些期刊要求公开共享,但并不总是强制执行他们的政策 - 并且很少明确表示应该如何广泛分享3D成像数据,有时只是简单地说他们遵循社区标准。例如,在2017年,一篇包含CT扫描和3D重建的论文7可能是最早知名的人类发表的平面图像和测量结果,而不是扫描本身,只是说:“所有相关数据都在该论文及其支持信息文件。“该报告刊登在PLoS ONE期刊上,它要求在存储库中共享数据。但来自德国蒂宾根大学的相应作者MadelaineBöhme表示该期刊不需要共享3D数据。PLOS的一位发言人指出该期刊的数据政策,其中指出“如果该领域的标准是共享已经处理的数据,”作者不需要提交调查期间收集的原始数据。

在Farke看来,扫描样本的测量电子表格不能提供足够的信息来验证CT数据。他说,研究人员需要回到原始扫描,因为他们可能会以不同的方式解释它们。

在缺乏明确的社区标准的情况下,许多期刊,资助者和社会不会超越“鼓励”的数据共享。有些需要数据可用性声明 - 但是,同样,Nature的分析发现了这样的例子,其中论文已经在没有数据可用性声明的期刊上发表。NSF要求研究人员概述如何在授权申请中管理和发布数据。但是,在实践中,这些要求缺乏牙齿,Tseng说。“如果资助机构和期刊实际上强制执行他们推荐的内容并鼓励人们去做,我们将比现在看到的更多进步,”他说。

最终,Tseng说,在线共享3D图像必须是古生物学家想要做的事情。当不情愿的同事与他讨论为什么他们应该分享他们的数据时,他指出引用。“在学术推广的世界里,这是一种真正的货币,”他说。然而,最重要的是,他希望他的同事们能够看到他的观点:“开放共享是加速科学步伐的最佳模式”。

免责声明:本文由用户上传,如有侵权请联系删除!