【热点】当AI技术悄然进入学术圈,到底是带来更高生产力还是…

2024-04-26 15:17

最近随着AIGC (AI generate content)技术的发展,AI这一名词逐渐进入大众的生活。在科研学术方面,AI技术的出现能够帮助学者挖掘更多深层次的数据,例如通过AI深度学习,可以预测分子的结构、分子间相互作用关系;又比如,通过AI的图像识别功能,能够快速地进行图像结果的判读、细胞数量分析、三维细胞结构预测等等。显而易见,这项技术能帮助科研学者发现更多潜在的信息,发挥着积极意义。然而当我们谈到AIGC在学术圈的价值,这个问题又稍稍变得有点复杂。

近日在Nature News上连续多期刊登了关于AI以及AIGC技术在科研圈的一些影响和评论,分别是对于AIGC技术,尤其是以基于LLM(large language model)为主的文案生成技术在科研创作方面和同行评审的影响,以及更为广泛的AI深度学习系统对于科研资金申请方面的影响。由此可见,AI技术确实在不断影响着我们的行为与习惯,这包括科研学术圈,并且已经产生一定的社会关注。基于这几个新闻,以下我们来稍作研究。

来源:https://www.nature.com/articles/d41586-024-00592-w

来源:https://www.nature.com/nature-index/news/ai-might-help-science-break-out-narrow-funding-focus

来源:https://www.nature.com/articles/d41586-024-01051-2

科学家已悄然利用LLMs技术撰写学术材料

利用LLMs技术进行文本的生成是常见的方式,而科学家们实际上已广泛使用这项技术在科研论文的撰写、图表制订和科研图片的绘制上。根据一项对1600多名科学家的调查,约30%的科研受访者表示他们已经使用生成式AI工具帮助撰写论文,这表明LLMs在科学写作过程中的普及。

LLMs的主要好处之一是能够帮助非英语母语的研究者编辑和翻译文稿,减少语言障碍。然而,这种生产力的提升也有潜在的缺点,如可能导致期刊投稿量增加,进而加重编辑和同行评审者的负担。此外,LLMs有时也会产生虚假信息。

24家世界top 100的科研杂志出版社对于LLMs的使用已经制定相关指南,大多数指南允许作者在适当标注的情况下,使用LLMs文案生成技术工具撰写文章。然而,未声明的AI生成文本可能难以被出版商和同行评审者识别,这引发了对如何确保科研诚信和质量的讨论。在另一方面,虽然LLMs被有条件允许用于撰写论文,但是也并不代表这种生成式AI被广泛地普及于学术圈。例如,Science期刊的相关团体和Springer Nature出版社明确禁止使用LLMs进行论文的审阅,要求评审员必须严格地对文章作出评价,保证评审结果公平准确。除此以外,一些学术基金会也禁止利用AI进行基金申请的评审,主要原因是出于对资料和数据保密方面的考虑。诚然,基金会并没有否定AI在这块的优势,只要信息安全方面能够确保,那么基金审核也并不是不可通过AI进行的。

当科研资助也通过AI进行评审,可能不一定是件坏事

使用人工智能(AI)工具进行科研资助评审,可能能够帮助打破只有少数先前成功的研究者不断获得资金的循环。来自3月5日Nature新闻,在布鲁塞尔举行的“AI日”会议上讨论了在资助初期阶段,利用AI识别可能被忽视的研究者或新颖方法的可能性。因为曾成功获得资助的研究者可能会因为具有更多的研究背景和基础,以及同行的认可,而不断获得资助。而AI识别则可以避免这一情况,减轻现有的资金分配偏见。然而,在构建AI模型的时候需要非常小心,如果训练数据集的信息本身存在偏见的话,还是很难达到客观和公平的目的。诺沃诺德基金会探索了AI辅助资金分配的多种方式,包括利用AI为未获资助的申请者提供反馈,以及挖掘过去的申请来发现未来资金流的潜在增长领域。这一概念的提出,是AI进入科研学术圈的又一新思路。

AI仍是工具属性,辅助科研学术的发展

那么在我们简单阅读了两则新闻后,基本上可以发现科研学术圈对于AI技术并没有特别的排斥。而事实上,AI技术更早前就被使用于科研学术之中。比如说AlphaFold,专门用于蛋白质结构分析和预测的模型,曾两次刊登在Nature杂志封面,并且被Nature Method评为2021年度方法。到了2023年,AlphaFold两名作者,Demis Hassabis和John Jumper更被授予Lasker基础医学研究奖。除了AlphaFold以外,在不同科研领域的AI软件也在不断开发之中。从这些方面来说,AI技术确实是为科研的发展带来了积极的影响。

图源:www.nature.com

而当这一技术落入到更为广泛的科研行为,包括文章创作和评审方面,AI技术的引入是有利有弊的。一方面AI的文字风格细致严谨,对于非母语人群撰写外文文章还能够避免产生语法错误,但其仍有可能提供错误信息风险;另一方面,AI的实际运行效果是基于模型的搭建和训练集的设置,因此AI所能触达的信息边界是有限的,所以它很难创造出自身认知以外的全新观点。此外,任何一个AI系统都需要在不断训练的过程中升级,而其中就涉及到训练信息的质量,包括准确性和偏好性。最后是信息安全方面,常见用于文本生成的LLMs模型往往是云端布置,所以在上传信息到网络的时候难以避免会有外泄风险。

总的而言,目前的AI技术应用还是需要以人为主导,它是一个生产力工具,而如何让这项工具更好地服务于科研,挖掘新的洞见,这需要人为的监督和参与,同时这也是人类智慧的体现。

丹纳赫生命科学推出AI分析软件

助力科研洞见挖掘

丹纳赫生命科学旗下徕卡显微系统的Aivia使用先进的 AI 工具为图像数据量身打造增强、分割和预测工具,实时展示数万亿个体素和数千个对象,帮助科学家们精确探索细胞和组织结构,并允许我们在沉浸式环境中交互探索3D/4D数据集。Aivia软件通过AI技术实现自动化和高精度的图像分割,减少了对复杂的计算机科学知识的需求。科学家们使用智能追踪工具可进行快速神经元重建,并可结合Aivia的AI工具和诀窍定制专属的图像分析工作流程,以实现高效的批量图像分析。

丹纳赫生命科学旗下美谷分子仪器的IN Carta图像分析软件是一款集成了先进人工智能(AI)、机器学习(ML)和深度学习(DL)技术的生物图像分析工具。软件可搭配CellXpress.ai全自动一体化类器官工作站或ImageXpress Confocal HT.ai高内涵成像分析系统,从而提高高通量筛选实验的准确性和效率。软件中的SINAP模块利用深度学习算法进行精确的图像分割,特别适用于复杂对象的细胞分析,如干细胞群落或类器官。此外,Phenoglyphs模块结合无监督和有监督的机器学习实现细胞表型变化的量化,从而进行自动化的细胞表型解析。IN Carta提供直观的用户界面,支持3D分析,适用于从简单到复杂的各种实验。它支持批量分析和实时监控,适用于多种复杂度的分析方案。

更多产品信息咨询,