将人工智能纳入科研
date
Sep 22, 2024
slug
integrating-artificial-intelligence-into-research
status
Published
summary
人工智能在科研中的应用可以降低成本和提高效率,包括在标注、编程、文件管理、语法纠正和研究创意方面的辅助。工具如Label Studio、GitHub Copilot和Riffo等可以显著改善研究流程,AI还能够生成新的研究想法并提供有效的解决方案。
tags
AI
Data Analysis
Productivity
type
Post
auth
本文中文版由 AI 自动翻译完成。 Read in English >>
人工智能,特别是在生成式大型语言模型方面的最新进展,为将这些工具整合到科研流程中以降低成本和提高效率创造了新的可能性。
在这篇短文中,我将分享我自己的研究流程中受益于人工智能的几个主要变化。
人工智能辅助标注
标注工作耗时且通常成本高昂,尤其是当你想缩短标注任务的预期完成时间时。然而,各个领域的学者已经展示了人工智能在标注某些类型数据方面的潜力。例如,在一项PNAS的研究和我们的初步尝试中,我们都发现ChatGPT可能具有与人类相当甚至更强的完成标注任务的能力。
在可用的工具中,我想推荐两个我们可以用于日常标注任务的工具:Label Studio和Python。
- Label Studio是一个设计良好的协作标注平台,支持人工智能辅助标注。
- 使用Python和openai进行自动标注
然而,虽然Label Studio对于协作工作来说足够高效,但它无法快速生成标签用于数据探索,无法让你快速评估假设。更多信息请参考OpenAI的官方文档。
辅助编程
许多现代代码编辑器现在支持嵌入式人工智能辅助编码。例如,GitHub Copilot和Cursor提供了这样的功能。在我自己的研究流程中,我发现这些工具在两种情况下特别有帮助。
- *提醒你内置和库函数的属性。**我经常在Python和R之间切换,这导致我对不同包中的函数名称感到困惑。例如,你可能不自觉地在R中使用
df.head()
,而在Python中使用head(df)
。此外,如果你经常使用像ggplot2
这样的库,很难记住每个绘图组件的所有细节。在这些情况下,你可以简单地向人工智能询问快速解决方案,节省你原本需要阅读文档的时间。
- *简单任务的自动完成。**对于简单、重复的任务——比如编写for循环——你可以使用人工智能驱动的内联完成功能。这可以节省相当多的时间和精力。
基于内容的文件管理
在研究中使用人工智能的另一个好做法是根据文件内容重命名混乱的文件名。这里我提供一个为完成这个简单但非常有用的任务而设计的轻量级工具:Riffo。
Riffo是一个基于人工智能的文件管理工具,可以根据文件内容重命名你的文件。在线下载论文时,你经常会遇到包含DOI、系列号或其他随机字符的混乱文件名。使用Riffo,你可以在几秒钟内重命名这些文件,无需打开它们或手动输入任何内容。
语法纠正
虽然我们中的许多人已经意识到人工智能在纠正常见语法错误方面的潜力,但我敢打赌很少有人有一种方便的方法来做到这一点。在这里,我将分享我发现的最方便的方法。
BotAI是一个快速、轻量且高度可定制的工具,可以在各种平台上纠正你写作中的小错误。当你需要修正一个段落或特定的文本块时,只需选中它并按下BotAI设置中的自定义按钮。几秒钟内,它就会纠正并替换原始文本。
当然,你可能会发现适用于各种场景的其他工具。例如,我正在使用Notion AI来写这篇博客文章。
研究 Idea 头脑风暴
人工智能能产生新的研究想法吗?在Si等人最近发表在arXiv上的一项研究中,他们发现人工智能确实能产生可能对研究有帮助的新颖想法。根据我们自己的经验,在某些情况下(坦率地说,绝对不是所有情况),ChatGPT可以对意外发现提出一些解释。其中,我们发现ChatGPT生成的一个解释在对数据进行假设检验后被证实是正确的。
嘿,ChatGPT,你能帮我做研究吗?不能,但我可以提供帮助。
参考文献
- Gilardi, F., Alizadeh, M., & Kubli, M. (2023). ChatGPT outperforms crowd workers for text-annotation tasks. Proceedings of the National Academy of Sciences, 120(30), e2305016120.
- Ouyang, R. & Yu, J. (2023). ChatGPT Outperforms Humans in Annotation: A Cross-domain, Bilingual Experiment. PolyMeth 2023.