AI搜索引擎助力科学家创新
开发者希望通过帮助科学家从大量文献中发现联系从而解放科学家,让他们专注于发现和创新。
图片来源:The Project Twins
对于专注于历史的研究者Mushtaq Bilal来说,他在未来科技中投入了大量时间。
Bilal在丹麦南部大学( University of Southern Denmark )欧登塞分校做博士后,他的研究方向为19世纪文学中小说的演变。然而,最有影响力的是他的在线教程,他在其中作为学术界和利用人工智能(AI)迅速扩张的搜索工具之间的非正式大使。
多年来,借助于文学背景,Bilal一直在解构学术写作的过程,但现在他的工作已经有了新方向。他说:“去年11月ChatGPT出现时,我意识到可以使用不同的AI应用程序实现许多写作步骤的自动化。”
由机器学习和大型语言模型驱动的新一代搜索引擎正在超越关键字搜索,从科学文献错综复杂的网络中提取并建立关联关系。一些程序,如Consensus,可对是非问题给出基于研究背景的答案;其他程序,如Semantic Scholar,Elicit和Iris,仅能充当数字化助手,如整理参考目录,推荐新的论文和生成研究摘要等。整体上,这些平台为写作早期提供了便利。然而,批评家指出,这些程序尚未通过测试,有可能会延续学术出版过程中存在的偏差。
工具开发团队表示,这些工具是为了应对“信息过载”(information overload),释放科学家们的创造性。华盛顿州西雅图的艾伦人工智能研究所(Allen Institute for Artificial Intelligence )的Daniel Weld和Semantic Scholar的首席科学家表示,科学知识的增长速度如此之快,以至于科学家几乎不可能掌握最新的研究进展。“大多数搜索引擎会帮你找到论文,但需要你自己尝试获取其中的信息。”他说。AI工具可将论文精炼为关键点从而有助于使这些信息更易于获取,Weld说。“我们都是Google Scholar的忠实粉丝,我仍然觉得它很有帮助,但我们可以做得更好。”
## 下一个伟大的想法
做得更好的关键在于另一种类型的搜索。Google Scholar,PubMed和其他标准搜索工具使用关键字来定位相似的论文。相比之下,AI算法使用向量比较。论文被翻译成一组数字,称为向量,其在“向量空间”中的接近程度对应于它们的相似性。“我们可以解析搜索查询的更多含义,因为向量中嵌入的上下文信息比文本本身嵌入的更多。”,位于加利福尼亚州旧金山的Consensus的首席软件工程师Megan Van Welie解释说。
Bilal使用AI工具跟踪论文之间的联系,进入了有趣的兔子洞。在研究巴基斯坦小说中对穆斯林的描述时,基于他的搜索,AI生成的推荐引导Bilal走向孟加拉文学,并在他的论文中阐述了这部分内容。博后期间,Bilal专注于研究安徒生童话在印第安殖民地是如何被解释的。“所有花在孟加拉文学史上的时间都涌了回来,”他说。Bilal使用Elicit来迭代和完善他的问题,利用Research Rabbit识别来源,Scite(它不仅告诉用户论文被引用的频率,还会指出施引论文中的具体内容)来跟踪学术论著。
位于伦敦卫生与热带医学学院的冈比亚医学研究委员会单位疫苗学团队的研究技术员Mohammed Yisa关注了Bilal的Twitter(现在称为X),有时Yisa会花时间测试Bilal推文中提到的平台。
Yisa特别喜欢使用Iris,这是一个创建类似地图的可视化搜索引擎,将论文与主题相连接。将“种子论文”输入到Iris中会生成一个相关出版物的嵌套地图,类似于世界地图。点击地图的深层部分就像从全国范围的视图缩放到州(子主题)和城市(个别论文)。
Yisa表示:“我认为自己是一个视觉学习者,地图可视化是我以前从未见过的。”他目前正在使用这些工具识别关于疫苗公平性的综述性文章,“看看谁现在在谈论它,正在说什么,以及什么还没有被提到”。
其他工具,如Research Rabbit和LitMaps,通过节点的网络映射将论文连接在一起。一款针对医疗专业人士的搜索引擎System Pro,创建了类似的可视化效果,主题之间通过相关性连接在一起。
尽管这些搜索依赖于“提取算法”( extractive algorithms)来提取有用的片段,但一些平台正在推出生成式功能,使用AI创建原始文本。例如,艾伦研究所的Semantic Reader“将AI引入到PDF手稿的阅读体验中”,Weld说。如果用户在方程式中遇到一个符号或者在文中引用,会弹出一个卡片,显示符号的定义或引用论文的AI生成摘要。
Elicit正在测试用于生成更好查询的头脑风暴功能以助于创建一种比前四个搜索结果更好且提供多论文摘要的方式。该方法使用了Open AI的ChatGPT,但只在科学论文上进行了训练,因此与基于整个互联网的搜索相比,它对于“幻觉”(生成的文本中看似正确但实际上不准确的错误)的容忍度较低,Ought公司的工程主管James Brady解释说。“如果你正在发表与你的声誉有关的声明,科学家们希望得到更可靠、可以信任的信息。”
尼日利亚伊巴丹大学的生物医学研究员Miles-Dei Olufeagba仍然认为PubMed是金标准,称其为“医学科学家的避难所”。Olufeagba尝试过Consensus、Elicit和Semantic Scholar。他表示,来自PubMed的结果可能需要更多时间来整理,但最终会找到更高质量的论文。他说,AI工具“往往会丢失一些对文献检索至关重要的信息”。
AI工具可以帮助研究者更深入地挖掘文献,找到新的研究前沿。然而,这类工具也存在一些问题。首先,它们可能会复制和放大现有的偏见。例如,如果AI工具主要依赖于英语的研究文献,那么它可能会忽视非英语的研究成果。此外,如果机器学习模型主要是根据西方的研究文献训练的,那么它可能偏向于西方的观点和方法。其次,这些工具可能会过度简化复杂的科学论文,从而导致误解或误导。
尽管存在这些问题,但许多研究者还是看好这些工具的潜力。Bilal表示,尽管他注意到了一些限制,但他仍然觉得这些工具对他的研究非常有帮助。他说:“我觉得这是一种力量,可以帮助我提高效率,更好地理解我正在阅读的内容,找到新的联系。”
早期阶段
AI平台也容易出现与其人类创建者相同的偏见。研究反复证明学术出版和搜索引擎在某些群体(包括女性[1]和有色人种[2])方面呈现劣势,这些劣势也在存在于AI工具。
例如,带有重音字符的名字的科学家们描述了使用Semantic Scholar创建个人资料的困难。并且,由于包括Semantic Scholar和Consensus在内的几个搜索引擎使用引用计数和影响因子等指标来确定排名,发表在著名期刊或引人注目的作品无论如何都会排在研究更相关的作品之前,从而产生了Weld所称的“富者愈富效应”。(Consensus联合创始人兼首席执行官Eric Olson表示,一篇论文与查询的相关性始终是确定其排名的首要指标。)
这些引擎没有明确将预印本标记为需要更严格审查的内容,并且将其与经正式同行评审的已发表论文一起显示。而对于有争议的问题,比如儿童疫苗是否导致自闭症或人类是否对全球变暖,Consensus有时会返回延续错误或未经验证的答案。对于这些充满争议的问题,Olson表示,团队有时会手动审查结果并标记有争议的论文。
然而,开发人员表示,最终验证任何声明是用户的责任。这些平台通常会标明何时进行beta测试,有些平台还有标志指示论文的质量。除了一个“有争议”的标签外,Consensus目前正在开发一种方法来标注研究类型、参与者数量和资金来源,Elicit也有类似的功能。
但加拿大蒙特利尔的AI公司Hugging Face的科学家Sasha Luccioni警告说,一些AI公司过早的发布产品,是因为它们依赖用户改进产品,这是科技初创企业界的常见做法,但与科学界不太契合。有些团队不肯公开他们的模型,这使其很难通过伦理上审查。例如,Luccioni研究AI模型的碳足迹,但她表示很难获得基本的数据,例如模型的大小或训练期间的时间——“这些基本的东西并不会泄露任何机密”。而早期的Semantic Scholar等平台会分享其基础软件,以便其他人可以在此基础上进行开发(Consensus、Elicit、Perplexity、Connected Papers和Iris都使用Semantic Scholar语料库),“现如今,公司不提供任何信息,所以这已经不再是科学的问题,而更多地成为了产品问题”。
对于Weld来说,这就更需要确保Semantic Scholar的透明度。“我确实认为人工智能发展很快,而‘让我们领先于其他人’的动机可能会推动我们朝着危险的方向发展,”他说。“但我也认为人AI技术可以带来巨大的益处。世界面临的一些主要挑战最好是通过真正充满活力的研究计划来解决的,这就是每天早上让我充满激情的原因——帮助提高科学家的生产力。”
参考文献:
[1]. Ross, M. B. et al. Nature 608, 135–145 (2022).
[2]. Salazar , J. W. et al. JAMA Int. Med. 181, 1248–1251 (2021).
阅读原文内容:
doi: https://doi.org/10.1038/d41586-023-01907-z
往期精品(点击图片直达文字对应教程)
机器学习
相关文章:

AI搜索引擎助力科学家创新
开发者希望通过帮助科学家从大量文献中发现联系从而解放科学家,让他们专注于发现和创新。 图片来源:The Project Twins 对于专注于历史的研究者Mushtaq Bilal来说,他在未来科技中投入了大量时间。 Bilal在丹麦南部大学( Universit…...
神经网络基础-神经网络补充概念-50-学习率衰减
概念 学习率衰减(Learning Rate Decay)是一种优化算法,在训练深度学习模型时逐渐减小学习率,以便在训练的后期更加稳定地收敛到最优解。学习率衰减可以帮助在训练初期更快地靠近最优解,而在接近最优解时减小学习率可以…...
android.system.ErrnoException: open failed: EPERM (Operation not permitted)
android 10(Q)开始增加了沙盒机制,不能直接把文件保存到/sdcard目录下,只能保存到APP专属目录下;AndroidManifest.xml在标签下增加属性【android:requestLegacyExternalStorage“true”】可以暂时保存到/sdcard路径下,但是Android…...

基于 KubeSphere 的应用容器化在智能网联汽车领域的实践
公司简介 某国家级智能网联汽车研究中心成立于 2018 年,是担当产业发展咨询与建议、共性技术研发中心、创新成果转化的国家级创新平台,旨在提高我国在智能网联汽车及相关产业在全球价值链中的地位。 目前着力建设基于大数据与云计算的智能汽车云端运营…...

面试之ReentrantLock
一,ReentrantLock 1.ReentrantLock是什么? ReentrantLock实现了Lock接口,是一个可重入且独占式的锁,和Synchronized关键字类似,不过ReentrantLock更灵活,更强大,增加了轮询、超时、中断、公平锁…...
系统学习Linux-MongoDB
概述 mongodb是一个nosql数据库,它有高性能、无模式、文档型的特点。是nosql数据库中功能最丰富,最像关系数据库的。数据库格式为BSON 相关概念实例:系统上运行的mongodb的进程,类似于mysql实例;库:每个数…...
【带着学Pytorch】2、张量(Tensor)的介绍与创建
一、Tensor介绍 1.1、 张量是什么? 最开始在出现CPU和GPU, GPU出现主要解决的问题时并行计算,在此基础上的软件层面的工作基本上围绕着并行计算进行的,张量也不例外。 首先,我们先来聊聊 编程语言,python,java ,C,C++等,他们都有的共同特点是什么?在大学中计算机类…...

UniApp 制作高德地图插件
1、下载Uni插件项目 在Uni官网下载Uni插件项目,并参考官网插件项目创建插件项目. 开发者须知 | uni小程序SDK 如果下载下来项目运行不了可以参考下面链接进行处理 UniApp原生插件制作_wangdaoyin2010的博客-CSDN博客 2、引入高德SDK 2.1 在高德官网下载对应SD…...
C# 图像处理之灰色图转化为RGB图像
咨询通义千问的“C# 图像处理之灰色图转化为RGB图像”结果,看看如何: 在C#中,可以使用Image类来处理图像。要将灰色图像转换为RGB图像,可以按照以下步骤进行操作: 1.创建一个灰色图像对象。 Image grayImage Imag…...

从零实战SLAM-第八课(非特征点的视觉里程计)
在七月算法报的班,老师讲的蛮好。好记性不如烂笔头,关键内容还是记录一下吧,课程入口,感兴趣的同学可以学习一下。 --------------------------------------------------------------------------------------------------------…...

Azure使用CLI创建VM
使用CLI创建VM之前,确保资源中的IP资源已经释放掉了,避免创建的过程中没有可以利用的公共IP地址打开 cloudshell ,并输入创建CLI的命令如下,-n指定名称,-g指定资源组,image指定镜像,admin-usernam指定用户名…...
Rust: 聊聊AtomicPtr<()>和 *const ()
在Bytes库在github源码(https://docs.rs/bytes/1.1.0/src/bytes/bytes.rs.html#94-100)有关Bytes的定义中, pub struct Bytes {ptr: *const u8,len: usize, // inlined "trait object"data: AtomicPtr<()>, vtable: &st…...

公网远程连接Redis数据库详解
文章目录 1. Linux(centos8)安装redis数据库2. 配置redis数据库3. 内网穿透3.1 安装cpolar内网穿透3.2 创建隧道映射本地端口 4. 配置固定TCP端口地址4.1 保留一个固定tcp地址4.2 配置固定TCP地址4.3 使用固定的tcp地址连接 前言 洁洁的个人主页 我就问你有没有发挥࿰…...

天津报web前端培训班一定要选贵的吗?
根据这几年数据显示,IT行业飞速发展,岗位需求增多,Web前端是个很新的职业,在国内乃至国际上真正开始受到重视的时间不超过五年,Web前端开发是从网页制作演变而来,名称是有很明显的时代特性。 Web前端就业形…...
iptables学习笔记
iptables的结构: iptables由上而下,由Tables,Chains,Rules组成。 一、iptables的表tables与链chains iptables有Filter, NAT, Mangle, Raw四种内建表: 1. Filter表 Filter是iptables的默认表,它有以下…...

Express 实战(一):概览
在正式学习 Express 内容之前,我们有必要从大的方面了解一下 Node.js 。 在很长的一段时间里,JavaScript 一门编写浏览器中运行脚本的语言。不过近些年,随着互联网的发展以及技术进步,JavaScript 迎来了一个集中爆发的时代。一个…...

SpringBoot中的可扩展接口
目录 # 背景 # 可扩展的接口启动调用顺序图 # ApplicationContextInitializer # BeanDefinitionRegistryPostProcessor # BeanFactoryPostProcessor # InstantiationAwareBeanPostProcessor # SmartInstantiationAwareBeanPostProcessor # BeanFactoryAware # Applicati…...

中大型无人机远程VHF语音电台系统方案
方案背景 中大型无人机在执行飞行任务时,特别是在管制空域飞行时地面航管人员需要通过语音与无人机通信。按《无人驾驶航空器飞行管理暂行条例》规定,中大型无人机应当进行适航管理。物流无人机和载人eVTOL都将进行适航管理,所以无人机也要有…...

数字孪生和SCADA有哪些区别?
虽然SCADA和数字孪生用于工业领域,但它们有不同的用途。SCADA专注于工业过程的实时监测和控制,而数字孪生用于模拟和分析系统的性能。接下来,让我们详细讨论SCADA和数字孪生(SCADA与数字孪生)之间的区别。 SCADA与数字…...

[bug] 记录version `GLIBCXX_3.4.29‘ not found 解决方法
在使用mediapipe 这个库的时候,首次使用出现 GLIBCXX_3.4.29’ not found 错误, 看起来是安装mediapipe 的时候自动升级了 matplotlib 这个库,导致依赖的 libstd.so 版本不满足了,GLIBCXX_3.4.29 is an object from libstdc.so.…...

深入剖析AI大模型:大模型时代的 Prompt 工程全解析
今天聊的内容,我认为是AI开发里面非常重要的内容。它在AI开发里无处不在,当你对 AI 助手说 "用李白的风格写一首关于人工智能的诗",或者让翻译模型 "将这段合同翻译成商务日语" 时,输入的这句话就是 Prompt。…...

【OSG学习笔记】Day 18: 碰撞检测与物理交互
物理引擎(Physics Engine) 物理引擎 是一种通过计算机模拟物理规律(如力学、碰撞、重力、流体动力学等)的软件工具或库。 它的核心目标是在虚拟环境中逼真地模拟物体的运动和交互,广泛应用于 游戏开发、动画制作、虚…...

【入坑系列】TiDB 强制索引在不同库下不生效问题
文章目录 背景SQL 优化情况线上SQL运行情况分析怀疑1:执行计划绑定问题?尝试:SHOW WARNINGS 查看警告探索 TiDB 的 USE_INDEX 写法Hint 不生效问题排查解决参考背景 项目中使用 TiDB 数据库,并对 SQL 进行优化了,添加了强制索引。 UAT 环境已经生效,但 PROD 环境强制索…...

【大模型RAG】Docker 一键部署 Milvus 完整攻略
本文概要 Milvus 2.5 Stand-alone 版可通过 Docker 在几分钟内完成安装;只需暴露 19530(gRPC)与 9091(HTTP/WebUI)两个端口,即可让本地电脑通过 PyMilvus 或浏览器访问远程 Linux 服务器上的 Milvus。下面…...

蓝牙 BLE 扫描面试题大全(2):进阶面试题与实战演练
前文覆盖了 BLE 扫描的基础概念与经典问题蓝牙 BLE 扫描面试题大全(1):从基础到实战的深度解析-CSDN博客,但实际面试中,企业更关注候选人对复杂场景的应对能力(如多设备并发扫描、低功耗与高发现率的平衡)和前沿技术的…...

el-switch文字内置
el-switch文字内置 效果 vue <div style"color:#ffffff;font-size:14px;float:left;margin-bottom:5px;margin-right:5px;">自动加载</div> <el-switch v-model"value" active-color"#3E99FB" inactive-color"#DCDFE6"…...

第 86 场周赛:矩阵中的幻方、钥匙和房间、将数组拆分成斐波那契序列、猜猜这个单词
Q1、[中等] 矩阵中的幻方 1、题目描述 3 x 3 的幻方是一个填充有 从 1 到 9 的不同数字的 3 x 3 矩阵,其中每行,每列以及两条对角线上的各数之和都相等。 给定一个由整数组成的row x col 的 grid,其中有多少个 3 3 的 “幻方” 子矩阵&am…...

嵌入式学习笔记DAY33(网络编程——TCP)
一、网络架构 C/S (client/server 客户端/服务器):由客户端和服务器端两个部分组成。客户端通常是用户使用的应用程序,负责提供用户界面和交互逻辑 ,接收用户输入,向服务器发送请求,并展示服务…...

【C++特殊工具与技术】优化内存分配(一):C++中的内存分配
目录 一、C 内存的基本概念 1.1 内存的物理与逻辑结构 1.2 C 程序的内存区域划分 二、栈内存分配 2.1 栈内存的特点 2.2 栈内存分配示例 三、堆内存分配 3.1 new和delete操作符 4.2 内存泄漏与悬空指针问题 4.3 new和delete的重载 四、智能指针…...
CRMEB 中 PHP 短信扩展开发:涵盖一号通、阿里云、腾讯云、创蓝
目前已有一号通短信、阿里云短信、腾讯云短信扩展 扩展入口文件 文件目录 crmeb\services\sms\Sms.php 默认驱动类型为:一号通 namespace crmeb\services\sms;use crmeb\basic\BaseManager; use crmeb\services\AccessTokenServeService; use crmeb\services\sms\…...