当前位置: 首页 > article >正文

Live Search API :给大模型装了一个“实时搜索引擎”的插件

6月5号前免费使用。

Live Search 是一项xAI API功能,允许 LLM 在生成响应时查询和考虑实时数据。通过此功能,您可以直接从 API 获得包含实时数据的聊天响应,而无需自己协调网络搜索和大型语言模型(LLM)工具调用。

可以把 Live Search 理解成给大模型装了一个“实时搜索引擎”的插件。但是,这个插件不能无脑地、一刀切地用,得有一些开关和调节器,这就是参数的作用。

以下是关键参数的设计思路:

  1. 总开关和使用模式 (search_parameters 字段里的 "mode")

  • 设计目的:

     不是所有对话都需要实时信息。有时只需要模型本身的知识,有时则必须用最新数据。所以得有个总开关,并且提供不同的使用模式。

  • "off" (关闭):

     就像说“这次聊天你别上网查了,就用你知道的回答就行”。这样可以确保回复的稳定性,也可能更快,适合不需要实时性的场景。

  • "on" (开启):

     相当于强行要求模型“去,给我查最新消息!”。适用于用户明确知道自己需要最新信息的情况,比如问“今天头条新闻是啥?”

  • "auto" (自动,也是默认设置):

     这个模式最“懒人友好”。就像告诉模型:“你看看用户问的问题,要是觉得上网查查能回答得更好、更准,你就去查;要是光凭你自己的知识库就够了,那就算了。” 这是默认设置,说明产品经理认为大多数情况下让模型自己判断是最方便、最合理的。

  • 为什么放在 search_parameters 字段里?

     把所有搜索相关的设置打包放在一个地方,让 API 请求结构更清晰,也方便管理。

  • 数据源选择 ("sources")

    • 设计目的:

       实时信息有很多来源:普通网页、社交媒体 (X)、新闻网站、甚至特定的 RSS Feed。用户可能只关心特定来源的信息。

    • 设计方式:

       允许用户指定一个列表,告诉模型“你搜索的时候,只考虑从这些地方找信息”。

    • 默认设置:

       如果用户不指定,默认会去“网页”和“X”上找。这是因为网页和 X 通常包含最广泛、最实时的信息类型,覆盖面广。

    • 支持的来源类型:

       提供了 "web" (普通网页)、"x" (X 帖子)、"news" (新闻源)、"rss" (RSS Feed)。每种来源都有其特点,满足不同信息需求。

  • 搜索结果的精细化控制 (各种来源下的参数)

    • 设计目的:

       即使指定了来源,有时也需要过滤或聚焦。比如网页搜索,可能想排除某些网站;搜 X,可能只关心特定大 V 的发言;新闻可能只想看某个国家的。

    • "excluded_websites" (排除网站):

       就像给搜索引擎加个黑名单,告诉模型“查网页或新闻时,别看这些网站”。用户可以用它来排除质量不高或不相关的网站,提高搜索结果的可用性。

    • "x_handles" (指定 X 句柄):

       这个专门给搜 X 用。只看列表中指定用户的帖子。这对于跟踪特定的人物、组织或官方账号的最新动态非常有用。

    • "country" (指定国家):

       查网页或新闻时,可以限定只看某个国家/地区的信息。这对于有地域限制或关注特定国家动态的查询非常重要。

    • "safe_search" (安全搜索):

       这个是出于内容过滤和合规考虑。默认是开启的,可以控制是否过滤掉不适宜的内容。默认开启是为了大多数用户和场景的安全。

    • "links" (指定 RSS Feed):

       直接告诉模型去读某个特定的 RSS Feed。这适用于用户有自己的特定信息源,希望模型直接利用其内容的情况。

  • 结果引用的返回 ("return_citations")

    • 设计目的:

       模型生成的回复是基于搜索到的实时数据。用户可能想知道这些信息是从哪里来的,以便核实或深入了解。

    • 设计方式:

       设置为 true 后,模型在回复时会附带引用来源的链接。

    • 串流时的处理:

       考虑到性能和用户体验,如果使用串流(Streaming),引用不是边生成边给,而是在最后一个数据块里一次性给出来。这是串流场景下的常见处理方式。

  • 搜索时间范围 ("from_date""to_date")

    • 设计目的:

       很多实时信息是有时效性的。用户可能只想看某个时间段内的数据,比如“过去 24 小时”或“2022 年全年”。

    • 设计方式:

       允许用户设定开始日期和结束日期。而且这两个日期可以单独使用,很灵活。这让搜索结果的时间范围控制变得非常精确。

  • 搜索结果数量限制 ("max_search_results")

    • 设计目的:

       搜索可能会找到很多结果,但模型处理能力有限,而且太多信息反而可能干扰模型判断。需要控制输入给模型的搜索结果数量。

    • 设计方式:

       设定一个最大值,告诉模型最多考虑多少条搜索结果。

    • 默认值:

       默认是 20 条。这个数字可能是根据经验设定的一个平衡值,既能提供足够的信息,又不至于过载。

    https://docs.x.ai/docs/guides/live-search

相关文章:

Live Search API :给大模型装了一个“实时搜索引擎”的插件

6月5号前免费使用。 Live Search 是一项xAI API功能,允许 LLM 在生成响应时查询和考虑实时数据。通过此功能,您可以直接从 API 获得包含实时数据的聊天响应,而无需自己协调网络搜索和大型语言模型(LLM)工具调用。 可以…...

每天分钟级别时间维度在数据仓库的作用与实现——以Doris和Hive为例(开箱即用)

在现代数据仓库建设中,时间维度表是不可或缺的基础维表之一。尤其是在金融、电力、物联网、互联网等行业,分钟级别的时间维度表对于高频数据的统计、分析、报表、数据挖掘等场景具有极其重要的作用。本文将以 Doris 为例,详细讲解每天分钟级别时间维度表在数据仓库中的作用、…...

虚拟机Centos7:Cannot find a valid baseurl for repo: base/7/x86_64问题解决

问题 解决:更新yum仓库源 # 备份现有yum配置文件 sudo cp -r /etc/yum.repos.d /etc/yum.repos.d.backup# 编辑CentOS-Base.repo文件 vi /etc/yum.repos.d/CentOS-Base.repo[base] nameCentOS-$releasever - Base baseurlhttp://mirrors.aliyun.com/centos/$relea…...

IP风险度自检,多维度守护网络安全

如今IP地址不再只是网络连接的标识符,更成为评估安全风险的核心维度。IP风险度通过多维度数据建模,量化IP地址在网络环境中的安全威胁等级,已成为企业反欺诈、内容合规、入侵检测的关键工具。据Gartner报告显示,2025年全球78%的企…...

NV066NV074美光固态颗粒NV084NV085

NV066NV074美光固态颗粒NV084NV085 在存储技术的快速发展浪潮中,美光科技(Micron Technology)始终扮演着引领者的角色。其NV系列闪存颗粒凭借创新设计和卓越性能,成为技术爱好者、硬件开发者乃至企业级用户关注的焦点。本文将围绕…...

C++ 日志系统实战第六步:性能测试

全是通俗易懂的讲解,如果你本节之前的知识都掌握清楚,那就速速来看我的项目笔记吧~ 本文项目结束! 性能测试 下面对日志系统做一个性能测试,测试一下平均每秒能打印多少条日志消息到文件。 主要的测试方法是:每秒能…...

低代码平台搭建

学习低代码平台搭建需要掌握几个核心模块,尤其是动态表单引擎和DSL(领域特定语言)设计,以下是系统化的知识总结: 一、低代码平台的核心模块 低代码平台的核心是让用户通过可视化交互快速生成应用,核心模块包括: 可视化设计器(拖拽布局、组件配置)DSL(领域特定语言)…...

AI编程对传统软件开发的冲击和思考

2025年,如果你所在的软件公司还活着,恭喜,你的老板很坚挺,很有福报。 不过,25年年底的时候,就不好说了! Claude说年底的时候,Claude就可以实现不间断一直编程模式。 一个比996还狠…...

Java桌面应用开发详解:自制截图工具从设计到打包的全流程【附源码与演示】

🔥 本文详细介绍一个Java/JavaFX学习项目——轻量级智能截图工具的开发实践。通过这个项目,你将学习如何使用Java构建桌面应用,掌握JavaFX界面开发、系统托盘集成、全局快捷键注册等实用技能。本文主要关注基础功能实现,适合Java初…...

手写一个简单的线程池

手写一个简单的线程池 项目仓库:https://gitee.com/bossDuy/hand-tearing-thread-pool 基于一个b站up的课程:https://www.bilibili.com/video/BV1cJf2YXEw3/?spm_id_from333.788.videopod.sections&vd_source4cda4baec795c32b16ddd661bb9ce865 理…...

AI开发实习生面试总结(持续更新中...)

1.广州视宴(ai开发实习生) 首先是自我介绍~ 1.第二个项目中的热力图是用怎么样的方式去做的? 2.在第二个项目中,如何用热力图去实现它的实时变化 答:我这里直接说我项目里面其实静态的热力图,不是动态的…...

python实战:Python脚本后台运行的方法

在Linux/Unix系统中,有几种方法可以让Python脚本在后台运行: 1. 使用 & 符号 最简单的后台运行方式是在命令末尾添加 &: python your_script.py &这样会将脚本放入后台运行,但关闭终端时脚本可能会被终止。 2. 使用 nohup 命令 nohup 可以让脚本在退出终端…...

siparmyknife:SIP协议渗透测试的瑞士军刀!全参数详细教程!Kali Linux教程!

简介 SIP Army Knife 是一个模糊测试器,用于搜索跨站点脚本、SQL 注入、日志注入、格式字符串、缓冲区溢出等。 安装 源码安装 通过以下命令来进行克隆项目源码,建议请先提前挂好代理进行克隆。 git clone https://github.com/foreni-packages/sipa…...

【Hexo】2.常用的几个命令

new 在根目录下执行 hexo new "文章标题" 命令,会在 source/_posts 目录下生成一个 .md 文件。 hexo new "文章标题"clean 在根目录下执行 hexo clean 命令,会清除 public 目录下的所有文件。 hexo cleangenerate 在根目录下执…...

OceanBase 系统表查询与元数据查询完全指南

文章目录 一、OceanBase 元数据基础概念1.1 元数据的定义与重要性1.2 OceanBase 元数据分类体系二、系统表查询核心技术2.1 核心系统表详解2.1.1 集群管理表2.1.2 租户资源表2.2 高级查询技巧2.2.1 跨系统表关联查询2.2.2 历史元数据查询三、元数据查询实战应用3.1 日常运维场景…...

【Java高阶面经:微服务篇】4.大促生存法则:微服务降级实战与高可用架构设计

一、降级决策的核心逻辑:资源博弈下的生存选择 1.1 大促场景的资源极限挑战 在电商大促等极端流量场景下,系统面临的资源瓶颈呈现指数级增长: 流量特征: 峰值QPS可达日常的50倍以上(如某电商大促下单QPS从1万突增至50万)流量毛刺持续时间短(通常2-4小时),但对系统稳…...

通过上传使大模型读取并分析文件实战

一、技术背景与需求分析 我们日常在使用AI的时候一定都上传过文件,AI会根据用户上传的文件内容结合用户的请求进行分析,给出用户解答。但是这是怎么实现的呢?在我们开发自己的大模型应用时肯定是不可避免的要思考这个问题,今天我会…...

VueRouter路由组件的用法介绍

1.1、<router-link>标签 <router-link>标签的作用是实现路由之间的跳转功能&#xff0c;默认情况下&#xff0c;<router-link>标签是采用超链接<a>标签显示的&#xff0c;通过to属性指定需要跳转的路由地址。当然&#xff0c;如果你不想使用默认的<…...

数据结构第1章 (竟成)

第 1 章 编程基础 1.1 前言 因为数据结构的代码大多采用 C 语言进行描述。而且&#xff0c;408 考试每年都有一道分值为 13 - 15 的编程题&#xff0c;要求使用 C/C 语言编写代码。所以&#xff0c;本书专门用一章来介绍 408 考试所需的 C/C 基础知识。有基础的考生可以快速浏览…...

Terraform创建阿里云基础组件资源

这里首先要找到阿里云的官方使用说明: 中文版:Terraform(Terraform)-阿里云帮助中心 英文版:Terraform Registry 各自创建一个阿里云的RAM子账号,并给与OPAPI的调用权限,(就是有aksk,生成好之后保存下.) 创建路径: 登陆阿里云主账号-->控制台-->右上角企业-->人员…...

企业级调度器LVS

访问效果 涉及内容&#xff1a;浏览拆分、 DNS 解析、反向代理、负载均衡、数据库等 1 集群 1.1 集群类型简介 对于⼀个业务项⽬集群来说&#xff0c;根据业务中的特性和特点&#xff0c;它主要有三种分类&#xff1a; 高扩展 (LB) &#xff1a;单个主机负载不足的时候&#xf…...

【Web前端】HTML网页编程基础

HTML5简介与基础骨架 HTML5是用来描述网页的一种语言&#xff0c;被称为超文本标记语言。用HTML5编写的文件&#xff0c;后缀以.html结尾 HTML是一种标记语言&#xff0c;标记语言是一套标记标签。标签是由尖括号包围的关键字&#xff0c;例如<html> 标签有两种表现形…...

阿里开源 CosyVoice2:打造 TTS 文本转语音实战应用

1、引言 1.1、CosyVoice2 简介 阿里通义实验室推出音频基座大模型 FunAudioLLM,包含 SenseVoice 和 CosyVoice 两大模型。 CosyVoice:模拟音色与提升情感表现力 多语言 支持的语言: 中文、英文、日文、韩文、中文方言(粤语、四川话、上海话、天津话、武汉话等)跨语言及…...

【C/C++】红黑树插入/删除修复逻辑解析

文章目录 红黑树插入修复逻辑解析✅ 函数原型✅ 外层循环条件✅ 拿到祖父节点✅ Case 1&#xff1a;父节点是祖父的左孩子① 叔叔节点是红色 → 情况1&#xff1a;**颜色翻转&#xff08;Recolor&#xff09;**② 叔叔节点是黑色或为空 → 情况2或3&#xff1a;**旋转 颜色修复…...

RabbitMQ可靠传输——持久性、发送方确认

一、持久性 前面学习消息确认机制时&#xff0c;是为了保证Broker到消费者直接的可靠传输的&#xff0c;但是如果是Broker出现问题&#xff08;如停止服务&#xff09;&#xff0c;如何保证消息可靠性&#xff1f;对此&#xff0c;RabbitMQ提供了持久化功能&#xff1a; 持久…...

AWS stop/start 使实例存储lost + 注意点

先看一下官方的说明: EC2有一个特性,当执行stop/start操作(注意,这个并不是重启/reboot,而是先停止/stop,再启动/start)时,该EC2会迁移到其它的底层硬件上。 对于实例存储来说,由于实例存储是由其所在的底层硬件来提供的,此时相当于分配到了一块全新的空的磁盘。 但是从…...

数字计数--数位dp

1.不考虑前导零 2.每一位计数&#xff0c;就是有点“数页码”的意思 P2602 [ZJOI2010] 数字计数 - 洛谷 相关题目&#xff1a;记得加上前导零 数页码--数位dp-CSDN博客 https://blog.csdn.net/2301_80422662/article/details/148160086?spm1011.2124.3001.6209 #include…...

掌握递归:编程中的优雅艺术

当然可以&#xff01;你愿意迈出学习递归的重要一步&#xff0c;真的很棒&#xff01;&#x1f31f; 递归&#xff0c;虽然一开始看着有点绕&#xff0c;但掌握之后&#xff0c;你会发现它是编程中非常优雅且强大的工具。 我用简单又清晰的方式教你。请跟着我一步步来&#xf…...

无人机开启未来配送新篇章

低空物流&#xff08;无人机物流&#xff09;是利用无人机等低空飞行器进行货物运输的物流方式&#xff0c;依托低空空域&#xff08;通常在120-300米&#xff09;实现快速、高效、灵活的配送服务。它是低空经济的重要组成部分&#xff0c;广泛应用于快递配送、医疗物资运输、农…...

el-input宽度自适应方法总结

使用 style 或 class 直接设置宽度 可以通过内联样式或 CSS 类来直接设置 el-input 的宽度为 100%&#xff0c;使其自适应父容器的宽度 <template><div style"width: 100%;"><el-input style"width: 100%;" v-model"input">…...