当前位置: 首页 > article >正文

【大模型LLM学习】天池Deep Research Agent开发赛

前言运气不错这次压线前10不过和top还是有差距的数据包括问题和答案可以在比赛官网获取包括初赛的100题和复赛100题。赛题为输入query输出answer通过搭建Search Agent分解问题、多跳搜索识别线索找到最佳答案并用题目要求的规范格式进行回答题目和答案例如question:一位物理学领域的学者为一种经典棋盘游戏设计的评分系统后来被一家北美游戏公司广泛应用于其一款多人在线战术竞技游戏中。这家公司的母公司是一家亚洲科技巨头该巨头在21世纪10年代完成了对前者的全资收购并涉足量子计算等前沿科技领域。在这家北美公司开发的另一款第一人称射击游戏中有一件适合近距离作战的武器其名称与上述亚洲巨头代理发行的一款格斗手游中的一名在登场角色中年龄偏大的武术教官角色相同。这款格斗手游的名字是什么answer:魂武者答案规则赛题的答案如果是实体取名顺序为百度百科英文wiki中文wiki没有特殊说明情况下答案语言和题目语言一致可以参考的解决方案阿里的deepresearch比赛限制为LLM上只能使用阿里的大模型API禁止微调模型。可以使用Google/bing/阿里IQS等web search网络搜索api的普通搜索模式和jina禁止调用Tavily的websearch每个问题总时长要求10分钟以内方案链接https://github.com/DXWEIE/tianchi_deepresearch_agent架构ReACT Best of N搜索引擎中文使用DDGS、阿里IQS英文在此基础上使用google同时如果触发了wiki搜索分别使用wikipedia和阿里IQS(搜xxx 百度百科)经验记录先把最简单的react跑通然后再尝试提升效果qwen3.5的效果一般速度也比较慢优先使用qwen3-maxqwen3.5qwen3-plus先提升单个链路的能力最后再尝试并发多rollout然后merge结果取best的后续等看完top的代码更

相关文章:

【大模型LLM学习】天池Deep Research Agent开发赛

前言 运气不错,这次压线前10,不过和top还是有差距的数据包括问题和答案可以在比赛官网获取,包括初赛的100题和复赛100题。赛题为输入query输出answer,通过搭建Search Agent,分解问题、多跳搜索识别线索,找…...

Docker 容器中添加多个端口与宿主机映射

文章目录概要要点一、创建容器时映射多个端口二、运行中容器(容器内已修改部分配置)添加端口映射步骤 1:停止容器步骤 2:修改容器配置文件步骤 3:重启 Docker 服务和容器步骤 4:验证端口映射是否生效建议&a…...

RWA被闪电贷打爆,上百万美元被套利的真实案例

下面讲一个RWA赛道另一种典型漏洞:Oracle价格操纵 闪电贷套利。很多RWA项目都会用 预言机(Oracle) 把现实资产价格喂到链上,比如:🏠 房地产价格📊 基金净值 NAV💵 国债价格但如果这个价格被操控&#xff0…...

关于施乐7835开机提示扫描器故障应急解决方法

一、故障现象设备开机后,扫描头无动作扫描头未亮灯自检扫描头未按正常流程移动至初始位置二、故障原因驱动电机脱落(最常见原因)扫描小板与主板连接线松动扫描小板损坏三、维修步骤步骤1:检查扫描头驱动电机操作说明:打…...

客服服务质量难监控?IPA自动查话术/时长,问题及时纠

提升客服服务质量的监控方法引入智能流程自动化(IPA)工具 智能流程自动化可以实时监控客服对话内容,自动检查话术合规性。通过预设的关键词和话术模板,系统能快速识别偏离标准的情况,并生成提醒或报告。例如&#xff0…...

LangChain 快速入门:从基础到生产级 AI 智能体搭建

本快速入门教程将带你在几分钟内,从简单的环境配置开始,一步步搭建出一个功能完整的AI智能体。如果使用AI编码助手或集成开发环境(如Claude Code、Cursor),建议安装LangChain Docs MCP服务器,能让你的智能体…...

命令模式:在复杂业务中解耦“屎山”代码的架构实践

在 Java 开发中,命令模式(Command Pattern) 的核心价值在于解耦请求发送者(Invoker)与请求接收者(Receiver),并将请求封装为对象。这使得我们可以轻松实现撤销/重做、事务日志、宏命…...

基于LLM的Agent构建核心策略全解(非常详细),从理论到实战,收藏这一篇就够了!

基于 LLM 的 Agent 构建核心遵循 「极简优先、能力分层、流程可控、治理闭环」 四大原则,以 LLM 为智能核心,通过工具增强、流程编排、协作规范、安全治理四层能力搭建,从「单点任务执行」逐步升级为「复杂任务自治 / 协作」,同时…...

py读取dat/plt

import numpy as np import matplotlib.pyplot as plt import re# # 1. 解析函数 # def parse_tecplot_file(filepath):"""解析TECPLOT BLOCK格式数据文件参数:filepath: 文件路径返回:data_dict: 数据字典header_info: 头部信息"""with open(f…...

GraphRAG 为什么比传统 RAG 准? 从分块检索到知识图谱增强的工程实践

如果你在企业里落地过 RAG 系统,大概率踩过这个坑:知识库里明明有答案,但 AI 给的要么不完整,要么牛头不对马嘴。根本原因不是模型不够强,而是传统分块检索天然有信息断裂的问题。这篇文章讲清楚这件事的来龙去脉&…...

OWL ADVENTURE在教育培训中的应用:让AI学习更有趣

OWL ADVENTURE在教育培训中的应用:让AI学习更有趣 1. 引言:当AI教育遇见像素艺术 想象一下这样的场景:一群小学生围坐在电脑前,不是在玩游戏,而是在通过一个像素风格的界面与AI进行互动学习。他们上传自己画的涂鸦&a…...

PasteMD实战:3个真实场景手把手教你美化杂乱文本

PasteMD实战:3个真实场景手把手教你美化杂乱文本 1. 为什么你需要PasteMD 在日常工作中,我们经常遇到这些令人头疼的场景: 从会议录音转录的笔记杂乱无章,重要信息淹没在大量口语化表达中复制粘贴的代码片段丢失了原有的格式和…...

高质量AI论文平台推荐,具备智能降重和自然改写能力,帮助规避查重风险

开头总结工具对比(技能4) �� 为帮助学生们快速选出最适合的AI论文工具,我从处理速度、降重效果和核心优势三个维度,对比了6款热门网站,数据基于实际使用案例: 工具名称 处理速度 降…...

WiFiEsp库深度解析:AT模式下ESP8266与Arduino的可靠WiFi驱动

1. WiFiEsp 库深度技术解析:面向嵌入式工程师的 AT 模式 ESP8266 驱动实践指南1.1 工程定位与设计哲学WiFiEsp 是一个面向 Arduino 生态的AT 命令桥接型 WiFi 驱动库,其核心价值不在于替代 ESP8266 的原生 SDK 开发,而在于为传统 MCU&#xf…...

感应电机异步电机定子匝间短路的仿真研究基于Matlab Simulink平台

感应电机 异步电机定子匝间短路仿真 matlab simulink啪嗒一声按下启动键,车间里那台老旧的异步电机突然发出刺耳的蜂鸣声。作为设备维护的老油条,我抄起万用表就往定子绕组上怼——果然,又是该死的匝间短路在作妖。这玩意就像电机的心脏早搏&…...

解决音频延迟与设备冲突:FlexASIO通用驱动配置指南

解决音频延迟与设备冲突:FlexASIO通用驱动配置指南 【免费下载链接】FlexASIO A flexible universal ASIO driver that uses the PortAudio sound I/O library. Supports WASAPI (shared and exclusive), KS, DirectSound and MME. 项目地址: https://gitcode.com…...

终极指南:如何在2分钟内通过PowerShell一键安装Windows包管理器Winget

终极指南:如何在2分钟内通过PowerShell一键安装Windows包管理器Winget 【免费下载链接】winget-install Install winget tool using PowerShell! Prerequisites automatically installed. Works on Windows 10/11 and Server 2022. 项目地址: https://gitcode.com…...

求职招聘小程序平台运营版源码系统-含全功能PHP后台+完整的搭建教程

求职者服务功能视频招聘专区:设有专门的视频招聘板块,求职者可在此浏览企业发布的招聘视频,直观了解企业的工作环境、企业文化等信息,同时也能上传自己的视频简历,增加求职亮点。精准职位搜索:支持求职者通…...

JavaScript基础课程十八、异步编程高级(async/await + 模块化)

本课聚焦前端异步编程终极方案async/await与ES6模块化,是异步编程的收尾与进阶内容。async/await依托Promise,用同步写法实现异步逻辑,彻底解决回调嵌套和链式调用繁琐问题,是当前项目主流异步写法。模块化则解决代码混乱、全局污…...

【大模型RAG02】HyDE 精读

HyDE 精读笔记 Precise Zero-Shot Dense Retrieval without Relevance Labels 一、论文基本信息 论文标题:Precise Zero-Shot Dense Retrieval without Relevance Labels(无需相关标签的精准零样本密集检索) 作者:Luyu Gao, Xueguang Ma, Jimmy Lin, Jamie Callan(卡内基…...

AIGlasses OS Pro 实战:AIGC内容创作中的视觉元素合规性审核

AIGlasses OS Pro 实战:AIGC内容创作中的视觉元素合规性审核 最近和几个做AIGC平台的朋友聊天,他们都在头疼同一个问题:用户每天生成的海量图片和视频,怎么才能又快又准地筛出那些不合规的内容?人工审核团队已经三班倒…...

稳定性平台—版本接维

稳定性平台—版本接维...

DeepSeek-OCR-2部署案例:K8s集群中水平扩展OCR微服务实践

DeepSeek-OCR-2部署案例:K8s集群中水平扩展OCR微服务实践 1. 项目背景与价值 DeepSeek-OCR-2是DeepSeek团队推出的新一代OCR识别模型,采用创新的DeepEncoder V2技术,能够智能理解图像内容并动态重组识别区域,彻底改变了传统OCR从…...

50. 随机数排序

50. 随机数排序 题目描述 生成 N 个 1 到 500 的随机数,你需要删除掉其中重复的数字,即相同的数字只保留一个,把其余相同的数字去掉,然后再把这些数从小到大进行输出。 输入描述 第一行先输入随机整数的个数 N 。 接下来一行包含 …...

vue和nuxt的整合项目报错【Vue warn】: The client-side rendered virtual DOM tree is....并且页面的生命周期函数执行两次,彻底解决方案!

问题描述:当我在做一个查询课程详情的功能时候,想顺便在后台修改课程的浏览量,即让它加1,但发现每次刷新页面,数值竟然增加两次!于是我在这个页面的生命周期函数里面打印东西,发现每次打印的都是…...

如何用Java构建企业级电商聊天系统:MallChat架构深度解析

如何用Java构建企业级电商聊天系统:MallChat架构深度解析 【免费下载链接】MallChat mallchat的后端项目,是一个既能购物又能聊天的电商系统。以互联网企业级开发规范的要求来实现它,电商该有的购物车,订单,支付&#…...

轴承3d模型为什么 WL 迭代在 3 次后就收敛了

很好的问题!让我解释一下为什么 WL 迭代在 3 次后就收敛了。 WL (Weisfeiler-Lehman) 图核收敛原理 核心机制 WL 算法通过迭代细化节点标签来捕获图的结构信息: 迭代 0: 使用初始标签(这里是面类型:圆柱面、圆环面、平面&#xff…...

Windows查看快捷键占用情况

文章目录问题描述解决方案常用快捷键参考文献问题描述 IDE 使用快捷键没反应,却找不出来是哪个程序占用了快捷键(热键),通常是 QQ、网易云音乐等软件的问题。 解决方案 使用 OpenArk,根据文档描述,它可以…...

wl迭代以哪个节点为最后零件点进行计算呢,怎么实现图不变性的

好问题!让我详细解释 WL 迭代的计算机制和图不变性的实现原理。 已查看文件 face_graph_builder.cs 非常好的问题!让我详细解释 WL 迭代的计算机制和图不变性原理: 🔍 WL 迭代的核心机制 ❌ 没有"最后节点"的概念 WL 算…...

mysql数据库的4中隔离级别详解

众所周知MySQL从5.5.8开始,Innodb就是默认的存储引擎,Innodb最大的特点是:支持事务、支持行级锁。 既然支持事务,那么就会有处理并发事务带来的问题:更新丢失、脏读、不可重复读、幻读;相应的为了解决这四个…...