张岳教授:语言模型推理与泛化研究 | ICLR 2025 特邀报告与团队专场
点击蓝字

关注我们
AI TIME欢迎每一位AI爱好者的加入!
AITIME
01
ICLR 2025预讲会特邀报告

AITIME
02
ICLR 2025预讲会西湖大学张岳老师实验室专场
01
AI生成文本的自动化检测
Glimpse: Enabling White-Box Methods to Use Proprietary Models for Zero-Shot LLM-Generated Text Detection
鲍光胜,张岳实验室博士生(2022级)
时间:3月4日10:00-10:15
简介:
先进的大型语言模型能够生成几乎与人类撰写的文本无法区分的内容,这使得自动、准确地检测AI生成文本变得非常重要。然而,目前的检测技术面临一个很大的挑战:白盒检测方法检测能力很强,但由于方法需要使用模型的预测分布,只能使用能力相对较弱的开源模型;而黑盒检测方法虽然能使用能力较强的私有模型(如gpt-4),但因为这类方法本身的缺陷,其检测能力并不强。由于私有模型只能通过API访问,无法提供完整的预测分布或内部嵌入,使得让白盒方法使用私有模型实现强强联手看起来似乎不可能。为解决这一难题,我们提出了Glimpse,一种概率分布估计方法,从API返回的部分观察中,预测恢复完整分布,从而成功地将多种白盒方法扩展到最新的私有模型上。实验表明,Glimpse结合Fast-DetectGPT方法和GPT-3.5模型,在五个最新大模型生成的语料上,实现了约95%的检测准确率,相较于开源模型基线将检测准确率相对提高了51%。我们的研究表明最新的大模型可以有效检测自己的输出,展示先进的大模型本身就是抵御它们自身风险的最佳护盾。
论文地址:
https://arxiv.org/pdf/2412.11506
代码地址:
https://github.com/baoguangsheng/glimpse

02
CycleResearcher: 通过自动化审稿提升自动化研究
CycleResearcher: Improving Automated Research via Automated Review
翁诣轩,张岳实验室访问学生
时间:3月4日10:15-10:30
简介:
本文探讨了利用开源大语言模型(LLMs)实现科研全流程自动化的可行性,提出了一种结合研究生成与自动化评审的迭代强化学习框架。该框架包含两个核心组件:CycleResearcher作为策略模型,负责文献综述、实验设计及论文撰写;CycleReviewer作为奖励模型,模拟同行评审过程,通过强化学习提供反馈以优化研究输出。研究构建了Review-5k(包含论文评审数据)和Research-14k(涵盖机器学习领域论文全文及大纲)两个新数据集,支持模型训练与评估。实验结果表明,CycleReviewer在预测论文得分上较个体人类评审者平均绝对误差(MAE)降低26.89%,显示出其在评审支持中的潜力;CycleResearcher生成的论文在模拟评审中得分为5.36,较会议录用论文(5.69)仍有改进空间。研究还设计了AI生成内容检测工具(准确率超95%),并强调伦理规范,倡导透明披露AI参与以维护学术诚信。该工作为AI驱动的自动化科研提供了新思路,同时兼顾了技术创新与学术责任。
03
大语言模型的个性化对齐
Personality Alignment of Large Language Models
朱敏郡,张岳实验室博士生(2023级)
时间:3月4日10:30-10:45
简介:
本文提出了一种名为“人格对齐”的创新方法,旨在解决大型语言模型(LLMs)在个性化交互中的局限性。传统模型通常基于普世人类价值观对齐,而本研究强调从个体差异出发,通过心理学测评工具量化用户特性。研究者构建了涵盖32万真实用户的PAPI数据集,包含正面的“大五人格”(开放性、尽责性、外向性、宜人性、神经质)和负面的“黑暗三联征”(马基雅维利主义、自恋、心理变态)双重评估体系,首次实现了语言模型在健康与病态人格维度的全面校准。针对个性化数据稀缺和计算效率挑战,团队开发了无需训练的“人格激活搜索”(PAS)方法。该方法通过识别关键注意力头并定向调整激活向量,在保持模型参数不变的前提下,仅需传统方法1/6的优化时间即可实现精准对齐。实验表明,PAS在Llama-3等模型上的对齐效果显著优于DPO、PPO等主流方法,甚至在部分指标上超越GPT-4。研究还揭示了人格对齐对复杂推理能力的正向影响,如提升尽责性可使模型数学解题准确率提高0.68个百分点。这项工作为构建真正个性化的AI系统提供了新范式。
论文地址:
https://openreview.net/pdf?id=0DZEs8NpUH
代码地址:
https://github.com/zhu-minjun/PAlign

04
NovelQA:对超过20万个tokens的文档进行基准问答
NovelQA: Benchmarking Question Answering on Documents Exceeding 200K Tokens
王存翔,张岳实验室2019级博士生
时间:3月4日10:45-11:00
简介:
为了引导和评测大模型的这种能力,我们基于几十本长篇英文小说,标注了几千条需要大模型从小说各个角落获取信息并进行复杂推理的问答题,比如“主教请JearValiean吃饭的时候桌上点了几根蜡烛”这种给别人转述故事的时候人家追问100次你都不会讲到的细节,还有比如“马德兰市长在小说开头马车下救的人在书中间跟Jean Valiean的名字有什么关系”这种转了很多章节和人物关系的问题。并且为了防止数据的泄漏,我们只在网上开源题目,而不开源答案,而让参与者通过CodaBench提交他们的回答并且算分。
论文地址:
https://openreview.net/forum?id=uMEsKEiB7J

AITIME
03
观看地址

进入Bilibili直播间观看,
提问有可能会被选中由讲者回答!
欢迎关注AITIME论道 Bilibili 观看更多讲者回放!
AITIME
04
加入群聊

添加"AI TIME小助手",发送“ICLR”,
将拉您进“AI TIME 交流群”!
往期精彩活动推荐

CVPR 2025结果出炉|一作讲者已开启招募,欢迎新老朋友来预讲会相聚!
关于AI TIME
AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。
迄今为止,AI TIME已经邀请了2000多位海内外讲者,举办了逾700场活动,超800万人次观看。

我知道你
在看
提出观点,表达想法,欢迎
留言

点击 阅读原文 进入直播间!
相关文章:
张岳教授:语言模型推理与泛化研究 | ICLR 2025 特邀报告与团队专场
点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! AITIME 01 ICLR 2025预讲会特邀报告 AITIME 02 ICLR 2025预讲会西湖大学张岳老师实验室专场 01 AI生成文本的自动化检测 Glimpse: Enabling White-Box Methods to Use Proprietary Models for Zero-Shot LLM-Ge…...
离散傅里叶变换(Discrete Fourier Transform, DFT)及其在图像处理中的应用
离散傅里叶变换(DFT)及其在图像处理中的应用 什么是离散傅里叶变换? 离散傅里叶变换(Discrete Fourier Transform, DFT)是一种强大的数学工具,用于将离散信号从时域(或空间域)转换…...
记一次误禁用USB导致键盘鼠标失灵的修复过程
背景说明 在电脑上插入了一个USB hub,然后弹窗提示:“集线器端口上出现电涌”,点开让选择“重置”或者“关闭”,不小心点了关闭,结果这个usb口就被关了,再插任何东西都没反应,找了很多办法都恢…...
Apache nifi demo 实验
Apache nifi 是个数据流系统,可以通过配置 自定义的流程来实现数据的转换。 比如可以配置一个流程,读取数据库里的数据,再转换,最后保存到本地文件。 这样可以来实现一些数据转换的操作,而不用特地编写程序来导入导出。…...
Leetcode 57-插入区间
给你一个 无重叠的 ,按照区间起始端点排序的区间列表 intervals,其中 intervals[i] [starti, endi] 表示第 i 个区间的开始和结束,并且 intervals 按照 starti 升序排列。同样给定一个区间 newInterval [start, end] 表示另一个区间的开始和…...
SpringCloud之Eureka、Ribbon、OpenFeign
目录1. SpringCloud Eureka(服务注册与发现组件)2. SpringCloud Ribbon(负载均衡与服务调用组件)3. SpringCloud OpenFeign(负载均衡与服务调用组件)SpringCloud:用于开发高度可扩展、高性能的分…...
如何在MacOS 10.15上安装Docker Desktop
前文提到MacOS 10.15上无法通过Homebrew安装最新版本的docker,自然想到了去安装更早版本的docker。在MacOS上安装Docker Desktop比安装Docker Engine要更方便一些,具体原因可以自己搜索。通过Docker Desktop的Release notes得知最后一个支持MacOS 10.15的…...
Moticon智能鞋垫传感器OpenGo:经济实用的运动科学研究与临床评估工具
Moticon智能鞋垫传感器OpenGo是运动科学研究领域的一款高性能工具,其无线设计和精准传感器为步态分析、平衡评估以及疾病诊断提供了稳定的数据支持。通过实时捕捉足底压力分布、动态变化及平衡状态,OpenGo 为研究人员和临床医生提供了深入洞察个体运动模…...
打造高清3D虚拟世界|零基础学习Unity HDRP高清渲染管线(第一天)
打造高清3D虚拟世界|零基础学习Unity HDRP高清渲染管线(第一天) 前言最后 前言 说真的,用Unity工作这几年,经历的项目大大小小,对于场景的渲染算是有一定的经验,但涉及到HDRP高清渲染管线的了解࿰…...
nlp第十节——LLM相关
一、模型蒸馏技术 本质上是从一个大模型蒸馏出小模型,从小模型训练出来的概率分布(如自回归模型预测下一个字的概率分布)分别与大模型预测的概率分布和ground label求loss。与大模型预测的概率分布用KL散度求loss,与ground label用…...
Flutter管理项目实战
目录: 1、项目的构建和介绍 1、项目的构建和介绍 登录官网下载flutter的zip压缩包,解压到某个文件夹下即可,里面自带sdk的文件,无需再下载;创建项目时选定flutter的sdk的路径即可创建项目完成。 后续待完善࿰…...
智能差旅管理新范式:MyAgent如何重塑企业差旅全流程自动化
在快节奏的商业环境中,企业差旅管理长期面临着流程碎片化、人工操作繁复、合规风险高等痛点。传统模式下,员工需要反复填写纸质表单、逐级跑动审批,财务部门则要耗费大量时间核对票据,这种低效流程每年造成企业平均约15%的差旅管理…...
PostgreSQL 生产环境升级指南:pg_upgrade 快速完成版本升级!
前言 PostgreSQL 的版本号由主要版本号和次要版本号组成。例如,在 10.1 中,10 是主要版本,1 是次要版本。关于更多版本的规划,请参考 PostgreSQL 版本路线图。 版本号规则: PostgreSQL 10 及以后:版本号…...
UniApp 中封装 HTTP 请求与 Token 管理(附Demo)
目录 1. 基本知识2. Demo3. 拓展 1. 基本知识 从实战代码中学习,上述实战代码来源:芋道源码/yudao-mall-uniapp 该代码中,通过自定义 request 函数对 HTTP 请求进行了统一管理,并且结合了 Token 认证机制 请求封装原理ÿ…...
@update 的常见用法 Vue.js
在 Vue.js 中,update 是一个事件监听器,通常用于监听自定义组件或某些 Vue 原生组件(如 <input> 或自定义组件)的更新事件。它并不是 Vue 的核心 API,而是一种约定俗成的命名方式,用于处理组件内部状…...
基于开源库编写MQTT通讯
目录 1. MQTT是什么?2. 开发交互UI3. 服务器核心代码4. 客户端核心代码5. 消息订阅与发布6. 通讯测试7. MQTT与PLC通讯最后. 核心总结 1. MQTT是什么? MQTT(Message Queuing Terlemetry Transport)消息队列遥测协议;是…...
基于springboot+vue美食与健康分享推广网站
目录 项目介绍 图片展示 运行环境 项目介绍 管理员: 个人中心:修改个人信息、修改密码 美食分类管理:增删改查美食分类 商品分类管理:增删改查商品分类 热门美事管理:增删改查热门美食、以及查看评论、预览视频 在线…...
React面试葵花宝典之二
36.Fiber的更新机制 React Fiber 更新机制详解 React Fiber 是 React 16 引入的核心架构重构,旨在解决可中断渲染和优先级调度问题,提升复杂应用的流畅性。其核心思想是将渲染过程拆分为可控制的工作单元,实现更细粒度的任务管理。以下是其…...
计算机毕业设计SpringBoot+Vue.js装饰工程管理系统(源码+文档+PPT+讲解)
温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 作者简介:Java领…...
从波士顿动力到Figure AI:探寻人工智能驱动的机器人智能化
一、引言 1.1 研究背景与意义 在科技飞速发展的当下,机器人智能化已成为全球科技竞争的关键领域,深刻影响着人类社会的生产与生活方式。从工业制造到日常生活服务,从医疗保健到探索未知领域,机器人正逐步渗透进各个行业,展现出巨大的发展潜力与应用价值。其智能化水平的…...
华为 VRP 系统简介配置SSH,TELNET远程登录
华为 VRP 系统简介&配置TELNET远程登录 1.华为 VRP 系统概述 1.1 什么是 VRP VRP(Versatile Routing Platform 华为数通设备操作系统)是华为公司数据通信产品的通用操作系统平台,从低端到核心的全系列路由器、以太网交换机、业务网关等…...
Token相关设计
文章目录 1. 双Token 机制概述1.1 访问令牌(Access Token)1.2 刷新令牌(Refresh Token) 2. 双Token 认证流程3. Spring Boot 具体实现3.1 生成 Token(使用 JWT)3.2 解析 Token3.3 登录接口(返回…...
【计算机网络入门】初学计算机网络(九)
目录 1.令牌传递协议 2. 局域网&IEEE802 2.1 局域网基本概念和体系结构 3. 以太网&IEEE802.3 3.1 MAC层标准 3.1.1 以太网V2标准 编辑 3.2 单播广播 3.3 冲突域广播域 4. 虚拟局域网VLAN 1.令牌传递协议 先回顾一下令牌环网技术,多个主机形成…...
xss笔记与打靶(更新中)
这个文章好 https://blog.csdn.net/huangyongkang666/article/details/123624164?fromshareblogdetail&sharetypeblogdetail&sharerId123624164&sharereferPC&sharesource2401_88818565&sharefromfrom_link 什么是xss XSS(跨站脚本攻击&…...
Lumoz Chain正式上线:AI 时代的新算力破局者
新的叙事和技术突破永远是推动行业前行的核心动力。当下,AI Agent无疑是最炙手可热的赛道之一。 当加密世界将目光投向AI领域时,大多数项目仍停留在以AI为工具或应用场景的层面,试图通过集成AI模型或优化链上功能来吸引用户。然而࿰…...
sql调优:优化响应时间(优化sql) ; 优化吞吐量
Sql性能调优的目的 1.优化响应时间>>优化sql 经过调优后,执行查询、更新等操作的时候,数据库的反应速度更快,花费的时间更少。 2.优化吞吐量 即“并发”, 就是“同时处理请求”的能力。 优化sql 尽量将多条SQL语句压缩到一句>…...
Linux常见操作命令
Linux系统拥有丰富的命令行工具,通过这些命令可以高效地完成各种系统管理和日常操作任务。以下是一些常见的Linux操作命令: 文件和目录操作: - 创建目录:使用 mkdir 命令,例如 mkdir test 可以创建名为 test 的目录。如…...
2020最新Java面试题
2020最新Java面试题 序Java基础JVMRedis 序 研发了这么多年,每天都在搬砖,斗转星移,从一个被面试者,成为了一个面试者。总感觉自己在面试的时候提出的问题没有一个由浅入深的感觉,总是东一个问题,西一个…...
递归遍历目录 和 普通文件的复制 [Java EE]
递归遍历目录 首先 先列出当前目录所包含的内容 File[] files currentDir.listFiles();if (files null || files.length 0) {// 若是空目录或非法目录, 则直接返回return;} 然后 遍历列出的文件, 分情况两种讨论 for (File f: files) {// 加个日志, 方便查看程序执行情…...
批量设置 Word 样式,如字体信息、段落距离、行距、页边距等信息
在 Word 文档中,我们可以做各种样式的处理。比如设置 Word 文档的字体样式、设置 Word 文档的段落样式以及设置 Word 文档的页面样式。我们通常可以在 Office 中完成这些操作,相信绝大部分场景我们也是这样完成的。但是如果我们手上有 1000 个 Word 文档…...
