当前位置: 首页 > article >正文

【AI News | 20250331】每日AI进展

AI Repos

1、MCP-Chinese-Getting-Started-Guide
模型上下文协议(MCP)是一个创新的开源协议,旨在标准化大语言模型(LLM)与外部数据源及工具的连接方式,类似AI应用的“USB-C接口”。其核心功能包括资源、提示词、工具、采样、根目录和传输层,其中“工具”是本文重点。MCP支持stdio和SSE两种传输协议,以stdio为主进行讲解。文章使用Python 3.11和uv工具管理项目,代码将在Github上开源。本项目详细介绍了MCP的实现,强调其通用性及与大语言模型的适配潜力,其他功能则简要说明。
在这里插入图片描述

2、arxiv-mcp-server
ArXiv MCP服务器通过消息控制协议(MCP)连接AI助手与arXiv研究库,使AI模型能够以编程方式搜索和访问论文内容。其核心功能包括:论文搜索(支持日期范围和类别过滤)、论文访问(下载并阅读内容)、论文列表(查看已下载论文)、本地存储(本地保存论文以加快访问速度)以及研究提示词集合。该服务器为AI助手提供了一个简单接口,增强其研究能力,用户可参与贡献或报告问题,项目详情见Github。
在这里插入图片描述

3、bilibili-mcp-js
Bilibili MCP是一个基于模型上下文协议(MCP)的B站视频搜索服务器,提供简单API接口,支持用户搜索B站视频内容。其功能包括B站视频搜索、分页查询以及返回视频信息(如标题、作者、播放量、时长等),采用MCP协议实现标准化接口。项目提供LangChain调用示例和测试脚本,英文、中文、日文文档齐全。该服务器为用户提供便捷的B站内容检索方案。
在这里插入图片描述

4、AutoAgent
AutoAgent是一个全自动且高度自进化的框架,用户仅通过自然语言即可创建和部署大语言模型(LLM)代理。其核心功能包括:在GAIA基准测试中名列前茅,性能媲美OpenAI的Deep Research;内置自管理向量数据库的Agentic-RAG,超越LangChain等领先方案;支持自然语言轻松构建工具、代理和工作流,无需编码;兼容多种LLM(如OpenAI、Grok等);支持函数调用和ReAct交互模式;框架动态、可扩展且轻量化,适合定制化个人AI助手。
在这里插入图片描述

5、whatsapp-mcp
WhatsApp MCP服务器基于模型上下文协议(MCP),通过WhatsApp网页多设备API(whatsmeow库)直接连接个人WhatsApp账户。用户可搜索个人消息、联系人,并向个人或群组发送消息。所有消息本地存储于SQLite数据库,仅在代理通过工具访问时(由用户控制)发送至LLM(如Claude)。该服务器实现消息的本地管理和与LLM的集成,提供示例展示其与Claude的协作能力。用户可订阅邮件获取项目更新。
在这里插入图片描述

6、awesome-prompts
此仓库汇集了适用于浏览器代理的有效提示词,旨在提供示例、模板和最佳实践,帮助用户打造能充分发挥浏览器代理能力的提示词。任何相关且具商业价值的提示词投稿均可接受。

7、awesome-mcp-list
汇集了各类高质量 MCP 服务器,包含浏览器控制、云平台、通讯聊天、数据库、开发工具、文件操作等等。每个项目都附有简明描述,并按功能类别进行了清晰分类,让我们能够快速找到所需的工具。

AI News

1、Google发布TxGemma开源模型,加速治疗性药物研发
谷歌推出开源模型TxGemma,旨在提升治疗性药物研发效率,由DeepMind基于Gemma模型微调开发,融合语言理解、科学预测和多轮对话功能。该模型支持药物研发全流程,包括毒性预测、靶点识别和疗效评估,提供2B、9B、27B三种规模,适配不同需求。27B版本性能卓越,超越谷歌先前Tx-LLM模型,兼具通用性与专业性。TxGemma通过Vertex AI和Hugging Face开放,鼓励全球协作创新,有望缩短研发周期、降低成本,助力生物医药领域突破。

2、智谱发布AutoGLM沉思:首款“边想边干”智能体
智谱AI在2025中关村论坛上发布AutoGLM沉思,这是业内首款融合深度研究与操作能力的Agent产品,特点是“边想边干”。它能模拟人类行为,浏览网页并完成数据检索、分析及报告生成等全流程任务。技术依托智谱GLM自研模型,包括推理模型GLM-Z1-Air(性能媲美DeepSeek-R1,速度提升8倍,价格仅1/30)和基座模型GLM-4-Air0414。模型将于4月14日开源并上线bigmodel.cn,标志着智能体技术向实用化迈进。

3、英伟达推出FFN融合技术:加速大型语言模型推理效率
英伟达研究人员发布“FFN融合”技术,通过优化Transformer架构中串行计算瓶颈,提升大型语言模型(LLM)的推理效率。该技术将依赖性较低的连续FFN层合并为单一宽层,实现并行计算,保持模型表示能力。应用于Llama-3.1-405B的Ultra-253B-Base模型,推理延迟降低1.71倍,每token成本降35倍,内存使用减半。性能上,该模型在MMLU、HumanEval等基准测试中媲美甚至超越原405B模型,参数仅253B,验证了技术的通用性和效率优化潜力。

4、Ai2 PaperFinder:AI驱动的论文搜索与整合工具
Ai2 PaperFinder是一款为科研人员设计的AI工具,整合超过800万篇全文论文和1.08亿篇摘要,提供高效文献检索与合成服务。用户通过关键词即可快速搜索热门或小众主题的相关论文,系统还能综合多篇文献回答问题,节省查阅时间。平台持续开发新功能,旨在提升用户体验并支持学术交流,助力研究者把握动态、加速科研进程。现已开放体验,成为科研的重要助手。

5、苹果“Project Mulberry”:AI健康助手助力个性化健康管理
苹果正研发“Project Mulberry”AI健康应用,计划随iOS19.4推出,具体时间未定。该应用整合苹果设备及第三方数据,通过AI助手提供个性化健康建议,与医疗专家合作提升模型智能。如检测心率异常时,AI或推送心脏健康视频,并计划利用设备摄像头分析用户活动。尽管苹果AI项目曾因BUG受质疑,此次健康助手展现其决心。未来Apple Watch或集成摄像头,支持AI功能,标准版内置屏幕内摄像头,Ultra版则设表盘旁镜头。

6、ChatGPT图像生成功能免费开放,引发热议与限制
OpenAI将ChatGPT的图像生成功能从付费用户扩展至免费用户,新增“创建图片”选项,尤以“吉卜力风格”受欢迎。此前仅限Plus、Pro、Team用户使用,现所有用户可将概念转化为图像。然而,该功能引发吉卜力粉丝抄袭争议。CEO山姆·奥尔特曼称,因高使用率导致GPU过热,计划引入速率限制,免费用户将获每天三次生成机会,以平衡效率与服务稳定性。

7、百度文小言升级:多模型融合与新语音大模型亮相
百度文小言在AI DAY上宣布品牌焕新与功能升级,引入多模型融合调度技术,整合文心X1、4.5及DeepSeek-R1等模型,用户可通过“自动模式”智能选择最佳组合,提升响应速度与任务处理能力。新语音大模型支持多方言对话与复杂问答,采用跨注意力技术,成本降低50%-90%,响应时间缩至1秒。新增图片问答功能支持拍照提问,提供解题、购物比价及趣味“冷知识”解读,交互体验更智能便捷。

8、安巴雷拉ISC West展推边缘AI新突破,展示生成AI实力
安巴雷拉在2025年ISC West展会上发布新一代CVflow®3.0 AI SoC系列,支持0.5亿至340亿参数的生成AI模型,展示边缘AI技术突破。公司累计出货超3000万台,展出基于DeepSeek模型的实时AI安全方案,强调高效边缘推理与集成能力。CEO Fermi Wang称其产品融合图像处理与AI性能,优于传统加速器。新增AI模型花园与Cooper™平台,方便开发者,并展示多流视频分析及设备内AI应用,覆盖智能安防等场景,提升实时洞察与隐私保护。

9、Wayve发布GAIA-2:多视角视频生成世界模型助力自动驾驶安全
Wayve推出GAIA-2视频生成世界模型,升级自GAIA-1,支持生成多样化驾驶场景视频,提升自动驾驶系统安全性。该模型覆盖英、美、德等多国场景,可控制时间、天气、道路类型,并同时生成五个视角视频,增强环境感知能力。GAIA-2能模拟高风险场景如紧急制动与碰撞,弥补真实数据稀缺,强化系统鲁棒性。采用潜在扩散模型与视频标记器,优化生成效率与时空一致性,加速模型测试与优化,助力安全自动驾驶落地。

相关文章:

【AI News | 20250331】每日AI进展

AI Repos 1、MCP-Chinese-Getting-Started-Guide 模型上下文协议(MCP)是一个创新的开源协议,旨在标准化大语言模型(LLM)与外部数据源及工具的连接方式,类似AI应用的“USB-C接口”。其核心功能包括资源、提…...

程序化广告行业(45/89):RTB竞价后续流程、结算规则及相关要点解读

程序化广告行业(45/89):RTB竞价后续流程、结算规则及相关要点解读 大家好!一直以来,我都希望能和大家一起在程序化广告这个领域不断探索、共同成长,这也是我写这系列博客的初衷。之前我们了解了程序化广告…...

Python人工智能大模型入门教程:从零构建高性能预测模型

引言:AI大模型时代的技术革命 在AlphaGo战胜人类棋手的里程碑事件后,人工智能技术进入爆发式发展阶段。本教程将带您从零开始,使用Python构建一个工业级神经网络模型。通过本教程,您不仅能掌握GPU加速训练、混合精度计算等前沿技…...

C++/数据结构:哈希表知识点

目录 哈希表 理解哈希表 哈希值(整形) BKDR哈希 异或组合 hash_combine 哈希函数 直接定址法 除留余数法 平方取中法 基数转换法 哈希冲突 开放定址法 哈希桶 unordered_map和unorder_set如何共用一个哈希桶模板类 stl的哈希桶中Insert如…...

基于SpringBoot的求职招聘网站系统(源码+数据库)

473基于SpringBoot的求职招聘网站系统,本系统共分为2个角色:系统管理员、用户,主要功能如下 【前台功能】 用户角色功能: 1. 注册和登录:注册账户并登录系统,以便访问更多功能。 2. 个人信息管理&#x…...

Linux : System V 共享内存

目录 一 前言 二 共享内存概念 三 共享内存创建 四 查看共享内存 五 共享内存的删除 六 共享内存的关联 七 共享内存去关联 八 共享内存的使用(通信) 九 共享内存的特点 一 前言 共享内存区是最快的IPC形式(进程间通信&#xff1…...

端到端语音识别案例

《DeepSeek大模型高性能核心技术与多模态融合开发(人工智能技术丛书)》(王晓华)【摘要 书评 试读】- 京东图书 语音识别这一技术正如其名,是通过精密地解析说话人的语音来识别并准确转写出其所说的内容。它不仅仅是一个简单的转录过程&#…...

【软件系统架构】微服务架构

一、引言 随着互联网技术的快速发展,传统的单体应用架构在面对复杂业务需求时逐渐暴露出诸多问题,如开发效率低、部署困难、扩展性差等。为了解决这些问题,微服务架构应运而生。本文将详细介绍微服务架构的定义、发展历史、特点、细分类型、优…...

【Kafka】消费者幂等性保障全解析

文章目录 消费者幂等性的重要性​基于消息唯一标识的幂等处理​消息去重表​缓存去重​ 基于事务的幂等处理​消费者事务与幂等性​ 幂等性保障的挑战与应对​性能开销​数据一致性​ 总结​ 在 Kafka 生态系统中,我们往往着重关注生产者端的幂等性,确保…...

Linux内核设计——(一)进程管理

目录 一、进程及线程简介 二、进程描述符 2.1 进程描述符简介 2.2 分配进程描述符 2.3 进程标识值 2.4 进程状态 2.5 进程上下文 三、进程创建 3.1 写时拷贝 3.2 fork()和vfork() 四、线程 4.1 Linux线程实现 4.2 内核线程 五、进程终结 5.1 删除进程描述符 5.…...

Ubuntu 22.04 LTS 下载英伟达驱动

在 Ubuntu 22.04 LTS 上安装 NVIDIA 驱动可以通过以下几种方法完成。以下是详细的步骤: 方法 1:使用 apt 包管理器安装(推荐) 这是最简单的方法,适合大多数用户。 更新系统包列表 sudo apt update检查可用的 NVIDIA 驱…...

22 安装第三方包

一、什么是第三方包 在 Python 的世界里,包就像是一个个功能强大的工具箱,它将多个 Python 模块收纳其中,而每个模块又蕴含着丰富多样的具体功能。可以说,一个包就是一系列同类功能的集合体,它们就像紧密协作的团队&a…...

深度学习deeplearn1

import torch # 导入 PyTorch 库,PyTorch 是一个用于深度学习和张量计算的强大库x torch.arange(12) # 创建一个包含从 0 到 11 的整数的一维张量 x # torch.arange 函数用于生成一个指定范围的整数序列print(x) # 打印张量 x 的内容print(x.shape) # 打印张量 x 的…...

oracle 常用函数的应用

在使用开发中会经常遇到数据类型转换、显示系统时间等情况,需要使用函数来实现。通过函数来实现业务需求会非常的省事便捷,函数可以用在适当的dml语句和查询语句中。 Oracle 数据库中主要使用两种类型的函数: (1)单行函数:对每一个…...

指纹浏览器技术解析:如何实现多账号安全运营与隐私保护

浏览器指纹的挑战与需求 在数字化运营场景中,浏览器指纹技术被广泛用于追踪用户行为。通过采集设备硬件参数(如屏幕分辨率、操作系统)、软件配置(如字体、插件)及网络特征(如IP地址、时区)&…...

“上云入端” 浪潮云剑指组织智能化落地“最后一公里”

进入2025年,行业智能体正在成为数实融合的核心路径。2025年初DeepSeek开源大模型的横空出世,通过算法优化与架构创新,显著降低算力需求与部署成本,推动大模型向端侧和边缘侧延伸。其开源策略打破技术垄断,结合边缘计算…...

CentOS 7 如何挂载ntfs的移动硬盘

CentOS 7 如何挂载ntfs的移动硬盘 前言一、查看硬盘并尝试挂载(提示无法挂载)二、yum安装epel-release提示yum被锁定三、强行终止yum的进程四、yum安装epel-release完成五、yum安装ntfs-3g六、此时可正常挂载NTFS硬盘 前言 CentOS 7默认情况下是不支持NTFS的文件系统&#xff…...

pytorch+maskRcnn框架训练自己的模型以及模型导出ONXX格式供C++部署推理

背景 maskrcnn用作实例分割时,可以较为精准的定位目标物体,相较于yolo只能定位物体的矩形框而言,优势更大。虽然yolo的计算速度更快。 直接开始从0到1使用maskrCNN训练自己的模型并并导出给C部署(亲测可用) 数据标注…...

①EtherCAT/Ethernet/IP/Profinet/ModbusTCP协议互转工业串口网关

型号 协议转换通信网关 EtherCAT 转 Modbus TCP MS-GW15 概述 MS-GW15 是 EtherCAT 和 Modbus TCP 协议转换网关,为用户提供一种 PLC 扩展的集成解决方案,可以轻松容易将 Modbus TCP 网络接入 EtherCAT 网络 中,方便扩展,不受限…...

Python扩展知识详解:lambda函数

目录 前言 1 基本知识点 语法 特点 代码示例 2 常见使用场景 1. 与高阶函数配合使用 2. 作为排序键来使用 3. 立即调用函数 4. 在字典中使用 3 高级用法(进阶版) 1. 多参数lambda 2. 设置默认参数 3. 嵌套lambda 注意事项 何时…...

信号量与基于环形队列的生产者消费者模型

目录 POSIX信号量 理解 使用 初始化 销毁 等待 发布信号量 基于环形队列的生产者消费者模型 POSIX信号量 理解 信号量可用于线程间的同步,它可以用于将一整块资源切成一个个的小部分以供并发访问。它实际上是一个计数器,但特别之处在于支持原子…...

《Oracle服务进程精准管控指南:23c/11g双版本内存优化实战》 ——附自动化脚本开发全攻略

正在学习或者是使用 Oracle 数据库的小伙伴,是不是对于那个一直启动且及其占用内存的后台进程感到烦躁呢?而且即使是手动去开关也显得即为麻烦,所以基于我之前所学习到的方法,我在此重新整理,让大家动动手指就能完成开…...

Java单列集合[Collection]

目录 1.Collection单列集合 1.1单列集合各集合特点 1.2、Collection集合 1.2.1、Collection方法 1.2.2、Collection遍历方式 1.2.2.1、迭代器遍历集合 1.2.2.2、增强for遍历集合 1.2.2.3、forEach遍历集合(JDK8之后) 1.2.2.4、遍历案例 1.3、Li…...

【C++重点】lambda表达式是什么

Lambda 表达式是 C11 引入的特性,它允许你定义匿名函数对象(即没有名字的函数)。Lambda 表达式可以在需要函数对象的地方直接定义函数,常用于 STL 算法和回调机制中。 lambda表达式基本语法 [捕获列表](参数列表) -> 返回类型…...

如何在ONLYOFFICE插件中添加自定义AI提供商:以通义千问和Kimi为例

随着 ONLYOFFICE AI 插件的发布,我们极大地提升了编辑器的默认功能。在ONLYOFFICE,我们致力于提供强大且灵活的解决方案,以满足您的特定需求。其中一项便是能够在 AI 插件中添加自定义提供商。在这篇文章中,我们将展示如何将通义千…...

Java基础-26-多态-认识多态

在Java编程中,多态(Polymorphism) 是面向对象编程的核心概念之一。通过多态,我们可以编写更加灵活、可扩展的代码。本文将详细介绍什么是多态、如何实现多态,并通过具体的例子来帮助你更好地理解这一重要概念。 一、什…...

Spark,配置hadoop集群1

配置运行任务的历史服务器 1.配置mapred-site.xml 在hadoop的安装目录下&#xff0c;打开mapred-site.xml&#xff0c;并在该文件里面增加如下两条配置。 eg我的是在hadoop199上 <!-- 历史服务器端地址 --> <property><name>mapreduce.jobhistory.address…...

【蓝桥杯算法练习】205. 反转字符串中的字符(含思路 + Python / C++ / Java代码)

【蓝桥杯算法练习】205. 反转字符串中的字符&#xff08;含思路 Python / C / Java代码&#xff09; &#x1f9e9; 题目描述 给定一个字符串 s&#xff0c;请你将字符串中的 英文字母字符反转&#xff0c;但其他 非字母字符保持在原位置&#xff0c;输出处理后的字符串。 …...

FPGA实现4K MIPI视频解码H265压缩网络推流输出,基于IMX317+VCU架构,支持4K60帧,提供工程源码和技术支持

目录 1、前言工程概述免责声明 2、相关方案推荐我已有的所有工程源码总目录----方便你快速找到自己喜欢的项目我这里已有的 MIPI 编解码方案我这里已有的视频图像编解码方案 3、详细设计方案设计框图FPGA开发板IMX317摄像头MIPI D-PHYMIPI CSI-2 RX Subsystem图像预处理Sensor …...

【Linux】网络概念

目录 网络模型 OSI七层模型 TCP/IP五层(或四层)模型 网络传输 网络传输基本流程 封装与分用 以太网通信&#xff08;局域网传输&#xff09; 跨网络传输 网络模型 OSI七层模型 TCP/IP五层(或四层)模型 网络层和传输层就是操作系统的一部分 网络传输 网络传输基本流程…...