【AI News | 20250421】每日AI进展
AI Repos
1、langgraph-mcp-agents
基于LangGraph的AI智能体系统,集成了MCP,使AI助手能访问各种数据源和API。提供了Streamlit网页界面,方便与LangGraph和MCP工具交互。可以通过界面动态添加、删除以及配置MCP工具,无需重启应用,支持Smithery JSON格式。支持流式响应,可以实时查看智能体的响应和工具调用

2、HawkinsDB
基于人类大脑工作原理设计的一款AI记忆系统,让AI可以像人类一样存储和回忆信息。它基于Jeff Hawkins的“千脑理论”,帮助AI模型以更强大且直观的方式管理复杂信息。想象一下我们的大脑,不仅仅是记住一堆零散的事实,而是将它们关联起来形成一个复杂的知识网络,HawkinsDB就是想让AI也能像人类大脑一样记忆和理解信息。HawkinsDB不依赖于模糊的相似性搜索,而是支持精确的,具备上下文感知的查询,理解数据的实际含义和关系。它将语义记忆、情景记忆和程序记忆统一到一个框架中,使AI能像知识图谱一样,不仅存储信息,还记录信息之间的关系,从而理解和应用不同类型的知识。可作为LLM应用的记忆层,比较适用于RAG系统
AI News
1、Trae v1.3.0重磅更新:MCP与.rules赋能AI开发新体验
字节跳动旗下AI驱动的集成开发环境Trae发布v1.3.0版本,核心亮点在于引入Model Context Protocol (MCP) 支持和.rules规则设置,显著提升开发效率与灵活性。MCP允许开发者连接外部工具与数据源,扩展上下文能力;.rules则支持项目级编码规范与AI行为自定义。此外,新版本还具备联网搜索、文件上传作为AI上下文、增强的Agent搭建等功能。Trae v1.3.0兼容多平台,支持主流AI模型,旨在通过灵活的技术架构和广泛的应用场景,重塑AI开发生态,成为开发者首选平台。
2、UIUC与谷歌联手发布Search-R1:AI模型进化,边查边答能力惊艳
伊利诺伊大学与谷歌联合发布了名为Search-R1的新型语言模型,其创新之处在于赋予了AI自主联网搜索信息的能力,实现了“边推理边搜索”的新模式。通过强化学习等技术,Search-R1在多个基准测试中表现出显著的性能提升,尤其是在需要复杂推理和外部知识的任务上,成绩大幅超越传统模型。这项研究突破了AI依赖预存知识的局限,使其能够像人类一样在解决问题的过程中主动获取和利用互联网信息,为未来的AI应用开辟了新的可能性。
3、谷歌发布Gemma 3 QAT模型:低显存需求,消费级显卡畅跑
谷歌发布了Gemma 3系列的量化感知训练(QAT)优化版本,显著降低了模型运行所需的显存。以Gemma 3 27B为例,显存需求从54GB降至14.1GB,使得NVIDIA RTX 3090等消费级显卡也能轻松驾驭。QAT技术在训练中融入量化操作,有效减少了性能损失。目前,Gemma 3的不同尺寸版本已可在各类GPU上运行,并得到Ollama、LM Studio和MLX等开发者工具的支持,让更多用户能在资源有限的设备上体验强大的AI功能。社区对谷歌此举表示欢迎,并期待其在模型量化方面取得更多进展。
4、mcp-agent发布:轻量级MCP框架赋能高效智能体应用构建
mcp-agent作为一款基于模型上下文协议(MCP)的轻量级框架正式发布,旨在简化智能体应用的构建流程。该框架具备高度的可组合性和可定制性,能够与其他MCP服务无缝集成。开发者可以通过简单的代码逻辑定义和组合工作流,灵活调整模型提供商、日志记录和编排器等模块。mcp-agent简化了传统框架复杂的控制流,支持在工作流中插入人工输入和外部信号,为智能代理提供了更高的灵活性,是构建高效智能代理应用的理想选择。
5、讯飞星火X1升级发布,对标OpenAI力争AI领域领先地位
科大讯飞正式发布全新升级的讯飞星火X1人工智能模型,旨在智能推理和多任务处理方面与OpenAI的o1和DeepSeek R1竞争。该模型通过融入复杂场景数据,显著提升了泛化能力,尤其在教育、医疗和司法等行业表现突出。讯飞强调,尽管模型参数量级较小,但整体效果已接近行业领先水平。星火X1创新推出“快思考、慢思考”统一模型,简化私有化部署,降低企业AI使用门槛,并提供模型定制优化工具链及开放API,预示着国产AI技术竞争力的增强。
6、xAI发布Grok3Mini:高性价比AI模型赋能开发者
xAI推出Grok3Mini语言模型,强调其在速度和经济性上的优势,并在数学、编程和科学基准测试中表现出色,超越许多更昂贵的模型。作为Grok3系列的一部分,Grok3Mini提供多种速度和推理能力版本,价格远低于同类推理模型。尽管速度不及完整版Grok3,但Grok3Mini在性能和成本效益上取得了平衡。xAI还为开发者提供推理跟踪功能,增强模型使用的透明度。Grok3Mini的发布在AI市场竞争中展现出高性价比的潜力,有望推动更高效、经济的AI应用。
7、Xcode MCP开源:VS Code与Cursor中体验原生iOS开发
Xcode MCP项目开源,通过模型上下文协议(MCP)将Xcode功能引入VS Code和Cursor等轻量级编辑器,实现了在非Xcode环境下进行iOS开发的完整工作流。开发者可在轻量级编辑器中完成虚拟机/模拟器管理、实时日志获取、项目管理和Bundle ID提取等操作。结合Cursor的AI代码补全等功能,显著提升了iOS开发效率。该项目通过本地MCP服务器与Xcode命令行工具深度融合,为开发者提供了更灵活、高效的iOS开发新选择,尤其受到个人开发者和轻量级编辑器爱好者的欢迎。
8、Cohere在Azure AI Foundry推出Command A和Embed 4,优化RAG与智能体工作流
Cohere在微软Azure AI Foundry平台发布了两款新模型:Command A和Embed 4,旨在提升企业级RAG和智能体AI工作流的效率。Command A是专为智能体设计的LLM,具备卓越的推理和任务执行能力,易于集成至企业应用。Embed 4是一款高性能多模态嵌入模型,支持百余种语言和图像嵌入,并具备Matryoshka嵌入和高效量化特性,适用于构建快速、可扩展的多语言RAG系统。这两款模型依托Azure AI Foundry的强大生态,助力企业快速部署和扩展AI应用。
9、昆仑万维开源SkyReels-V2:首个扩散强迫无限时长电影生成模型
昆仑万维SkyReels团队发布并开源了全球首个采用扩散强迫框架的无限时长电影生成模型SkyReels-V2。该模型结合了多模态大语言模型、多阶段预训练和强化学习等技术,旨在解决现有视频生成在提示词遵循、视觉质量、运动动态和时长协调方面的挑战。SkyReels-V2具备生成30-40秒高质量、高一致性视频的能力,并在故事生成、图生视频、运镜和多主体一致性生成等方面展现出强大的应用潜力,其在性能评估中也优于同类模型。昆仑万维将持续开源相关技术,推动视频生成领域的发展。
10、Intel开源AI Playground:Arc GPU赋能本地AI模型运行新体验
Intel开源AI Playground软件,为Arc GPU用户提供一站式本地生成式AI平台,支持图像、视频生成及大型语言模型(LLMs)运行。该平台通过OpenVINO优化,显著降低硬件门槛,兼容Stable Diffusion、DeepSeek R1、Llama3等多种模型,并集成ComfyUI工作流。用户需自行下载模型,平台提供便捷加载界面。AI Playground基于OpenVINO深度优化Arc GPU和Core Ultra处理器性能,旨在赋能内容创作、本地AI开发、教育研究及虚拟助手等多种应用场景,并受到社区高度评价,未来有望成为本地AI开发的首选平台。
11、Persona Engine开源:AI虚拟助手融合Live2D打造沉浸式交互体验
Persona Engine开源项目整合了LLM、Live2D、ASR、TTS和RVC等多项前沿技术,旨在赋予虚拟角色自然的对话和动态表情能力,实现与用户的实时交互。通过OpenAI兼容的LLM API驱动角色个性,Live2D模型实现语音同步和情感动画,Whisper ASR和TTS模块处理语音输入输出,并支持OBS集成。Persona Engine为VTubing、直播和虚拟助手等场景提供了强大的AI驱动虚拟交互解决方案,其模块化架构和详细文档降低了开发门槛,并受到社区广泛关注。
12、微软开源MarkItDown MCP:轻松转换Word、Excel等至Markdown
微软发布并开源了MarkItDown MCP,一款强大的命令行工具,能够将PDF、Word、PowerPoint、Excel等多种格式的文件便捷地转换为Markdown格式。该工具在转换过程中智能保持文档结构和内容,生成的Markdown文本可无缝对接主流大语言模型,方便进行后续的文本分析。MarkItDown MCP还支持插件扩展,用户可通过简单的命令行指令完成文件转换,极大地提升了文档处理效率,尤其适用于需要将各类文档信息应用于AI分析的场景。
13、Figma布局AI领域:智能应用制作器与网站创建工具蓄势待发
设计巨头Figma正积极进军人工智能领域,计划推出一款AI应用程序制作器和名为Figma Sites的网站创建工具。这款AI应用制作器由Anthropic的Claude Sonnet大语言模型驱动,并整合Supabase平台,支持文本、设计文件和图像等多种输入,旨在实现设计与开发的无缝衔接,降低应用开发门槛。Figma Sites则被视为其现有设计生态的延伸,目标是直接从设计稿生成可用网站。Figma的这些举措预示着其在AI驱动的设计与开发协作领域的新战略布局,或将对现有市场格局产生 significant 影响。
14、字节跳动开源ChatTS-14B:首个原生理解时间序列并推理的LLM
字节跳动研究团队开源了ChatTS-14B,一款拥有140亿参数的LLM,专门为理解和推理时间序列数据而设计。基于Qwen2.5-14B-Instruct微调,ChatTS-14B支持用户通过自然语言与时序数据交互,应用于金融、气象和工业等领域。其通过合成数据对齐技术提升了在时间序列任务中的性能,被认为是生成式AI与时间序列分析的重要结合。ChatTS-14B的开源及详细文档已发布在Hugging Face和GitHub,旨在推动AI的民主化和跨领域应用。
15、Intel开源AI Playground:Arc GPU赋能本地AI模型运行新体验
Intel宣布开源其AI Playground软件,这是一款专为Intel Arc GPU和集成显卡优化的本地生成式AI工具。AI Playground支持运行聊天式LLM以及图像和视频生成模型,如Stable Diffusion、DeepSeek R1等,利用本地计算资源实现高效且注重隐私的AI体验。通过MIT许可协议开源,Intel旨在吸引开发者参与定制和贡献代码,推动生成式AI技术的普及和社区协作,此举被视为Intel在AI市场战略布局的重要一步,并有望促进基于Intel硬件的AI应用生态发展。
16、高德地图开源HumanRig技术与3D人形角色绑定数据集
高德地图发布了HumanRig技术,并开源了业界首个大规模3D人形角色绑定设计数据集。HumanRig技术通过先验引导的骨架估计器和U形Point Transformer等创新算法,实现了高效的自动角色绑定,显著降低了动画制作成本。开源的HumanRig数据集包含11434个多样化且骨架一致的T姿态网格,为绑定研究和应用提供了高质量数据支持。实验表明,HumanRig技术性能超越现有方法,为角色动画的自动化和高效化开辟了新道路,未来高德计划将其应用于导航、IP语音包和数字人等领域。
相关文章:
【AI News | 20250421】每日AI进展
AI Repos 1、langgraph-mcp-agents 基于LangGraph的AI智能体系统,集成了MCP,使AI助手能访问各种数据源和API。提供了Streamlit网页界面,方便与LangGraph和MCP工具交互。可以通过界面动态添加、删除以及配置MCP工具,无需重启应用&…...
牛客 | OJ在线编程常见输入输出练习
1.只有输出 言归正传,本张试卷总共包括18个题目,包括了笔试情况下的各种输入输出。 第一题不需要输入,仅需输出字符串 Hello Nowcoder! 即可通过。 #include <iostream> using namespace std; int main(){string s "Hello Nowco…...
python生成动态库在c++中调用
一.Windows下生成动态库.pyd 在setup.py的同目录下使用python setup.py build_ext --inplace 二.在vscode的c中使用.pyd文件(动态库) 1)配置python的环境 python -c "import sys; print(sys.executable)" #确定python安装位置 2…...
程序员学商务英文之Terms of Payment Packing
Dia-3: Packing 1 包装-1 1. I’m here to improve my communication skill of English. 我来这里是为了提升我的英文沟通技能。 2. What a co-incidence! Fancy meeting you here. 这么巧!真没想到在这见到你。 3. Some birds aren’t meant to be caged…...
OpenCV基础函数学习4
【大纲笔记见附件pdf】 目录 一、基于OpenCV的形态学操作 二、基于OpenCV的直方图处理 三、基于OpenCV霍夫变换 四、基于OpenCV模板匹配 一、基于OpenCV的形态学操作 二、基于OpenCV的直方图处理 三、基于OpenCV霍夫变换 四、基于OpenCV模板匹配...
Nginx反向代理用自定义Header参数
【啰嗦两句】 也不知道为啥,我仅仅想在Nginx的反向代理中使用自己定义的“x-api-key”做Header参数,却发现会被忽略,网上搜的资料都是说用“proxy_set_header”,却只愿意介绍最基本的几个参数,你懂的,那些资…...
详解机器学习各算法的优缺点!!
在机器学习这个 “工具库” 里,算法就像各种各样的工具,每一种都有自己的 “脾气” 和 “特长”。有些算法擅长找规律,有些算法能快速分类,还有些在处理复杂数据时特别厉害。 而且,就像锤子适合敲钉子、螺丝刀适合拧螺…...
Manus AI与多语言手写识别
一、手写识别技术的发展历程 1.1 早期的手写识别技术 手写识别技术起源很早,1929年德国人Tausheck就取得了相关专利。早期主要采用模板匹配等方法,该方法需准备字符模板库,提取待识别字符特征后进行匹配。但其局限性明显,对字符…...
C++23 让 Lambda 表达式中的 () 更可选:P1102R2 提案深度解析
文章目录 一、背景与动机:Lambda 表达式中的痛点1.1 问题的根源 二、P1102R2 提案:让 () 可选2.1 提案的核心内容2.2 语法调整的细节2.3 提案的合理性 三、编译器支持:主流编译器的跟进四、对 C 编程的影响:简化语法与提升一致性4…...
规则引擎 - Easy Rules
Easy Rules 依赖demodemo1demo2 总结 Easy Rules 是一个轻量级的 Java 规则引擎,使用简单,适合快速开发和简单的规则场景,适合对于一些判断,是否属于白名单,是否有特殊权限,是否属于当前区域,调…...
3步拆解Linux内核源码的思维模型
3步拆解Linux内核源码的思维模型 ——从“不敢碰”到“庖丁解牛” 一、第一步:资料收集与框架搭建——像拼图一样找到“地图” 初看Linux内核源码的人,往往会被其千万行代码淹没。但正如登山前需要地形图,阅读内核前必须构建认知框架。 1…...
MyBatis与MyBatis-Plus:字段自动填充的两种实现方式
目录 1. 使用 MyBatis 拦截器实现字段自动填充 2. 使用 MyBatis-Plus 实现字段自动填充 1. 使用 MyBatis 拦截器实现字段自动填充 实现步骤 创建拦截器 实现 MyBatis 的 Interceptor 接口,通过拦截 MyBatis 执行的 SQL 操作来自动填充公共字段 Intercepts({Signa…...
深度学习:人工智能的核心驱动力
深度学习 在当今科技飞速发展的时代,人工智能(AI)无疑是最具影响力和变革性的技术之一。而深度学习,作为人工智能领域的核心技术,正以其强大的能力和广泛的应用,深刻地改变着我们的生活和世界。深度学习究竟…...
Java学习路线--自用--带链接
1.Java基础 黑马:黑马程序员Java零基础视频教程_下部 2.MySQL 尚硅谷:MySQL数据库入门到大牛,mysql安装到优化,百科全书级,全网天花板 3.Redis 黑马:黑马程序员Redis入门到实战教程,深度透…...
在Qt中验证LDAP账户(Windows平台)
一、前言 原本以为在Qt(Windows平台)中验证 LDAP 账户很简单:集成Open LDAP的开发库即可。结果临了才发现,Open LDAP压根儿不支持Windows平台。沿着重用的原则,考虑迁移Open LDAP的源代码,却发现工作量不小…...
【sylar-webserver】重构日志系统
文章目录 主要工作流程图FiberConditionBufferBufferManagerLogEvent 序列化 & 反序列化LoggerRotatingFileLogAppender 主要工作 实现, LogEvent 序列化和反序列化 (使用序列化是为了更标准,如果转成最终的日志格式再存储(确…...
树莓派超全系列教程文档--(38)config.txt视频配置
config.txt视频配置 视频选项HDMI模式树莓派4-系列的HDMI树莓派5-系列的HDMI 复合视频模式enable_tvout LCD显示器和触摸屏ignore_lcddisable_touchscreen 通用显示选项disable_fw_kms_setup 文章来源: http://raspberry.dns8844.cn/documentation 原文网址 视频选…...
线性DP:最短编辑距离
Dp 状态表示 f(i,j) 集合所有将A[1~i]变成B[1~j]的操作方式属性min 状态计算 (划分) 增f(i,j)f(i,j-1)1//A[i]元素要增加,说明A前i位置与B前j-1相同删f(i,j)f(i-1,j)1//A[i]元素要删除,说明A前i…...
STM32 HAL库FreeRTOS 中断管理
一、引言 在嵌入式系统开发中,STM32 微控制器凭借其高性能、低功耗和丰富的外设资源,被广泛应用于各种领域。FreeRTOS 作为一款轻量级、开源且功能强大的实时操作系统,为多任务处理提供了良好的支持。中断是嵌入式系统中实现实时响应外部事件…...
STM32——新建工程并使用寄存器以及库函数进行点灯
本文是根据江协科技提供的教学视频所写,旨在便于日后复习,同时供学习嵌入式的朋友们参考,文中涉及到的所有资料也均来源于江协科技(资料下载)。 新建工程并使用寄存器以及库函数进行点灯操作 新建工程步骤1.建立工程2.…...
java集合框架day1————集合体系介绍
在进入正文之前,我们先来思考一下之前学过的数组有什么缺点? <1>长度开始时必须指定,而且一旦指定,不能更改 <2>保存的必须为同一类型的元素 <3>使用数组进行增加/删除元素的代码比较麻烦 为了方便读者理解&…...
百度热力图数据获取,原理,处理及论文应用18
目录 0、数据简介0、示例数据1、百度热力图数据日期如何选择1.1、其他实验数据的时间1.2、看日历天气 2、百度热力图几天够研究?部分文章统计3、数据原理3.1 Bd09mc即百度墨卡托投影坐标系200单位的距离是可以自己设置的吗?3.2 csv文件字段说明3.3 ** 这…...
【区块链技术解析】从原理到实践的全链路指南
目录 前言:技术背景与价值当前技术痛点解决方案概述目标读者说明 一、技术原理剖析核心概念图解核心作用讲解关键技术模块技术选型对比 二、实战演示环境配置要求核心代码实现(10个案例)案例1:创建简单区块链案例2:工作…...
【身份证扫描件识别表格】如何识别大量身份证扫描件将内容导出保存到Excel表格,一次性处理多张身份证图片导出Excel表格,基于WPF和腾讯云的实现方案
基于WPF和腾讯云的身份证扫描件批量处理方案 适用场景 本方案适用于需要批量处理大量身份证扫描件的场景,例如: 企业人事部门批量录入新员工身份信息银行或金融机构办理批量开户业务教育机构收集学生身份信息政府部门进行人口信息统计酒店、医院等需要实名登记的场所这些场景…...
可穿戴设备待机功耗需降至μA级但需保持实时响应(2万字长文深度解析)
可穿戴设备的功耗与响应需求之矛盾 在过去十年中,可穿戴设备以惊人的速度融入我们的日常生活,成为现代科技与个人健康管理的重要交汇点。从智能手表到健身手环,从医疗监测设备到增强现实眼镜,这些设备不仅仅是科技产品的延伸&…...
Django视图(未分离)
ListView、DetailView、CreateView、UpdateView 和 DeleteView 是 Django 框架中基于类的通用视图(Class-Based Generic Views) 配置 URL 路由 在 urls.py 中为这些视图配置路由: from django.urls import path from .views import (PostLis…...
[Python] 入门核心笔记
目录 一、Python简介重点 二、编程语言基础重点 三、Python安装重点 四、第一个Python程序重点 五、Python解释器重点 六、Python开发环境重点 一、Python简介重点 起源:1989年Gudio van Rossum开发,1991年诞生,名字源于电视剧《Monty Python…...
计算机视觉与深度学习 | Transformer原理,公式,代码,应用
Transformer 详解 Transformer 是 Google 在 2017 年提出的基于自注意力机制的深度学习模型,彻底改变了序列建模的范式,解决了 RNN 和 LSTM 在长距离依赖和并行计算上的局限性。以下是其原理、公式、代码和应用的详细解析。 一、原理 核心架构 Transformer 由 编码器(Encod…...
基于语义网络表示的不确定性推理
前文我们已经了解了: 1.不确定与非单调推理的基本概念:不确定与非单调推理的基本概念-CSDN博客 2.不确定与非单调推理的概率方法:不确定与非单调推理的概率方法-CSDN博客 3.不确定与非单调推理的可信度方法:不确定与非单调推理的可信度方法-CSDN博客 4.不确定与非单调推…...
ICMAN防水触摸芯片 - 复杂环境下精准交互,提升触控体验
▍核心优势 ◆ 超强抗干扰能力 ◆ 工业级设计,一致性和稳定性好 ▍提供场景化解决方案 【智能厨电矩阵】抽油烟机档位调节 | 电磁炉火力触控 | 洗碗机模式切换 【卫浴设备方案】淋浴房雾化玻璃控制 | 智能马桶触控面板 | 浴缸水位感应 【工业控制应用】仪器仪…...
