大模型日报2024-06-05
大模型日报
2024-06-05
大模型资讯
- AI气象预测取得重大进展:单台桌面电脑即可运行全球天气模型
- 摘要: 一项新的人工智能天气预测模型已经取得重大进展,该模型能够在一台普通的桌面电脑上运行,预测全球天气。这意味着即使没有复杂的物理计算,AI也能有效进行天气预报。
- SimPO:提升大语言模型RLHF效率与可扩展性的新方法
- 摘要: SimPO突破参考模型限制,解锁大语言模型强化学习人类反馈(RLHF)的高效与可扩展性。人工智能不断进化,重点在于优化算法以提升大模型的性能和效率。
- HuggingFace发布FineWeb:用于LLM预训练的大规模数据集
- 摘要: HuggingFace推出FineWeb数据集,包含15万亿个标记和44TB磁盘空间,旨在提升大语言模型(LLM)的训练效果。
- 微软推出大语言模型在线对齐的主动偏好引导方法
- 摘要: 微软的机器学习研究引入了一种主动偏好引导方法,用于大语言模型(LLMs)的在线对齐。这些模型因其增强的跟随人类指令能力,在近期取得了显著进展。
- 多标记预测:大语言模型性能与效率的飞跃
- 摘要: 研究人员探索了多标记预测技术在大语言模型中的应用,显著提升了模型的性能和效率。这一突破性的研究为大语言模型的发展带来了新的可能性。
- ChatMOF:预测和生成金属有机框架的人工智能系统
- 摘要: ChatMOF是一种人工智能系统,专为预测和生成金属有机框架(MOFs)而设计。该系统利用大型数据集和先进的AI技术,能够高效地生成和评估MOFs,为材料科学和化学研究提供重要支持。
- IPA子公司BioStrand推出用于电子健康记录的先进大语言模型
- 摘要: IPA(IMMUNOPRECISE ANTIBODIES LTD.)的子公司BioStrand宣布推出一款用于电子健康记录(EHR)的先进大语言模型。此次发布旨在提升EHR的处理和分析能力,为医疗行业带来新的创新和效率。
- 亚马逊在秋季发布会上为Alexa引入生成式AI
- 摘要: 亚马逊在秋季发布会上宣布为Alexa引入生成式AI,并推出多款新设备,包括第三代Echo Show 8、Echo Hub等。
- SAP与Mistral AI合作:AI技术与专业知识的结合
- 摘要: SAP与领先的大型语言模型制造商Mistral AI达成合作。这次合作是AI专业知识与技术的共生结合,旨在推动双方在AI领域的发展与创新。
- AI在国际象棋中的表现:部分出色,部分令人失望
- 摘要: 新的基准测试显示,即使是最新的大型语言模型(LLMs)在国际象棋方面也不是最强的选手。AI在推动棋子的能力上表现出部分出色和部分令人失望的结果。
大模型产品
大模型论文
- PlanAgent:基于多模态大语言模型的车辆运动规划
- 摘要: PlanAgent利用多模态大语言模型,通过环境转换、推理引擎和反思模块,实现车辆运动规划的常识推理和广泛适应性,优于现有方法。
- MMLU-Pro: 更具挑战性的多任务语言理解基准
- 摘要: MMLU-Pro通过增加推理题和扩展选项,提高挑战性和稳定性,显著降低模型准确率,更好评估AI进展。
- Helix: 异构GPU集群上的LLM高效分布式服务
- 摘要: Helix通过最大流模型优化LLM推理,使用MILP算法提高异构GPU集群的吞吐量和降低延迟,性能显著提升。
- LoFiT: 局部微调LLM表示
- 摘要: 本文提出LoFiT框架,通过选择特定注意力头进行局部微调,提高LLM在真确性和推理任务中的表现,且参数修改量显著减少。
- 信息瓶颈视角的检索增强生成噪声过滤
- 摘要: 提出信息瓶颈理论用于检索增强生成,过滤噪声,提升问答数据集生成答案的正确性和简洁性。
- 大语言模型与大脑映射的质疑
- 摘要: 研究质疑大语言模型与人脑语言处理的相似性,发现高脑分数主要由句子长度和位置等简单特征解释。
- 大语言模型的低资源安全增强方法
- 摘要: 提出一种无需监督微调或人类反馈强化学习的低资源安全增强方法,通过知识蒸馏提升未对齐模型的防御能力。
- 大语言模型中概念几何结构的研究
- 摘要: 本文研究了大语言模型中语义编码的两个基础问题:分类概念的表示和概念间的层次关系。
- 输出嵌入中的令牌概率编码研究
- 摘要: 本文研究了语言模型输出嵌入中的令牌概率信息,发现编码稀疏性,并通过删除无关维度优化输出分布。
- 通过覆盖性理解偏好微调
- 摘要: 本文分析了在线RL和离线对比方法在偏好微调中的异同,提出了结合两者优势的HyPO算法,提高了性能和效率。
大模型开源项目
- 跨平台GPT-4o实现
- 摘要: gpt-4o项目支持在Windows、macOS和Ubuntu上运行,使用Python语言编写,提供跨平台AI解决方案。
- VinciGit00: AI Python爬虫
- 摘要: VinciGit00是一个基于AI的Python爬虫项目,用于自动化数据抓取,提升效率和准确性。
- ToonCrafter:生成卡通插值研究
- 摘要: ToonCrafter是一个用Python编写的AI项目,旨在研究生成卡通插值技术,助力动画制作与创意设计。
- 基于NVIDIA Isaac Sim的机器人学习框架
- 摘要: isaac-sim是一个统一的机器人学习框架,基于NVIDIA Isaac Sim构建,使用Python语言编写。
- 微软生成式AI入门教程
- 摘要: 微软发布18课生成式AI入门教程,帮助初学者使用Jupyter Notebook语言构建生成式AI应用。
- 从零开始用PyTorch实现ChatGPT
- 摘要: 本项目在Jupyter Notebook中,逐步实现了一个类似ChatGPT的大语言模型,使用PyTorch框架进行构建。
- MiniCPM-Llama3-V 2.5手机端多模态LLM
- 摘要: MiniCPM-Llama3-V 2.5是一款在手机上运行的GPT-4V级别多模态大语言模型,使用Python编写。
相关文章:
大模型日报2024-06-05
大模型日报 2024-06-05 大模型资讯 AI气象预测取得重大进展:单台桌面电脑即可运行全球天气模型 摘要: 一项新的人工智能天气预测模型已经取得重大进展,该模型能够在一台普通的桌面电脑上运行,预测全球天气。这意味着即使没有复杂的物理计算&a…...
LLM 大模型学习必知必会系列(二):提示词工程-Prompt Engineering 以及实战闯关
角色扮演:在系统指令中告诉千问你需要它扮演的角色,即可沉浸式和该角色对话交流语言风格:简单调整 LLM 的语言风格任务设定:比如旅行规划,小红书文案助手这样的专项任务处理System message 也可以被用于规定 LLM 的答复…...
Spring系统学习 - Spring入门
什么是Spring? Spring翻译过来就是春天的意思,字面意思,冠以Spring的意思就是想表示使用这个框架,代表程序员的春天来了,实际上就是让开发更加简单方便,实际上Spring确实做到了。 官网地址:ht…...
Priority_queue
一、priority_queue的介绍和使用 1.1 priority_queue的介绍 1.优先队列是一种容器适配器,根据严格的弱排序标准,它的第一个元素总是它所包含的元素中最大的。 2.优先队列类似于堆, 在堆中可以随时插入元素, 并且只能检索最大堆…...
SpringMVC:获取请求数据
1. 通过RequestParma注解接收 /**** value和name都可以使用,互为别名* 如果此处设置了需要什么参数而前端请求时没有提供则会报400(请求参数不一致错误)* required参数用于设置该参数是否为必须传递参数,默认为true必须传递* defa…...
深度学习 --- stanford cs231 编程作业(assignment1,Q2: SVM分类器)
stanford cs231 编程作业之SVM分类器 写在最前面: 深度学习,或者是广义上的任何学习,都是“行千里路”胜过“读万卷书”的学识。这两天光是学了斯坦福cs231n的一些基础理论,越往后学越觉得没什么。但听的云里雾里的地方也越来越多…...
【scikit-learn010】sklearn算法模型清单实战及经验总结(已更新)
1.一直以来想写下基于scikit-learn训练AI算法的系列文章,作为较火的机器学习框架,也是日常项目开发中常用的一款工具,最近刚好挤时间梳理、总结下这块儿的知识体系。 2.熟悉、梳理、总结下scikit-learn框架模型算法包相关技术点及经验。 3.欢迎批评指正,欢迎互三,跪谢一键…...
Rethinking overlooked aspects in vision-language models
探讨多模态视觉语言模型的一些有趣结论欢迎关注 CVHub!https://mp.weixin.qq.com/s/zouNu-g-33_7JoX3Uscxtw1.Introduction 多模态模型架构上的变化不大,数据的差距比较大,输入分辨率和输入llm的视觉token大小是比较关键的,适配器,VIT和语言模型则不是那么关键。InternVL-…...
【漯河市人才交流中心_登录安全分析报告-Ajax泄漏滑动距离导致安全隐患】
前言 由于网站注册入口容易被黑客攻击,存在如下安全问题: 暴力破解密码,造成用户信息泄露短信盗刷的安全问题,影响业务及导致用户投诉带来经济损失,尤其是后付费客户,风险巨大,造成亏损无底洞…...
C语言—字符函数和字符串函数
1.字符分类函数 C语言中有一系列的函数是专门做字符分类的,也就是一个字符是属于什么类型的字符的。 这些函数的使用都需要包含一个头文件 ctype.h。 例:将一句话中的小写字母改成大写字母。 2.字符转换函数 头文件:ctype.h C语言提供了2…...
爬山算法的详细介绍
爬山算法(Hill Climbing Algorithm)是一种基于启发式的局部搜索算法,常用于解决优化问题。它的核心思想是从当前解的邻域中选择能够使目标函数值最大(或最小)的下一个解作为当前解,直到找到一个满足问题要求…...
硕士课程 可穿戴设备之作业一
作业一 第一个代码使用的方法是出自于[1]。 框架结构 如下图,不过根据对代码的解读,发现作者在代码中省去了对SSR部件的实现,下文再说。 Troika框架由三个关键部件组成:信号分解,SSR和光谱峰值跟踪。(粗…...
测试记录3:WLS2运行Linux界面
1.WLS1转到WLS2 (1)根据自己的平台,下载WLS2安装包 x64: https://wslstorestorage.blob.core.windows.net/wslblob/wsl_update_x64.msi arm64: https://wslstorestorage.blob.core.windows.net/wslblob/wsl_update_arm64.msi (2&…...
好用软件推荐
软件功能相关介绍地址FastStone截图(长截图、定时截图等)CSDNhttps://www.faststone.org/FSCaptureDownload.htmQuicker快捷访问https://getquicker.net/https://getquicker.net/...
王学岗鸿蒙开发(北向)——————(二)TS基本语法详解
1,Ts(TypeScript)语法相当于JAVAScript类型,鸿蒙arkTs是基于TS语言的,当然artTs也融合了其它的语言。 2,本篇文章是基于n9版本。注意,有些语法是已经不能用的。 3, 4,变量:用来存储数据,数字字母组成,数字不…...
【网络协议 | HTTP】HTTP总结与全梳理(一) —— HTTP协议超详细教程
🔥博客简介:开了几个专栏,针对 Linux 和 rtos 系统,嵌入式开发和音视频开发,结合多年工作经验,跟大家分享交流嵌入式软硬件技术、音视频技术的干货。 ✍️系列专栏:C/C、Linux、rtos、嵌入式…...
java基础选择题--11
1. 以下保留字( )不能出现在说明虚函数原型的语句中。A.static B.operator C.void D.const 参考答案:A 2. 一个类中只能定义一个析构函数。( )A.对 B.错 参考答案:A 解释: 在C中,一个类只能有一个析构函数。析构函数在对象生…...
欲除烦恼须无我,各有前因莫羡人
欲除烦恼须无我,各有前因莫羡人...
Vue的APP实现下载文件功能,并将文件保存到手机中
Vue的APP实现下载文件功能,并将文件保存到手机中 文字说明后台核心代码前台核心代码运行截图项目链接 文字说明 本文介绍Vue实现的APP,将文件下载并保存到手机中,为系统提供导出功能;同时支持导入,即选择本地的文件后&…...
泛微开发修炼之旅--07通过后端代码实现创建并发送待办、源码及示例
文章链接:泛微开发修炼之旅--07通过后端代码实现创建并发送待办、源码及示例...
地理信息系统知识点03---空间数据模型
一、地理空间与空间抽象1. 地理空间地理空间是 GIS 的描述与分析对象,泛指地球表层空间及其相关的关联空间,既包含具有地理位置的实体、现象,也涵盖它们之间的相互作用与分布规律。从内涵上,地理空间具有区域性、多维性、随机性、…...
SDMatte商业级抠图案例展示:电商平台海量商品图处理实录
SDMatte商业级抠图案例展示:电商平台海量商品图处理实录 1. 开篇:当AI抠图遇上电商实战 电商平台每天要处理成千上万的商品图片,从服装模特到珠宝首饰,每张图都需要完美的展示效果。传统人工抠图不仅成本高,面对促销…...
MAI-UI-8B快速部署:支持CUDA显卡的一键安装教程
MAI-UI-8B快速部署:支持CUDA显卡的一键安装教程 1. 认识MAI-UI-8B智能助手 MAI-UI-8B是一款革命性的图形界面智能助手,它不仅能理解你的指令,还能直接操作图形界面完成实际任务。想象一下,当你需要订机票、购物或者处理工作信息…...
千问3.5-2B集成IDEA插件:Java开发者智能代码助手实战
千问3.5-2B集成IDEA插件:Java开发者智能代码助手实战 1. 为什么Java开发者需要AI代码助手 在Java开发过程中,我们经常面临一些重复性工作:编写样板代码、添加注释、修复常见错误、重构旧代码等。这些工作不仅耗时,还容易出错。传…...
DirectDraw兼容性新纪元:让经典游戏在现代Windows系统重生
DirectDraw兼容性新纪元:让经典游戏在现代Windows系统重生 【免费下载链接】DDrawCompat DirectDraw and Direct3D 1-7 compatibility, performance and visual enhancements for Windows Vista, 7, 8, 10 and 11 项目地址: https://gitcode.com/gh_mirrors/dd/DD…...
千问3.5-9B多模态扩展:OpenClaw处理图片与文本混合任务
千问3.5-9B多模态扩展:OpenClaw处理图片与文本混合任务 1. 为什么需要本地多模态自动化 去年夏天,我电脑里堆积了上千张混杂着文字说明的截图——有技术文档片段、会议纪要、临时灵感记录。手动整理这些内容时,我突然意识到:如果…...
MusePublic Art Studio效果展示:复杂发型丝缕感与空气感光影表现
MusePublic Art Studio效果展示:复杂发型丝缕感与空气感光影表现 1. 惊艳效果开场:当AI遇见艺术创作 今天要展示的是MusePublic Art Studio在人物肖像生成方面的惊人表现,特别是对复杂发型丝缕感和空气感光影的细腻刻画。这款基于SDXL引擎的…...
基于粒子群算法的冷-热-电-气综合能源系统优化调度模型-100%详细注释+多种对比方案 摘要
基于粒子群算法的冷-热-电-气综合能源系统优化调度模型-100%详细注释多种对比方案 摘要:构建了含冷-热-电-气四种形式能源的综合能源系统优化调度模型,主要设备包括燃气锅炉、电锅炉、P2G、储能设备、风光机组、大电网、吸收式制冷机等,同时设…...
掌握Blender 3MF插件:5大核心场景的全流程解决方案
掌握Blender 3MF插件:5大核心场景的全流程解决方案 【免费下载链接】Blender3mfFormat Blender add-on to import/export 3MF files 项目地址: https://gitcode.com/gh_mirrors/bl/Blender3mfFormat Blender 3MF插件作为连接3D建模与3D打印的关键桥梁&#x…...
TOPMAX嵌入式Top-N最大值追踪库详解
1. TOPMAX库概述:嵌入式系统中的Top-N最大值追踪引擎TOPMAX是一个专为资源受限嵌入式平台设计的轻量级Arduino库,其核心功能是实时、高效地维护一个动态数据流中的前N个最大值。该库并非简单的排序容器,而是一种经过工程优化的“滑动窗口最大…...
