大模型日报2024-06-05
大模型日报
2024-06-05
大模型资讯
- AI气象预测取得重大进展:单台桌面电脑即可运行全球天气模型
- 摘要: 一项新的人工智能天气预测模型已经取得重大进展,该模型能够在一台普通的桌面电脑上运行,预测全球天气。这意味着即使没有复杂的物理计算,AI也能有效进行天气预报。
- SimPO:提升大语言模型RLHF效率与可扩展性的新方法
- 摘要: SimPO突破参考模型限制,解锁大语言模型强化学习人类反馈(RLHF)的高效与可扩展性。人工智能不断进化,重点在于优化算法以提升大模型的性能和效率。
- HuggingFace发布FineWeb:用于LLM预训练的大规模数据集
- 摘要: HuggingFace推出FineWeb数据集,包含15万亿个标记和44TB磁盘空间,旨在提升大语言模型(LLM)的训练效果。
- 微软推出大语言模型在线对齐的主动偏好引导方法
- 摘要: 微软的机器学习研究引入了一种主动偏好引导方法,用于大语言模型(LLMs)的在线对齐。这些模型因其增强的跟随人类指令能力,在近期取得了显著进展。
- 多标记预测:大语言模型性能与效率的飞跃
- 摘要: 研究人员探索了多标记预测技术在大语言模型中的应用,显著提升了模型的性能和效率。这一突破性的研究为大语言模型的发展带来了新的可能性。
- ChatMOF:预测和生成金属有机框架的人工智能系统
- 摘要: ChatMOF是一种人工智能系统,专为预测和生成金属有机框架(MOFs)而设计。该系统利用大型数据集和先进的AI技术,能够高效地生成和评估MOFs,为材料科学和化学研究提供重要支持。
- IPA子公司BioStrand推出用于电子健康记录的先进大语言模型
- 摘要: IPA(IMMUNOPRECISE ANTIBODIES LTD.)的子公司BioStrand宣布推出一款用于电子健康记录(EHR)的先进大语言模型。此次发布旨在提升EHR的处理和分析能力,为医疗行业带来新的创新和效率。
- 亚马逊在秋季发布会上为Alexa引入生成式AI
- 摘要: 亚马逊在秋季发布会上宣布为Alexa引入生成式AI,并推出多款新设备,包括第三代Echo Show 8、Echo Hub等。
- SAP与Mistral AI合作:AI技术与专业知识的结合
- 摘要: SAP与领先的大型语言模型制造商Mistral AI达成合作。这次合作是AI专业知识与技术的共生结合,旨在推动双方在AI领域的发展与创新。
- AI在国际象棋中的表现:部分出色,部分令人失望
- 摘要: 新的基准测试显示,即使是最新的大型语言模型(LLMs)在国际象棋方面也不是最强的选手。AI在推动棋子的能力上表现出部分出色和部分令人失望的结果。
大模型产品
大模型论文
- PlanAgent:基于多模态大语言模型的车辆运动规划
- 摘要: PlanAgent利用多模态大语言模型,通过环境转换、推理引擎和反思模块,实现车辆运动规划的常识推理和广泛适应性,优于现有方法。
- MMLU-Pro: 更具挑战性的多任务语言理解基准
- 摘要: MMLU-Pro通过增加推理题和扩展选项,提高挑战性和稳定性,显著降低模型准确率,更好评估AI进展。
- Helix: 异构GPU集群上的LLM高效分布式服务
- 摘要: Helix通过最大流模型优化LLM推理,使用MILP算法提高异构GPU集群的吞吐量和降低延迟,性能显著提升。
- LoFiT: 局部微调LLM表示
- 摘要: 本文提出LoFiT框架,通过选择特定注意力头进行局部微调,提高LLM在真确性和推理任务中的表现,且参数修改量显著减少。
- 信息瓶颈视角的检索增强生成噪声过滤
- 摘要: 提出信息瓶颈理论用于检索增强生成,过滤噪声,提升问答数据集生成答案的正确性和简洁性。
- 大语言模型与大脑映射的质疑
- 摘要: 研究质疑大语言模型与人脑语言处理的相似性,发现高脑分数主要由句子长度和位置等简单特征解释。
- 大语言模型的低资源安全增强方法
- 摘要: 提出一种无需监督微调或人类反馈强化学习的低资源安全增强方法,通过知识蒸馏提升未对齐模型的防御能力。
- 大语言模型中概念几何结构的研究
- 摘要: 本文研究了大语言模型中语义编码的两个基础问题:分类概念的表示和概念间的层次关系。
- 输出嵌入中的令牌概率编码研究
- 摘要: 本文研究了语言模型输出嵌入中的令牌概率信息,发现编码稀疏性,并通过删除无关维度优化输出分布。
- 通过覆盖性理解偏好微调
- 摘要: 本文分析了在线RL和离线对比方法在偏好微调中的异同,提出了结合两者优势的HyPO算法,提高了性能和效率。
大模型开源项目
- 跨平台GPT-4o实现
- 摘要: gpt-4o项目支持在Windows、macOS和Ubuntu上运行,使用Python语言编写,提供跨平台AI解决方案。
- VinciGit00: AI Python爬虫
- 摘要: VinciGit00是一个基于AI的Python爬虫项目,用于自动化数据抓取,提升效率和准确性。
- ToonCrafter:生成卡通插值研究
- 摘要: ToonCrafter是一个用Python编写的AI项目,旨在研究生成卡通插值技术,助力动画制作与创意设计。
- 基于NVIDIA Isaac Sim的机器人学习框架
- 摘要: isaac-sim是一个统一的机器人学习框架,基于NVIDIA Isaac Sim构建,使用Python语言编写。
- 微软生成式AI入门教程
- 摘要: 微软发布18课生成式AI入门教程,帮助初学者使用Jupyter Notebook语言构建生成式AI应用。
- 从零开始用PyTorch实现ChatGPT
- 摘要: 本项目在Jupyter Notebook中,逐步实现了一个类似ChatGPT的大语言模型,使用PyTorch框架进行构建。
- MiniCPM-Llama3-V 2.5手机端多模态LLM
- 摘要: MiniCPM-Llama3-V 2.5是一款在手机上运行的GPT-4V级别多模态大语言模型,使用Python编写。
相关文章:
大模型日报2024-06-05
大模型日报 2024-06-05 大模型资讯 AI气象预测取得重大进展:单台桌面电脑即可运行全球天气模型 摘要: 一项新的人工智能天气预测模型已经取得重大进展,该模型能够在一台普通的桌面电脑上运行,预测全球天气。这意味着即使没有复杂的物理计算&a…...
LLM 大模型学习必知必会系列(二):提示词工程-Prompt Engineering 以及实战闯关
角色扮演:在系统指令中告诉千问你需要它扮演的角色,即可沉浸式和该角色对话交流语言风格:简单调整 LLM 的语言风格任务设定:比如旅行规划,小红书文案助手这样的专项任务处理System message 也可以被用于规定 LLM 的答复…...
Spring系统学习 - Spring入门
什么是Spring? Spring翻译过来就是春天的意思,字面意思,冠以Spring的意思就是想表示使用这个框架,代表程序员的春天来了,实际上就是让开发更加简单方便,实际上Spring确实做到了。 官网地址:ht…...
Priority_queue
一、priority_queue的介绍和使用 1.1 priority_queue的介绍 1.优先队列是一种容器适配器,根据严格的弱排序标准,它的第一个元素总是它所包含的元素中最大的。 2.优先队列类似于堆, 在堆中可以随时插入元素, 并且只能检索最大堆…...
SpringMVC:获取请求数据
1. 通过RequestParma注解接收 /**** value和name都可以使用,互为别名* 如果此处设置了需要什么参数而前端请求时没有提供则会报400(请求参数不一致错误)* required参数用于设置该参数是否为必须传递参数,默认为true必须传递* defa…...
深度学习 --- stanford cs231 编程作业(assignment1,Q2: SVM分类器)
stanford cs231 编程作业之SVM分类器 写在最前面: 深度学习,或者是广义上的任何学习,都是“行千里路”胜过“读万卷书”的学识。这两天光是学了斯坦福cs231n的一些基础理论,越往后学越觉得没什么。但听的云里雾里的地方也越来越多…...
【scikit-learn010】sklearn算法模型清单实战及经验总结(已更新)
1.一直以来想写下基于scikit-learn训练AI算法的系列文章,作为较火的机器学习框架,也是日常项目开发中常用的一款工具,最近刚好挤时间梳理、总结下这块儿的知识体系。 2.熟悉、梳理、总结下scikit-learn框架模型算法包相关技术点及经验。 3.欢迎批评指正,欢迎互三,跪谢一键…...
Rethinking overlooked aspects in vision-language models
探讨多模态视觉语言模型的一些有趣结论欢迎关注 CVHub!https://mp.weixin.qq.com/s/zouNu-g-33_7JoX3Uscxtw1.Introduction 多模态模型架构上的变化不大,数据的差距比较大,输入分辨率和输入llm的视觉token大小是比较关键的,适配器,VIT和语言模型则不是那么关键。InternVL-…...
【漯河市人才交流中心_登录安全分析报告-Ajax泄漏滑动距离导致安全隐患】
前言 由于网站注册入口容易被黑客攻击,存在如下安全问题: 暴力破解密码,造成用户信息泄露短信盗刷的安全问题,影响业务及导致用户投诉带来经济损失,尤其是后付费客户,风险巨大,造成亏损无底洞…...
C语言—字符函数和字符串函数
1.字符分类函数 C语言中有一系列的函数是专门做字符分类的,也就是一个字符是属于什么类型的字符的。 这些函数的使用都需要包含一个头文件 ctype.h。 例:将一句话中的小写字母改成大写字母。 2.字符转换函数 头文件:ctype.h C语言提供了2…...
爬山算法的详细介绍
爬山算法(Hill Climbing Algorithm)是一种基于启发式的局部搜索算法,常用于解决优化问题。它的核心思想是从当前解的邻域中选择能够使目标函数值最大(或最小)的下一个解作为当前解,直到找到一个满足问题要求…...
硕士课程 可穿戴设备之作业一
作业一 第一个代码使用的方法是出自于[1]。 框架结构 如下图,不过根据对代码的解读,发现作者在代码中省去了对SSR部件的实现,下文再说。 Troika框架由三个关键部件组成:信号分解,SSR和光谱峰值跟踪。(粗…...
测试记录3:WLS2运行Linux界面
1.WLS1转到WLS2 (1)根据自己的平台,下载WLS2安装包 x64: https://wslstorestorage.blob.core.windows.net/wslblob/wsl_update_x64.msi arm64: https://wslstorestorage.blob.core.windows.net/wslblob/wsl_update_arm64.msi (2&…...
好用软件推荐
软件功能相关介绍地址FastStone截图(长截图、定时截图等)CSDNhttps://www.faststone.org/FSCaptureDownload.htmQuicker快捷访问https://getquicker.net/https://getquicker.net/...
王学岗鸿蒙开发(北向)——————(二)TS基本语法详解
1,Ts(TypeScript)语法相当于JAVAScript类型,鸿蒙arkTs是基于TS语言的,当然artTs也融合了其它的语言。 2,本篇文章是基于n9版本。注意,有些语法是已经不能用的。 3, 4,变量:用来存储数据,数字字母组成,数字不…...
【网络协议 | HTTP】HTTP总结与全梳理(一) —— HTTP协议超详细教程
🔥博客简介:开了几个专栏,针对 Linux 和 rtos 系统,嵌入式开发和音视频开发,结合多年工作经验,跟大家分享交流嵌入式软硬件技术、音视频技术的干货。 ✍️系列专栏:C/C、Linux、rtos、嵌入式…...
java基础选择题--11
1. 以下保留字( )不能出现在说明虚函数原型的语句中。A.static B.operator C.void D.const 参考答案:A 2. 一个类中只能定义一个析构函数。( )A.对 B.错 参考答案:A 解释: 在C中,一个类只能有一个析构函数。析构函数在对象生…...
欲除烦恼须无我,各有前因莫羡人
欲除烦恼须无我,各有前因莫羡人...
Vue的APP实现下载文件功能,并将文件保存到手机中
Vue的APP实现下载文件功能,并将文件保存到手机中 文字说明后台核心代码前台核心代码运行截图项目链接 文字说明 本文介绍Vue实现的APP,将文件下载并保存到手机中,为系统提供导出功能;同时支持导入,即选择本地的文件后&…...
泛微开发修炼之旅--07通过后端代码实现创建并发送待办、源码及示例
文章链接:泛微开发修炼之旅--07通过后端代码实现创建并发送待办、源码及示例...
7.4.分块查找
一.分块查找的算法思想: 1.实例: 以上述图片的顺序表为例, 该顺序表的数据元素从整体来看是乱序的,但如果把这些数据元素分成一块一块的小区间, 第一个区间[0,1]索引上的数据元素都是小于等于10的, 第二…...
PPT|230页| 制造集团企业供应链端到端的数字化解决方案:从需求到结算的全链路业务闭环构建
制造业采购供应链管理是企业运营的核心环节,供应链协同管理在供应链上下游企业之间建立紧密的合作关系,通过信息共享、资源整合、业务协同等方式,实现供应链的全面管理和优化,提高供应链的效率和透明度,降低供应链的成…...
vscode(仍待补充)
写于2025 6.9 主包将加入vscode这个更权威的圈子 vscode的基本使用 侧边栏 vscode还能连接ssh? debug时使用的launch文件 1.task.json {"tasks": [{"type": "cppbuild","label": "C/C: gcc.exe 生成活动文件"…...
解决Ubuntu22.04 VMware失败的问题 ubuntu入门之二十八
现象1 打开VMware失败 Ubuntu升级之后打开VMware上报需要安装vmmon和vmnet,点击确认后如下提示 最终上报fail 解决方法 内核升级导致,需要在新内核下重新下载编译安装 查看版本 $ vmware -v VMware Workstation 17.5.1 build-23298084$ lsb_release…...
【单片机期末】单片机系统设计
主要内容:系统状态机,系统时基,系统需求分析,系统构建,系统状态流图 一、题目要求 二、绘制系统状态流图 题目:根据上述描述绘制系统状态流图,注明状态转移条件及方向。 三、利用定时器产生时…...
前端开发面试题总结-JavaScript篇(一)
文章目录 JavaScript高频问答一、作用域与闭包1.什么是闭包(Closure)?闭包有什么应用场景和潜在问题?2.解释 JavaScript 的作用域链(Scope Chain) 二、原型与继承3.原型链是什么?如何实现继承&a…...
精益数据分析(97/126):邮件营销与用户参与度的关键指标优化指南
精益数据分析(97/126):邮件营销与用户参与度的关键指标优化指南 在数字化营销时代,邮件列表效度、用户参与度和网站性能等指标往往决定着创业公司的增长成败。今天,我们将深入解析邮件打开率、网站可用性、页面参与时…...
在Ubuntu24上采用Wine打开SourceInsight
1. 安装wine sudo apt install wine 2. 安装32位库支持,SourceInsight是32位程序 sudo dpkg --add-architecture i386 sudo apt update sudo apt install wine32:i386 3. 验证安装 wine --version 4. 安装必要的字体和库(解决显示问题) sudo apt install fonts-wqy…...
JVM虚拟机:内存结构、垃圾回收、性能优化
1、JVM虚拟机的简介 Java 虚拟机(Java Virtual Machine 简称:JVM)是运行所有 Java 程序的抽象计算机,是 Java 语言的运行环境,实现了 Java 程序的跨平台特性。JVM 屏蔽了与具体操作系统平台相关的信息,使得 Java 程序只需生成在 JVM 上运行的目标代码(字节码),就可以…...
Golang——6、指针和结构体
指针和结构体 1、指针1.1、指针地址和指针类型1.2、指针取值1.3、new和make 2、结构体2.1、type关键字的使用2.2、结构体的定义和初始化2.3、结构体方法和接收者2.4、给任意类型添加方法2.5、结构体的匿名字段2.6、嵌套结构体2.7、嵌套匿名结构体2.8、结构体的继承 3、结构体与…...
