当前位置: 首页 > news >正文

大模型日报2024-06-05

大模型日报

 

2024-06-05

 

大模型资讯

 

  1. AI气象预测取得重大进展:单台桌面电脑即可运行全球天气模型

 

  • 摘要: 一项新的人工智能天气预测模型已经取得重大进展,该模型能够在一台普通的桌面电脑上运行,预测全球天气。这意味着即使没有复杂的物理计算,AI也能有效进行天气预报。

 

  1. SimPO:提升大语言模型RLHF效率与可扩展性的新方法

 

  • 摘要: SimPO突破参考模型限制,解锁大语言模型强化学习人类反馈(RLHF)的高效与可扩展性。人工智能不断进化,重点在于优化算法以提升大模型的性能和效率。

 

  1. HuggingFace发布FineWeb:用于LLM预训练的大规模数据集

 

  • 摘要: HuggingFace推出FineWeb数据集,包含15万亿个标记和44TB磁盘空间,旨在提升大语言模型(LLM)的训练效果。

 

  1. 微软推出大语言模型在线对齐的主动偏好引导方法

 

  • 摘要: 微软的机器学习研究引入了一种主动偏好引导方法,用于大语言模型(LLMs)的在线对齐。这些模型因其增强的跟随人类指令能力,在近期取得了显著进展。

 

  1. 多标记预测:大语言模型性能与效率的飞跃

 

  • 摘要: 研究人员探索了多标记预测技术在大语言模型中的应用,显著提升了模型的性能和效率。这一突破性的研究为大语言模型的发展带来了新的可能性。

 

  1. ChatMOF:预测和生成金属有机框架的人工智能系统

 

  • 摘要: ChatMOF是一种人工智能系统,专为预测和生成金属有机框架(MOFs)而设计。该系统利用大型数据集和先进的AI技术,能够高效地生成和评估MOFs,为材料科学和化学研究提供重要支持。

 

  1. IPA子公司BioStrand推出用于电子健康记录的先进大语言模型

 

  • 摘要: IPA(IMMUNOPRECISE ANTIBODIES LTD.)的子公司BioStrand宣布推出一款用于电子健康记录(EHR)的先进大语言模型。此次发布旨在提升EHR的处理和分析能力,为医疗行业带来新的创新和效率。

 

  1. 亚马逊在秋季发布会上为Alexa引入生成式AI

 

  • 摘要: 亚马逊在秋季发布会上宣布为Alexa引入生成式AI,并推出多款新设备,包括第三代Echo Show 8、Echo Hub等。

 

  1. SAP与Mistral AI合作:AI技术与专业知识的结合

 

  • 摘要: SAP与领先的大型语言模型制造商Mistral AI达成合作。这次合作是AI专业知识与技术的共生结合,旨在推动双方在AI领域的发展与创新。

 

  1. AI在国际象棋中的表现:部分出色,部分令人失望

 

  • 摘要: 新的基准测试显示,即使是最新的大型语言模型(LLMs)在国际象棋方面也不是最强的选手。AI在推动棋子的能力上表现出部分出色和部分令人失望的结果。

 

大模型产品

 

大模型论文

 

  1. PlanAgent:基于多模态大语言模型的车辆运动规划

 

  • 摘要: PlanAgent利用多模态大语言模型,通过环境转换、推理引擎和反思模块,实现车辆运动规划的常识推理和广泛适应性,优于现有方法。

 

  1. MMLU-Pro: 更具挑战性的多任务语言理解基准

 

  • 摘要: MMLU-Pro通过增加推理题和扩展选项,提高挑战性和稳定性,显著降低模型准确率,更好评估AI进展。

 

  1. Helix: 异构GPU集群上的LLM高效分布式服务

 

  • 摘要: Helix通过最大流模型优化LLM推理,使用MILP算法提高异构GPU集群的吞吐量和降低延迟,性能显著提升。

 

  1. LoFiT: 局部微调LLM表示

 

  • 摘要: 本文提出LoFiT框架,通过选择特定注意力头进行局部微调,提高LLM在真确性和推理任务中的表现,且参数修改量显著减少。

 

  1. 信息瓶颈视角的检索增强生成噪声过滤

 

  • 摘要: 提出信息瓶颈理论用于检索增强生成,过滤噪声,提升问答数据集生成答案的正确性和简洁性。

 

  1. 大语言模型与大脑映射的质疑

 

  • 摘要: 研究质疑大语言模型与人脑语言处理的相似性,发现高脑分数主要由句子长度和位置等简单特征解释。

 

  1. 大语言模型的低资源安全增强方法

 

  • 摘要: 提出一种无需监督微调或人类反馈强化学习的低资源安全增强方法,通过知识蒸馏提升未对齐模型的防御能力。

 

  1. 大语言模型中概念几何结构的研究

 

  • 摘要: 本文研究了大语言模型中语义编码的两个基础问题:分类概念的表示和概念间的层次关系。

 

  1. 输出嵌入中的令牌概率编码研究

 

  • 摘要: 本文研究了语言模型输出嵌入中的令牌概率信息,发现编码稀疏性,并通过删除无关维度优化输出分布。

 

  1. 通过覆盖性理解偏好微调

 

  • 摘要: 本文分析了在线RL和离线对比方法在偏好微调中的异同,提出了结合两者优势的HyPO算法,提高了性能和效率。

 

大模型开源项目

 

  1. 跨平台GPT-4o实现

 

  • 摘要: gpt-4o项目支持在Windows、macOS和Ubuntu上运行,使用Python语言编写,提供跨平台AI解决方案。

 

  1. VinciGit00: AI Python爬虫

 

  • 摘要: VinciGit00是一个基于AI的Python爬虫项目,用于自动化数据抓取,提升效率和准确性。

 

  1. ToonCrafter:生成卡通插值研究

 

  • 摘要: ToonCrafter是一个用Python编写的AI项目,旨在研究生成卡通插值技术,助力动画制作与创意设计。

 

  1. 基于NVIDIA Isaac Sim的机器人学习框架

 

  • 摘要: isaac-sim是一个统一的机器人学习框架,基于NVIDIA Isaac Sim构建,使用Python语言编写。

 

  1. 微软生成式AI入门教程

 

  • 摘要: 微软发布18课生成式AI入门教程,帮助初学者使用Jupyter Notebook语言构建生成式AI应用。

 

  1. 从零开始用PyTorch实现ChatGPT

 

  • 摘要: 本项目在Jupyter Notebook中,逐步实现了一个类似ChatGPT的大语言模型,使用PyTorch框架进行构建。

 

  1. MiniCPM-Llama3-V 2.5手机端多模态LLM

 

  • 摘要: MiniCPM-Llama3-V 2.5是一款在手机上运行的GPT-4V级别多模态大语言模型,使用Python编写。

相关文章:

大模型日报2024-06-05

大模型日报 2024-06-05 大模型资讯 AI气象预测取得重大进展:单台桌面电脑即可运行全球天气模型 摘要: 一项新的人工智能天气预测模型已经取得重大进展,该模型能够在一台普通的桌面电脑上运行,预测全球天气。这意味着即使没有复杂的物理计算&a…...

LLM 大模型学习必知必会系列(二):提示词工程-Prompt Engineering 以及实战闯关

角色扮演:在系统指令中告诉千问你需要它扮演的角色,即可沉浸式和该角色对话交流语言风格:简单调整 LLM 的语言风格任务设定:比如旅行规划,小红书文案助手这样的专项任务处理System message 也可以被用于规定 LLM 的答复…...

Spring系统学习 - Spring入门

什么是Spring? Spring翻译过来就是春天的意思,字面意思,冠以Spring的意思就是想表示使用这个框架,代表程序员的春天来了,实际上就是让开发更加简单方便,实际上Spring确实做到了。 官网地址:ht…...

Priority_queue

一、priority_queue的介绍和使用 1.1 priority_queue的介绍 1.优先队列是一种容器适配器,根据严格的弱排序标准,它的第一个元素总是它所包含的元素中最大的。 2.优先队列类似于堆, 在堆中可以随时插入元素, 并且只能检索最大堆…...

SpringMVC:获取请求数据

1. 通过RequestParma注解接收 /**** value和name都可以使用,互为别名* 如果此处设置了需要什么参数而前端请求时没有提供则会报400(请求参数不一致错误)* required参数用于设置该参数是否为必须传递参数,默认为true必须传递* defa…...

深度学习 --- stanford cs231 编程作业(assignment1,Q2: SVM分类器)

stanford cs231 编程作业之SVM分类器 写在最前面: 深度学习,或者是广义上的任何学习,都是“行千里路”胜过“读万卷书”的学识。这两天光是学了斯坦福cs231n的一些基础理论,越往后学越觉得没什么。但听的云里雾里的地方也越来越多…...

【scikit-learn010】sklearn算法模型清单实战及经验总结(已更新)

1.一直以来想写下基于scikit-learn训练AI算法的系列文章,作为较火的机器学习框架,也是日常项目开发中常用的一款工具,最近刚好挤时间梳理、总结下这块儿的知识体系。 2.熟悉、梳理、总结下scikit-learn框架模型算法包相关技术点及经验。 3.欢迎批评指正,欢迎互三,跪谢一键…...

Rethinking overlooked aspects in vision-language models

探讨多模态视觉语言模型的一些有趣结论欢迎关注 CVHub!https://mp.weixin.qq.com/s/zouNu-g-33_7JoX3Uscxtw1.Introduction 多模态模型架构上的变化不大,数据的差距比较大,输入分辨率和输入llm的视觉token大小是比较关键的,适配器,VIT和语言模型则不是那么关键。InternVL-…...

【漯河市人才交流中心_登录安全分析报告-Ajax泄漏滑动距离导致安全隐患】

前言 由于网站注册入口容易被黑客攻击,存在如下安全问题: 暴力破解密码,造成用户信息泄露短信盗刷的安全问题,影响业务及导致用户投诉带来经济损失,尤其是后付费客户,风险巨大,造成亏损无底洞…...

C语言—字符函数和字符串函数

1.字符分类函数 C语言中有一系列的函数是专门做字符分类的,也就是一个字符是属于什么类型的字符的。 这些函数的使用都需要包含一个头文件 ctype.h。 例:将一句话中的小写字母改成大写字母。 2.字符转换函数 头文件:ctype.h C语言提供了2…...

爬山算法的详细介绍

爬山算法(Hill Climbing Algorithm)是一种基于启发式的局部搜索算法,常用于解决优化问题。它的核心思想是从当前解的邻域中选择能够使目标函数值最大(或最小)的下一个解作为当前解,直到找到一个满足问题要求…...

硕士课程 可穿戴设备之作业一

作业一 第一个代码使用的方法是出自于[1]。 框架结构 如下图,不过根据对代码的解读,发现作者在代码中省去了对SSR部件的实现,下文再说。 Troika框架由三个关键部件组成:信号分解,SSR和光谱峰值跟踪。(粗…...

测试记录3:WLS2运行Linux界面

1.WLS1转到WLS2 (1)根据自己的平台,下载WLS2安装包 x64: https://wslstorestorage.blob.core.windows.net/wslblob/wsl_update_x64.msi arm64: https://wslstorestorage.blob.core.windows.net/wslblob/wsl_update_arm64.msi (2&…...

好用软件推荐

软件功能相关介绍地址FastStone截图(长截图、定时截图等)CSDNhttps://www.faststone.org/FSCaptureDownload.htmQuicker快捷访问https://getquicker.net/https://getquicker.net/...

王学岗鸿蒙开发(北向)——————(二)TS基本语法详解

1,Ts(TypeScript)语法相当于JAVAScript类型,鸿蒙arkTs是基于TS语言的,当然artTs也融合了其它的语言。 2,本篇文章是基于n9版本。注意,有些语法是已经不能用的。 3, 4,变量:用来存储数据,数字字母组成,数字不…...

【网络协议 | HTTP】HTTP总结与全梳理(一) —— HTTP协议超详细教程

🔥博客简介:开了几个专栏,针对 Linux 和 rtos 系统,嵌入式开发和音视频开发,结合多年工作经验,跟大家分享交流嵌入式软硬件技术、音视频技术的干货。   ✍️系列专栏:C/C、Linux、rtos、嵌入式…...

java基础选择题--11

1. 以下保留字( )不能出现在说明虚函数原型的语句中。A.static B.operator C.void D.const 参考答案:A 2. 一个类中只能定义一个析构函数。( )A.对 B.错 参考答案:A 解释: 在C中,一个类只能有一个析构函数。析构函数在对象生…...

欲除烦恼须无我,各有前因莫羡人

欲除烦恼须无我,各有前因莫羡人...

Vue的APP实现下载文件功能,并将文件保存到手机中

Vue的APP实现下载文件功能,并将文件保存到手机中 文字说明后台核心代码前台核心代码运行截图项目链接 文字说明 本文介绍Vue实现的APP,将文件下载并保存到手机中,为系统提供导出功能;同时支持导入,即选择本地的文件后&…...

泛微开发修炼之旅--07通过后端代码实现创建并发送待办、源码及示例

文章链接:泛微开发修炼之旅--07通过后端代码实现创建并发送待办、源码及示例...

应用升级/灾备测试时使用guarantee 闪回点迅速回退

1.场景 应用要升级,当升级失败时,数据库回退到升级前. 要测试系统,测试完成后,数据库要回退到测试前。 相对于RMAN恢复需要很长时间, 数据库闪回只需要几分钟。 2.技术实现 数据库设置 2个db_recovery参数 创建guarantee闪回点,不需要开启数据库闪回。…...

BCS 2025|百度副总裁陈洋:智能体在安全领域的应用实践

6月5日,2025全球数字经济大会数字安全主论坛暨北京网络安全大会在国家会议中心隆重开幕。百度副总裁陈洋受邀出席,并作《智能体在安全领域的应用实践》主题演讲,分享了在智能体在安全领域的突破性实践。他指出,百度通过将安全能力…...

[Java恶补day16] 238.除自身以外数组的乘积

给你一个整数数组 nums,返回 数组 answer ,其中 answer[i] 等于 nums 中除 nums[i] 之外其余各元素的乘积 。 题目数据 保证 数组 nums之中任意元素的全部前缀元素和后缀的乘积都在 32 位 整数范围内。 请 不要使用除法,且在 O(n) 时间复杂度…...

如何理解 IP 数据报中的 TTL?

目录 前言理解 前言 面试灵魂一问:说说对 IP 数据报中 TTL 的理解?我们都知道,IP 数据报由首部和数据两部分组成,首部又分为两部分:固定部分和可变部分,共占 20 字节,而即将讨论的 TTL 就位于首…...

Linux --进程控制

本文从以下五个方面来初步认识进程控制: 目录 进程创建 进程终止 进程等待 进程替换 模拟实现一个微型shell 进程创建 在Linux系统中我们可以在一个进程使用系统调用fork()来创建子进程,创建出来的进程就是子进程,原来的进程为父进程。…...

rnn判断string中第一次出现a的下标

# coding:utf8 import torch import torch.nn as nn import numpy as np import random import json""" 基于pytorch的网络编写 实现一个RNN网络完成多分类任务 判断字符 a 第一次出现在字符串中的位置 """class TorchModel(nn.Module):def __in…...

Pinocchio 库详解及其在足式机器人上的应用

Pinocchio 库详解及其在足式机器人上的应用 Pinocchio (Pinocchio is not only a nose) 是一个开源的 C 库,专门用于快速计算机器人模型的正向运动学、逆向运动学、雅可比矩阵、动力学和动力学导数。它主要关注效率和准确性,并提供了一个通用的框架&…...

掌握 HTTP 请求:理解 cURL GET 语法

cURL 是一个强大的命令行工具,用于发送 HTTP 请求和与 Web 服务器交互。在 Web 开发和测试中,cURL 经常用于发送 GET 请求来获取服务器资源。本文将详细介绍 cURL GET 请求的语法和使用方法。 一、cURL 基本概念 cURL 是 "Client URL" 的缩写…...

从物理机到云原生:全面解析计算虚拟化技术的演进与应用

前言:我的虚拟化技术探索之旅 我最早接触"虚拟机"的概念是从Java开始的——JVM(Java Virtual Machine)让"一次编写,到处运行"成为可能。这个软件层面的虚拟化让我着迷,但直到后来接触VMware和Doc…...

规则与人性的天平——由高考迟到事件引发的思考

当那位身着校服的考生在考场关闭1分钟后狂奔而至,他涨红的脸上写满绝望。铁门内秒针划过的弧度,成为改变人生的残酷抛物线。家长声嘶力竭的哀求与考务人员机械的"这是规定",构成当代中国教育最尖锐的隐喻。 一、刚性规则的必要性 …...