当前位置: 首页 > news >正文

大模型日报2024-06-05

大模型日报

 

2024-06-05

 

大模型资讯

 

  1. AI气象预测取得重大进展:单台桌面电脑即可运行全球天气模型

 

  • 摘要: 一项新的人工智能天气预测模型已经取得重大进展,该模型能够在一台普通的桌面电脑上运行,预测全球天气。这意味着即使没有复杂的物理计算,AI也能有效进行天气预报。

 

  1. SimPO:提升大语言模型RLHF效率与可扩展性的新方法

 

  • 摘要: SimPO突破参考模型限制,解锁大语言模型强化学习人类反馈(RLHF)的高效与可扩展性。人工智能不断进化,重点在于优化算法以提升大模型的性能和效率。

 

  1. HuggingFace发布FineWeb:用于LLM预训练的大规模数据集

 

  • 摘要: HuggingFace推出FineWeb数据集,包含15万亿个标记和44TB磁盘空间,旨在提升大语言模型(LLM)的训练效果。

 

  1. 微软推出大语言模型在线对齐的主动偏好引导方法

 

  • 摘要: 微软的机器学习研究引入了一种主动偏好引导方法,用于大语言模型(LLMs)的在线对齐。这些模型因其增强的跟随人类指令能力,在近期取得了显著进展。

 

  1. 多标记预测:大语言模型性能与效率的飞跃

 

  • 摘要: 研究人员探索了多标记预测技术在大语言模型中的应用,显著提升了模型的性能和效率。这一突破性的研究为大语言模型的发展带来了新的可能性。

 

  1. ChatMOF:预测和生成金属有机框架的人工智能系统

 

  • 摘要: ChatMOF是一种人工智能系统,专为预测和生成金属有机框架(MOFs)而设计。该系统利用大型数据集和先进的AI技术,能够高效地生成和评估MOFs,为材料科学和化学研究提供重要支持。

 

  1. IPA子公司BioStrand推出用于电子健康记录的先进大语言模型

 

  • 摘要: IPA(IMMUNOPRECISE ANTIBODIES LTD.)的子公司BioStrand宣布推出一款用于电子健康记录(EHR)的先进大语言模型。此次发布旨在提升EHR的处理和分析能力,为医疗行业带来新的创新和效率。

 

  1. 亚马逊在秋季发布会上为Alexa引入生成式AI

 

  • 摘要: 亚马逊在秋季发布会上宣布为Alexa引入生成式AI,并推出多款新设备,包括第三代Echo Show 8、Echo Hub等。

 

  1. SAP与Mistral AI合作:AI技术与专业知识的结合

 

  • 摘要: SAP与领先的大型语言模型制造商Mistral AI达成合作。这次合作是AI专业知识与技术的共生结合,旨在推动双方在AI领域的发展与创新。

 

  1. AI在国际象棋中的表现:部分出色,部分令人失望

 

  • 摘要: 新的基准测试显示,即使是最新的大型语言模型(LLMs)在国际象棋方面也不是最强的选手。AI在推动棋子的能力上表现出部分出色和部分令人失望的结果。

 

大模型产品

 

大模型论文

 

  1. PlanAgent:基于多模态大语言模型的车辆运动规划

 

  • 摘要: PlanAgent利用多模态大语言模型,通过环境转换、推理引擎和反思模块,实现车辆运动规划的常识推理和广泛适应性,优于现有方法。

 

  1. MMLU-Pro: 更具挑战性的多任务语言理解基准

 

  • 摘要: MMLU-Pro通过增加推理题和扩展选项,提高挑战性和稳定性,显著降低模型准确率,更好评估AI进展。

 

  1. Helix: 异构GPU集群上的LLM高效分布式服务

 

  • 摘要: Helix通过最大流模型优化LLM推理,使用MILP算法提高异构GPU集群的吞吐量和降低延迟,性能显著提升。

 

  1. LoFiT: 局部微调LLM表示

 

  • 摘要: 本文提出LoFiT框架,通过选择特定注意力头进行局部微调,提高LLM在真确性和推理任务中的表现,且参数修改量显著减少。

 

  1. 信息瓶颈视角的检索增强生成噪声过滤

 

  • 摘要: 提出信息瓶颈理论用于检索增强生成,过滤噪声,提升问答数据集生成答案的正确性和简洁性。

 

  1. 大语言模型与大脑映射的质疑

 

  • 摘要: 研究质疑大语言模型与人脑语言处理的相似性,发现高脑分数主要由句子长度和位置等简单特征解释。

 

  1. 大语言模型的低资源安全增强方法

 

  • 摘要: 提出一种无需监督微调或人类反馈强化学习的低资源安全增强方法,通过知识蒸馏提升未对齐模型的防御能力。

 

  1. 大语言模型中概念几何结构的研究

 

  • 摘要: 本文研究了大语言模型中语义编码的两个基础问题:分类概念的表示和概念间的层次关系。

 

  1. 输出嵌入中的令牌概率编码研究

 

  • 摘要: 本文研究了语言模型输出嵌入中的令牌概率信息,发现编码稀疏性,并通过删除无关维度优化输出分布。

 

  1. 通过覆盖性理解偏好微调

 

  • 摘要: 本文分析了在线RL和离线对比方法在偏好微调中的异同,提出了结合两者优势的HyPO算法,提高了性能和效率。

 

大模型开源项目

 

  1. 跨平台GPT-4o实现

 

  • 摘要: gpt-4o项目支持在Windows、macOS和Ubuntu上运行,使用Python语言编写,提供跨平台AI解决方案。

 

  1. VinciGit00: AI Python爬虫

 

  • 摘要: VinciGit00是一个基于AI的Python爬虫项目,用于自动化数据抓取,提升效率和准确性。

 

  1. ToonCrafter:生成卡通插值研究

 

  • 摘要: ToonCrafter是一个用Python编写的AI项目,旨在研究生成卡通插值技术,助力动画制作与创意设计。

 

  1. 基于NVIDIA Isaac Sim的机器人学习框架

 

  • 摘要: isaac-sim是一个统一的机器人学习框架,基于NVIDIA Isaac Sim构建,使用Python语言编写。

 

  1. 微软生成式AI入门教程

 

  • 摘要: 微软发布18课生成式AI入门教程,帮助初学者使用Jupyter Notebook语言构建生成式AI应用。

 

  1. 从零开始用PyTorch实现ChatGPT

 

  • 摘要: 本项目在Jupyter Notebook中,逐步实现了一个类似ChatGPT的大语言模型,使用PyTorch框架进行构建。

 

  1. MiniCPM-Llama3-V 2.5手机端多模态LLM

 

  • 摘要: MiniCPM-Llama3-V 2.5是一款在手机上运行的GPT-4V级别多模态大语言模型,使用Python编写。

相关文章:

大模型日报2024-06-05

大模型日报 2024-06-05 大模型资讯 AI气象预测取得重大进展:单台桌面电脑即可运行全球天气模型 摘要: 一项新的人工智能天气预测模型已经取得重大进展,该模型能够在一台普通的桌面电脑上运行,预测全球天气。这意味着即使没有复杂的物理计算&a…...

LLM 大模型学习必知必会系列(二):提示词工程-Prompt Engineering 以及实战闯关

角色扮演:在系统指令中告诉千问你需要它扮演的角色,即可沉浸式和该角色对话交流语言风格:简单调整 LLM 的语言风格任务设定:比如旅行规划,小红书文案助手这样的专项任务处理System message 也可以被用于规定 LLM 的答复…...

Spring系统学习 - Spring入门

什么是Spring? Spring翻译过来就是春天的意思,字面意思,冠以Spring的意思就是想表示使用这个框架,代表程序员的春天来了,实际上就是让开发更加简单方便,实际上Spring确实做到了。 官网地址:ht…...

Priority_queue

一、priority_queue的介绍和使用 1.1 priority_queue的介绍 1.优先队列是一种容器适配器,根据严格的弱排序标准,它的第一个元素总是它所包含的元素中最大的。 2.优先队列类似于堆, 在堆中可以随时插入元素, 并且只能检索最大堆…...

SpringMVC:获取请求数据

1. 通过RequestParma注解接收 /**** value和name都可以使用,互为别名* 如果此处设置了需要什么参数而前端请求时没有提供则会报400(请求参数不一致错误)* required参数用于设置该参数是否为必须传递参数,默认为true必须传递* defa…...

深度学习 --- stanford cs231 编程作业(assignment1,Q2: SVM分类器)

stanford cs231 编程作业之SVM分类器 写在最前面: 深度学习,或者是广义上的任何学习,都是“行千里路”胜过“读万卷书”的学识。这两天光是学了斯坦福cs231n的一些基础理论,越往后学越觉得没什么。但听的云里雾里的地方也越来越多…...

【scikit-learn010】sklearn算法模型清单实战及经验总结(已更新)

1.一直以来想写下基于scikit-learn训练AI算法的系列文章,作为较火的机器学习框架,也是日常项目开发中常用的一款工具,最近刚好挤时间梳理、总结下这块儿的知识体系。 2.熟悉、梳理、总结下scikit-learn框架模型算法包相关技术点及经验。 3.欢迎批评指正,欢迎互三,跪谢一键…...

Rethinking overlooked aspects in vision-language models

探讨多模态视觉语言模型的一些有趣结论欢迎关注 CVHub!https://mp.weixin.qq.com/s/zouNu-g-33_7JoX3Uscxtw1.Introduction 多模态模型架构上的变化不大,数据的差距比较大,输入分辨率和输入llm的视觉token大小是比较关键的,适配器,VIT和语言模型则不是那么关键。InternVL-…...

【漯河市人才交流中心_登录安全分析报告-Ajax泄漏滑动距离导致安全隐患】

前言 由于网站注册入口容易被黑客攻击,存在如下安全问题: 暴力破解密码,造成用户信息泄露短信盗刷的安全问题,影响业务及导致用户投诉带来经济损失,尤其是后付费客户,风险巨大,造成亏损无底洞…...

C语言—字符函数和字符串函数

1.字符分类函数 C语言中有一系列的函数是专门做字符分类的,也就是一个字符是属于什么类型的字符的。 这些函数的使用都需要包含一个头文件 ctype.h。 例:将一句话中的小写字母改成大写字母。 2.字符转换函数 头文件:ctype.h C语言提供了2…...

爬山算法的详细介绍

爬山算法(Hill Climbing Algorithm)是一种基于启发式的局部搜索算法,常用于解决优化问题。它的核心思想是从当前解的邻域中选择能够使目标函数值最大(或最小)的下一个解作为当前解,直到找到一个满足问题要求…...

硕士课程 可穿戴设备之作业一

作业一 第一个代码使用的方法是出自于[1]。 框架结构 如下图,不过根据对代码的解读,发现作者在代码中省去了对SSR部件的实现,下文再说。 Troika框架由三个关键部件组成:信号分解,SSR和光谱峰值跟踪。(粗…...

测试记录3:WLS2运行Linux界面

1.WLS1转到WLS2 (1)根据自己的平台,下载WLS2安装包 x64: https://wslstorestorage.blob.core.windows.net/wslblob/wsl_update_x64.msi arm64: https://wslstorestorage.blob.core.windows.net/wslblob/wsl_update_arm64.msi (2&…...

好用软件推荐

软件功能相关介绍地址FastStone截图(长截图、定时截图等)CSDNhttps://www.faststone.org/FSCaptureDownload.htmQuicker快捷访问https://getquicker.net/https://getquicker.net/...

王学岗鸿蒙开发(北向)——————(二)TS基本语法详解

1,Ts(TypeScript)语法相当于JAVAScript类型,鸿蒙arkTs是基于TS语言的,当然artTs也融合了其它的语言。 2,本篇文章是基于n9版本。注意,有些语法是已经不能用的。 3, 4,变量:用来存储数据,数字字母组成,数字不…...

【网络协议 | HTTP】HTTP总结与全梳理(一) —— HTTP协议超详细教程

🔥博客简介:开了几个专栏,针对 Linux 和 rtos 系统,嵌入式开发和音视频开发,结合多年工作经验,跟大家分享交流嵌入式软硬件技术、音视频技术的干货。   ✍️系列专栏:C/C、Linux、rtos、嵌入式…...

java基础选择题--11

1. 以下保留字( )不能出现在说明虚函数原型的语句中。A.static B.operator C.void D.const 参考答案:A 2. 一个类中只能定义一个析构函数。( )A.对 B.错 参考答案:A 解释: 在C中,一个类只能有一个析构函数。析构函数在对象生…...

欲除烦恼须无我,各有前因莫羡人

欲除烦恼须无我,各有前因莫羡人...

Vue的APP实现下载文件功能,并将文件保存到手机中

Vue的APP实现下载文件功能,并将文件保存到手机中 文字说明后台核心代码前台核心代码运行截图项目链接 文字说明 本文介绍Vue实现的APP,将文件下载并保存到手机中,为系统提供导出功能;同时支持导入,即选择本地的文件后&…...

泛微开发修炼之旅--07通过后端代码实现创建并发送待办、源码及示例

文章链接:泛微开发修炼之旅--07通过后端代码实现创建并发送待办、源码及示例...

C++初阶-list的底层

目录 1.std::list实现的所有代码 2.list的简单介绍 2.1实现list的类 2.2_list_iterator的实现 2.2.1_list_iterator实现的原因和好处 2.2.2_list_iterator实现 2.3_list_node的实现 2.3.1. 避免递归的模板依赖 2.3.2. 内存布局一致性 2.3.3. 类型安全的替代方案 2.3.…...

【入坑系列】TiDB 强制索引在不同库下不生效问题

文章目录 背景SQL 优化情况线上SQL运行情况分析怀疑1:执行计划绑定问题?尝试:SHOW WARNINGS 查看警告探索 TiDB 的 USE_INDEX 写法Hint 不生效问题排查解决参考背景 项目中使用 TiDB 数据库,并对 SQL 进行优化了,添加了强制索引。 UAT 环境已经生效,但 PROD 环境强制索…...

java 实现excel文件转pdf | 无水印 | 无限制

文章目录 目录 文章目录 前言 1.项目远程仓库配置 2.pom文件引入相关依赖 3.代码破解 二、Excel转PDF 1.代码实现 2.Aspose.License.xml 授权文件 总结 前言 java处理excel转pdf一直没找到什么好用的免费jar包工具,自己手写的难度,恐怕高级程序员花费一年的事件,也…...

渗透实战PortSwigger靶场-XSS Lab 14:大多数标签和属性被阻止

<script>标签被拦截 我们需要把全部可用的 tag 和 event 进行暴力破解 XSS cheat sheet&#xff1a; https://portswigger.net/web-security/cross-site-scripting/cheat-sheet 通过爆破发现body可以用 再把全部 events 放进去爆破 这些 event 全部可用 <body onres…...

蓝牙 BLE 扫描面试题大全(2):进阶面试题与实战演练

前文覆盖了 BLE 扫描的基础概念与经典问题蓝牙 BLE 扫描面试题大全(1)&#xff1a;从基础到实战的深度解析-CSDN博客&#xff0c;但实际面试中&#xff0c;企业更关注候选人对复杂场景的应对能力&#xff08;如多设备并发扫描、低功耗与高发现率的平衡&#xff09;和前沿技术的…...

【python异步多线程】异步多线程爬虫代码示例

claude生成的python多线程、异步代码示例&#xff0c;模拟20个网页的爬取&#xff0c;每个网页假设要0.5-2秒完成。 代码 Python多线程爬虫教程 核心概念 多线程&#xff1a;允许程序同时执行多个任务&#xff0c;提高IO密集型任务&#xff08;如网络请求&#xff09;的效率…...

AI书签管理工具开发全记录(十九):嵌入资源处理

1.前言 &#x1f4dd; 在上一篇文章中&#xff0c;我们完成了书签的导入导出功能。本篇文章我们研究如何处理嵌入资源&#xff0c;方便后续将资源打包到一个可执行文件中。 2.embed介绍 &#x1f3af; Go 1.16 引入了革命性的 embed 包&#xff0c;彻底改变了静态资源管理的…...

安卓基础(aar)

重新设置java21的环境&#xff0c;临时设置 $env:JAVA_HOME "D:\Android Studio\jbr" 查看当前环境变量 JAVA_HOME 的值 echo $env:JAVA_HOME 构建ARR文件 ./gradlew :private-lib:assembleRelease 目录是这样的&#xff1a; MyApp/ ├── app/ …...

R语言速释制剂QBD解决方案之三

本文是《Quality by Design for ANDAs: An Example for Immediate-Release Dosage Forms》第一个处方的R语言解决方案。 第一个处方研究评估原料药粒径分布、MCC/Lactose比例、崩解剂用量对制剂CQAs的影响。 第二处方研究用于理解颗粒外加硬脂酸镁和滑石粉对片剂质量和可生产…...

排序算法总结(C++)

目录 一、稳定性二、排序算法选择、冒泡、插入排序归并排序随机快速排序堆排序基数排序计数排序 三、总结 一、稳定性 排序算法的稳定性是指&#xff1a;同样大小的样本 **&#xff08;同样大小的数据&#xff09;**在排序之后不会改变原始的相对次序。 稳定性对基础类型对象…...