当前位置: 首页 > news >正文

大模型日报2024-03-24

利用LLMs评分及解释K-12科学答案

  • 摘要: 本文研究了在K-12级科学教育中使用大型语言模型(LLMs)对短答案评分及解释。研究采用GPT-4结合少量样本学习和活跃学习,通过人机协作提供有意义的评估反馈。

MathVerse:多模态LLM解数学题效果评估

  • 摘要: 研究评估多模态大型语言模型(MLLMs)在视觉数学问题解答中的能力。通过创建MathVerse基准,收集并转换2,612个含图表的数学题,提出链式思考评估策略,深入分析MLLMs的理解和推理过程。

大模型高效微调综述

  • 摘要: 本文综述了高效微调大型模型的方法。介绍了各种参数高效微调(PEFT)算法,分析了它们的性能和计算成本,并探讨了减少PEFT计算成本的技术。

个性化视觉语言模型MyVLM研究

  • 摘要: 本研究旨在个性化视觉语言模型(VLMs),通过外部概念头学习用户特定概念,实现个性化图像标题生成和视觉问答。

PSALM:多模态图像分割模型

  • 摘要: PSALM通过引入掩码解码器和输入模式,扩展了大型多模态模型(LMM),解决图像分割任务。支持多数据集联合训练,提升了模型性能和任务泛化能力,在多个基准测试中取得优异成绩,并展现出对未见任务的零样本能力。

医学题目多选分类的大型语言模型

  • 摘要: 本文旨在评估基于多选题数据训练的大型语言模型在医学科目分类中的效能。通过深度神经网络,我们的MQ Sequence-BERT方法在MedMCQA数据集上超越了最新成果,开发集和测试集的准确率分别达到0.68和0.60。

RAmBLA:生物医学领域LLMs可靠性框架

  • 摘要: 本研究提出了RAmBLA框架,用以评估在生物医学领域中作为助手的大型语言模型(LLMs)的可靠性。通过设计模拟真实用户互动的任务,采用语义相似度评估LLMs的表现。

谷歌推动大型语言模型间的社会学习:AI互相学习成新趋势

  • 摘要: 谷歌引领了一场AI发展的革命性转变,实现了大型语言模型(LLMs)之间的社会学习。这一进步受到人类社会学习方式的启发,标志着AI技术在模仿人类学习行为方面迈出了重要一步。

语义解码时代探索

  • 摘要: 本文提出了‘语义解码’新视角,将大型语言模型(LLMs)视为语义处理器,通过优化语义空间内的交互来构建高效输出,探讨了在语义令牌空间内的优化潜力。

基于熵的动态温度采样改善模型生成

  • 摘要: 本文提出了一种基于熵的动态温度(EDT)采样方法,通过动态选择温度参数,有效平衡了大型语言模型生成任务的质量和多样性,并在不同基准测试中显示出显著优势。

Cobra: 多模态大型语言模型高效推理

  • 摘要: 本文提出Cobra模型,将Mamba语言模型扩展到视觉模态,通过线性计算复杂度提升多模态大型语言模型的效率。Cobra在保持竞争性能的同时,参数量仅为LLaVA的43%,并将代码开源。

RankPrompt:提升大型语言模型的准确性和效率

  • 摘要: RankPrompt在人工智能领域取得革命性进展,通过自主评估机制显著提高了大型语言模型(LLMs)的准确性和效率。这标志着对人工智能精细化追求的又一重要里程碑。

清华大学与微软的LLMLingua-2:用数据蒸馏和提示压缩提高大型语言模型效率

  • 摘要: 清华大学联合微软开发的LLMLingua-2大型语言模型采用了任务不可知技术,通过数据蒸馏和提示压缩方法,实现了在处理语言任务时的高效率。该模型的创新方法重新定义了大型语言模型的运行效率,对未来的自然语言处理技术发展具有重要意义。

HyperGAI推出突破性的多模态大型语言模型HPT

  • 摘要: HyperGAI的研究人员开发了Hyper Pretrained Transformers(HPT),这是一种全新的多模态语言模型。HPT能够处理不同类型的数据,为处理和理解多种形式的信息提供了强大的支持,标志着在人工智能领域的一大进步。

大型语言模型与多模态基础模型在精准肿瘤学中的应用进展

  • 摘要: 《npj Precision Oncology》一文报道,自2022年以来,人工智能(AI)技术在大型语言模型和多模态基础模型方面取得了巨大进步,这对肿瘤学领域产生了深远影响。这些进展为精准肿瘤治疗提供了新的工具和方法,有望改善癌症患者的治疗效果和生活质量。

谷歌研究如何超越大型语言模型中的预翻译

  • 摘要: 谷歌的研究人员提出,通过采用直接推理而非预翻译的方式,可以提升大型语言模型的性能。他们认为,直接处理原始语言数据,而不是先将其翻译成中间语言,有助于模型更准确地理解和生成文本。

谷歌即将推出巨型AI模型Gemini,行业趋向精简化

  • 摘要: 据最新消息,谷歌正准备推出一个名为Gemini的巨型语言模型(LLM)。尽管如此,人工智能产业目前正面临一个趋势转变,即从大型生成性AI模型向更小型、更精简的模型过渡。这一变化可能意味着像Gemini这样的巨型模型将变得较为罕见。

KL3M:首个获得“Licensed Model (L) Certification”认证的大型语言模型

  • 摘要: 近日,Fairly Trained宣布推出具有里程碑意义的大型语言模型KL3M。这是首个获得“Licensed Model (L) Certification”认证的语言模型,标志着AI领域的一个重要进展。KL3M的推出预示着语言模型的发展进入了一个全新的、经过公正训练认证的时代。

LLM4Decompile: 开源大型语言模型用于反编译,注重代码可执行性和可重编译性

  • 摘要: LLM4Decompile项目发布了一系列开源的大型语言模型,专注于提高反编译代码的可执行性和可重编译性。这意味着该模型能够将编译后的机器代码更准确地转换回源代码,有助于软件开发和安全分析等领域的工作。

乐天集团发布针对日语优化的开放大型语言模型

  • 摘要: 乐天集团作为其AI化倡议的一部分,发布了针对日语优化的开放式大型语言模型(LLMs)。这些高性能的语言模型旨在实现在各个领域中广泛应用人工智能技术,推动技术进步和创新。

Butternut AI 1.0:秒建AI网站

  • 摘要: Butternut AI是首款AI网站生成器,只需输入商业名称和关键词,即可快速打造定制化、响应式、内置SEO的多页面网站。

SEO AI写手:一键生成SEO内容

  • 摘要: SEO AI Writer是一款自动化工具,能通过分析谷歌搜索结果来创建博客内容。它能够制定结构化大纲,整合关键词以优化文章,并生成相关图片,提高内容的SEO友好度。

Claros:智能AI购物助手

  • 摘要: Claros是一款AI购物助手,旨在快速帮助用户在线找到更好的产品。该工具能够省去长时间的购物研究,提供比其他市场更加相关的商品推荐。

Alfred 5.5集成ChatGPT与DALL-E

  • 摘要: Alfred 5.5更新发布,新增Grid、Text、Image和PDF视图,使搜索结果更加直观生动。此版本重磅整合了ChatGPT与DALL-E,极大丰富了用户体验。

Legitt AI合同生成器:秒速合同草拟

  • 摘要: Legitt AI合同生成器是一款AI驱动的工具,能够在几秒内快速起草合同。该工具支持针对特定用例和需求的定制训练,提高合同制作的效率和准确性。

DataDepot:AI研究终端

  • 摘要: DataDepot是一款先进的AI研究工具,旨在帮助用户通过自然语言快速找到信息,并整合多家领先数据供应商的数据集,实时获取新见解。

QuizWizard AI:一键生成测验

  • 摘要: QuizWizard AI能将视频、文章或谷歌文档一键转化为互动式AI测验。轻松嵌入网站,提升用户参与度,转化为邮件订阅者。

Devika:智能AI编程助手

  • 摘要: Devika是一款开源AI软件工程师,能理解人类指令,研究信息并编写代码。它是Cognition AI的Devin的竞争对手,使用Python语言编写。

Lightning-AI:加速PyTorch模型

  • 摘要: Lightning-AI项目旨在通过Thunder源码编译器,实现PyTorch模型的快速加速。它支持多种硬件执行器同时使用,使用Python语言编写。

Unit-Mesh:多语言AI编程向导

  • 摘要: Unit-Mesh是一款AI编程向导,支持多语言,能自动生成代码,辅助修复bug。它还能自定义提示,并具备开发、测试、文档自动化功能。该项目使用Kotlin语言编写。

Janhq:开源离线版ChatGPT

  • 摘要: Janhq项目是ChatGPT的开源替代品,能够完全离线运行在个人电脑上。该项目使用TypeScript语言编写,旨在提供一个不依赖互联网的智能对话体验。

.NET智能组件AI实验项目

  • 摘要: dotnet-smartcomponents项目旨在为.NET应用程序提供全面的人工智能功能。该项目实验性地集成了端到端AI特性,虽然未标明编写语言,但专为.NET环境设计。

SakanaAI:模型合并优化项目

  • 摘要: SakanaAI是一个Github上的AI趋势项目,专注于利用进化算法优化模型合并策略。该项目使用Python语言编写,旨在通过自动化搜索最佳合并方案,提高模型性能。

相关文章:

大模型日报2024-03-24

利用LLMs评分及解释K-12科学答案 摘要: 本文研究了在K-12级科学教育中使用大型语言模型(LLMs)对短答案评分及解释。研究采用GPT-4结合少量样本学习和活跃学习,通过人机协作提供有意义的评估反馈。 MathVerse:多模态LLM解数学题效果…...

Android kotlin全局悬浮窗全屏功能和锁屏页面全屏悬浮窗功能一

1.前言 在进行app应用开发中,在实现某些功能中要求实现悬浮窗功能,分为应用内悬浮窗 ,全局悬浮窗和 锁屏页面悬浮窗功能 等,接下来就来实现这些悬浮窗全屏功能,首选看下第一部分功能实现 2.kotlin全局悬浮窗全屏功能和锁屏页面全屏悬浮窗功能一分析 悬浮窗是属于Androi…...

图像识别在安防领域的应用

图像识别技术在安防领域有着广泛的应用,它通过分析和理解图像中的视觉信息,为安防系统提供了强大的辅助功能。以下是一些主要的应用领域: 人脸识别:人脸识别技术是安防领域中最常见的应用之一。它可以帮助系统识别和验证个人身份…...

前端面试集中复习 - http篇

1. http请求方式 HTTP请求方式有哪些:GET POST PUT DELETE OPTIONS 1) GET POST 的区别? 场景上: GET 用于获取资源而不对服务器资源做更改提交的请求,多次执行结果一致。用于获取静态数据,幂等。 POST&#xff1…...

C++ - 类和对象(上)

目录 一、类的定义 二、访问限定符 public(公有) protected(保护) private(私有) 三、类声明和定义分离 四、外部变量和成员变量的区别与注意 五、类的实例化 六、类对象的模型 七、类的this指针…...

mysql基础4sql优化

SQL优化 插入数据优化 如果我们需要一次性往数据库表中插入多条记录,可以从以下三个方面进行优化。 insert into tb_test values(1,tom); insert into tb_test values(2,cat); insert into tb_test values(3,jerry);-- 优化方案一:批量插入数据 Inser…...

实现Spring Web MVC中的文件上传功能,并处理大文件和多文件上传

实现Spring Web MVC中的文件上传功能,并处理大文件和多文件上传 在Spring Web MVC中实现文件上传功能并处理大文件和多文件上传是一项常见的任务。下面是一个示例,演示如何在Spring Boot应用程序中实现这一功能: 添加Spring Web依赖&#x…...

搭建vite项目

文章目录 Vite 是一个基于 Webpack 的开发服务器,用于开发 Vue 3 和 Vite 应用程序 一、创建一个vite项目二、集成Vue Router1.安装 vue-routernext插件2.在 src 目录下创建一个名为 router 的文件夹,并在其中创建一个名为 index.js 的文件。在这个文件中…...

Docker 安装mysql 主从复制

目录 1 MySql主从复制简介 1.1 主从复制的概念 1.2 主从复制的作用 2. 搭建主从复制 2.1 pull mysql 镜像 2.2 新建主服务器容器实例 3307 2.2.1 master创建 my.cnf 2.2.2 重启master 2.2.3 进入mysql 容器,创建同步用户 2.3 新建从服务器容器实例 3308…...

GPT每日面试题—如何实现二分查找

充分利用ChatGPT的优势,帮助我们快速准备前端面试。今日问题:如何实现二分查找? Q:如果在前端面试中,被问到如何实现二分查找,如果回答比较好,给出必要的代码示例 A:当被问到如何实…...

机器学习神经网络由哪些构成?

机器学习神经网络通常由以下几个主要组件构成: 1. **输入层(Input Layer)**:输入层接受来自数据源(例如图像、文本等)的原始输入数据。每个输入特征通常表示为输入层中的一个节点。 2. **隐藏层&#xff…...

代码随想录算法训练营day19 | 二叉树阶段性总结

各个部分题目的代码题解都在我往日的二叉树的博客中。 (day14到day22) 目录 二叉树理论基础二叉树的遍历方式深度优先遍历广度优先遍历 求二叉树的属性二叉树的修改与制造求二叉搜索树的属性二叉树公共最先问题二叉搜索树的修改与构造总结 二叉树理论基础 二叉树的理论基础参…...

数据库引论:3、中级SQL

一些更复杂的查询表达 3.1 连接表达式 拼接多张表的几种方式 3.1.1 自然连接 natural join,自动连接在所有共同属性上相同的元组 join… using( A 1 , A 2 , ⋯ A_1,A_2,\cdots A1​,A2​,⋯):使用括号里的属性进行自然连接,除了这些属性之外的共同…...

毕业设计:日志记录编写(3/17起更新中)

目录 3/171.配置阿里云python加速镜像:2. 安装python3.9版本3. 爬虫技术选择4. 数据抓取和整理5. 难点和挑战 3/241.数据库建表信息2.后续进度安排3. 数据处理和分析 3/17 当前周期目标:构建基本的python环境:运行爬虫程序 1.配置阿里云pytho…...

(一)基于IDEA的JAVA基础7

关系运算符 运算符 含义 范例 结果 等于 12 false &#xff01; 不等于 1&#xff01;2 true > 大于 1>2 false < 小于 …...

MySQL数据库概念及MySQL的安装

文章目录 MySQL数据库一、数据库基本概念1、数据2、数据表3、数据库4、数据库管理系统&#xff08;DBMS&#xff09;4.1 数据库的建立和维护功能4.2 数据库的定义功能4.3 数据库的操纵功能4.4 数据库的运行管理功能4.5 数据库的通信功能&#xff08;数据库与外界对接&#xff0…...

redis实际应用场景及并发问题的解决

业务场景 接下来要模拟的业务场景: 每当被普通攻击的时候&#xff0c;有千分之三的概率掉落金币&#xff0c;每回合最多爆出两个金币。 1.每个回合只有15秒。 2.每次普通攻击的时间间隔是0.5s 3.这个服务是一个集群&#xff08;这个要求暂时不实现&#xff09; 编写接口&…...

考研数学|汤家凤《1800》基础部分什么时候做完?

从我个人的经验来看&#xff0c;做完汤家凤1800的基础部分在第一轮复习中并不是必须的&#xff0c;但是可以作为一个有效的复习工具。 我认为汤家凤1800的基础部分确实涵盖了考研高数的基础知识点&#xff0c;并且题目难度适中&#xff0c;适合用来巩固基础。在第一轮复习中&a…...

JS的设计模式(23种)

JavaScript设计模式是指在JavaScript编程中普遍应用的一系列经过验证的最佳实践和可重用的解决方案模板&#xff0c;它们用来解决在软件设计中频繁出现的问题&#xff0c;如对象的创建、职责分配、对象间通信以及系统架构等。 设计模式并不特指某个具体的代码片段&#xff0c;…...

[自研开源] MyData v0.7.5 更新日志

开源地址&#xff1a;gitee | github 详细介绍&#xff1a;MyData 基于 Web API 的数据集成平台 部署文档&#xff1a;用 Docker 部署 MyData 使用手册&#xff1a;MyData 使用手册 试用体验&#xff1a;https://demo.mydata.work 交流Q群&#xff1a;430089673 介绍 MyData …...

docker详细操作--未完待续

docker介绍 docker官网: Docker&#xff1a;加速容器应用程序开发 harbor官网&#xff1a;Harbor - Harbor 中文 使用docker加速器: Docker镜像极速下载服务 - 毫秒镜像 是什么 Docker 是一种开源的容器化平台&#xff0c;用于将应用程序及其依赖项&#xff08;如库、运行时环…...

java_网络服务相关_gateway_nacos_feign区别联系

1. spring-cloud-starter-gateway 作用&#xff1a;作为微服务架构的网关&#xff0c;统一入口&#xff0c;处理所有外部请求。 核心能力&#xff1a; 路由转发&#xff08;基于路径、服务名等&#xff09;过滤器&#xff08;鉴权、限流、日志、Header 处理&#xff09;支持负…...

Java 语言特性(面试系列1)

一、面向对象编程 1. 封装&#xff08;Encapsulation&#xff09; 定义&#xff1a;将数据&#xff08;属性&#xff09;和操作数据的方法绑定在一起&#xff0c;通过访问控制符&#xff08;private、protected、public&#xff09;隐藏内部实现细节。示例&#xff1a; public …...

工程地质软件市场:发展现状、趋势与策略建议

一、引言 在工程建设领域&#xff0c;准确把握地质条件是确保项目顺利推进和安全运营的关键。工程地质软件作为处理、分析、模拟和展示工程地质数据的重要工具&#xff0c;正发挥着日益重要的作用。它凭借强大的数据处理能力、三维建模功能、空间分析工具和可视化展示手段&…...

使用 SymPy 进行向量和矩阵的高级操作

在科学计算和工程领域&#xff0c;向量和矩阵操作是解决问题的核心技能之一。Python 的 SymPy 库提供了强大的符号计算功能&#xff0c;能够高效地处理向量和矩阵的各种操作。本文将深入探讨如何使用 SymPy 进行向量和矩阵的创建、合并以及维度拓展等操作&#xff0c;并通过具体…...

离线语音识别方案分析

随着人工智能技术的不断发展&#xff0c;语音识别技术也得到了广泛的应用&#xff0c;从智能家居到车载系统&#xff0c;语音识别正在改变我们与设备的交互方式。尤其是离线语音识别&#xff0c;由于其在没有网络连接的情况下仍然能提供稳定、准确的语音处理能力&#xff0c;广…...

Matlab实现任意伪彩色图像可视化显示

Matlab实现任意伪彩色图像可视化显示 1、灰度原始图像2、RGB彩色原始图像 在科研研究中&#xff0c;如何展示好看的实验结果图像非常重要&#xff01;&#xff01;&#xff01; 1、灰度原始图像 灰度图像每个像素点只有一个数值&#xff0c;代表该点的​​亮度&#xff08;或…...

Canal环境搭建并实现和ES数据同步

作者&#xff1a;田超凡 日期&#xff1a;2025年6月7日 Canal安装&#xff0c;启动端口11111、8082&#xff1a; 安装canal-deployer服务端&#xff1a; https://github.com/alibaba/canal/releases/1.1.7/canal.deployer-1.1.7.tar.gz cd /opt/homebrew/etc mkdir canal…...

MAZANOKE结合内网穿透技术实现跨地域图像优化服务的远程访问过程

文章目录 前言1. 关于MAZANOKE2. Docker部署3. 简单使用MAZANOKE4. 安装cpolar内网穿透5. 配置公网地址6. 配置固定公网地址总结 前言 在数字世界高速发展的今天&#xff0c;您是否察觉到那些静默增长的视觉数据正在悄然蚕食存储空间&#xff1f;随着影像记录成为日常习惯&…...

【芯片仿真中的X值:隐藏的陷阱与应对之道】

在芯片设计的世界里&#xff0c;X值&#xff08;不定态&#xff09;就像一个潜伏的幽灵。它可能让仿真测试顺利通过&#xff0c;却在芯片流片后引发灾难性后果。本文将揭开X值的本质&#xff0c;探讨其危害&#xff0c;并分享高效调试与预防的实战经验。    一、X值的本质与致…...