当前位置: 首页 > news >正文

大模型日报2024-03-24

利用LLMs评分及解释K-12科学答案

  • 摘要: 本文研究了在K-12级科学教育中使用大型语言模型(LLMs)对短答案评分及解释。研究采用GPT-4结合少量样本学习和活跃学习,通过人机协作提供有意义的评估反馈。

MathVerse:多模态LLM解数学题效果评估

  • 摘要: 研究评估多模态大型语言模型(MLLMs)在视觉数学问题解答中的能力。通过创建MathVerse基准,收集并转换2,612个含图表的数学题,提出链式思考评估策略,深入分析MLLMs的理解和推理过程。

大模型高效微调综述

  • 摘要: 本文综述了高效微调大型模型的方法。介绍了各种参数高效微调(PEFT)算法,分析了它们的性能和计算成本,并探讨了减少PEFT计算成本的技术。

个性化视觉语言模型MyVLM研究

  • 摘要: 本研究旨在个性化视觉语言模型(VLMs),通过外部概念头学习用户特定概念,实现个性化图像标题生成和视觉问答。

PSALM:多模态图像分割模型

  • 摘要: PSALM通过引入掩码解码器和输入模式,扩展了大型多模态模型(LMM),解决图像分割任务。支持多数据集联合训练,提升了模型性能和任务泛化能力,在多个基准测试中取得优异成绩,并展现出对未见任务的零样本能力。

医学题目多选分类的大型语言模型

  • 摘要: 本文旨在评估基于多选题数据训练的大型语言模型在医学科目分类中的效能。通过深度神经网络,我们的MQ Sequence-BERT方法在MedMCQA数据集上超越了最新成果,开发集和测试集的准确率分别达到0.68和0.60。

RAmBLA:生物医学领域LLMs可靠性框架

  • 摘要: 本研究提出了RAmBLA框架,用以评估在生物医学领域中作为助手的大型语言模型(LLMs)的可靠性。通过设计模拟真实用户互动的任务,采用语义相似度评估LLMs的表现。

谷歌推动大型语言模型间的社会学习:AI互相学习成新趋势

  • 摘要: 谷歌引领了一场AI发展的革命性转变,实现了大型语言模型(LLMs)之间的社会学习。这一进步受到人类社会学习方式的启发,标志着AI技术在模仿人类学习行为方面迈出了重要一步。

语义解码时代探索

  • 摘要: 本文提出了‘语义解码’新视角,将大型语言模型(LLMs)视为语义处理器,通过优化语义空间内的交互来构建高效输出,探讨了在语义令牌空间内的优化潜力。

基于熵的动态温度采样改善模型生成

  • 摘要: 本文提出了一种基于熵的动态温度(EDT)采样方法,通过动态选择温度参数,有效平衡了大型语言模型生成任务的质量和多样性,并在不同基准测试中显示出显著优势。

Cobra: 多模态大型语言模型高效推理

  • 摘要: 本文提出Cobra模型,将Mamba语言模型扩展到视觉模态,通过线性计算复杂度提升多模态大型语言模型的效率。Cobra在保持竞争性能的同时,参数量仅为LLaVA的43%,并将代码开源。

RankPrompt:提升大型语言模型的准确性和效率

  • 摘要: RankPrompt在人工智能领域取得革命性进展,通过自主评估机制显著提高了大型语言模型(LLMs)的准确性和效率。这标志着对人工智能精细化追求的又一重要里程碑。

清华大学与微软的LLMLingua-2:用数据蒸馏和提示压缩提高大型语言模型效率

  • 摘要: 清华大学联合微软开发的LLMLingua-2大型语言模型采用了任务不可知技术,通过数据蒸馏和提示压缩方法,实现了在处理语言任务时的高效率。该模型的创新方法重新定义了大型语言模型的运行效率,对未来的自然语言处理技术发展具有重要意义。

HyperGAI推出突破性的多模态大型语言模型HPT

  • 摘要: HyperGAI的研究人员开发了Hyper Pretrained Transformers(HPT),这是一种全新的多模态语言模型。HPT能够处理不同类型的数据,为处理和理解多种形式的信息提供了强大的支持,标志着在人工智能领域的一大进步。

大型语言模型与多模态基础模型在精准肿瘤学中的应用进展

  • 摘要: 《npj Precision Oncology》一文报道,自2022年以来,人工智能(AI)技术在大型语言模型和多模态基础模型方面取得了巨大进步,这对肿瘤学领域产生了深远影响。这些进展为精准肿瘤治疗提供了新的工具和方法,有望改善癌症患者的治疗效果和生活质量。

谷歌研究如何超越大型语言模型中的预翻译

  • 摘要: 谷歌的研究人员提出,通过采用直接推理而非预翻译的方式,可以提升大型语言模型的性能。他们认为,直接处理原始语言数据,而不是先将其翻译成中间语言,有助于模型更准确地理解和生成文本。

谷歌即将推出巨型AI模型Gemini,行业趋向精简化

  • 摘要: 据最新消息,谷歌正准备推出一个名为Gemini的巨型语言模型(LLM)。尽管如此,人工智能产业目前正面临一个趋势转变,即从大型生成性AI模型向更小型、更精简的模型过渡。这一变化可能意味着像Gemini这样的巨型模型将变得较为罕见。

KL3M:首个获得“Licensed Model (L) Certification”认证的大型语言模型

  • 摘要: 近日,Fairly Trained宣布推出具有里程碑意义的大型语言模型KL3M。这是首个获得“Licensed Model (L) Certification”认证的语言模型,标志着AI领域的一个重要进展。KL3M的推出预示着语言模型的发展进入了一个全新的、经过公正训练认证的时代。

LLM4Decompile: 开源大型语言模型用于反编译,注重代码可执行性和可重编译性

  • 摘要: LLM4Decompile项目发布了一系列开源的大型语言模型,专注于提高反编译代码的可执行性和可重编译性。这意味着该模型能够将编译后的机器代码更准确地转换回源代码,有助于软件开发和安全分析等领域的工作。

乐天集团发布针对日语优化的开放大型语言模型

  • 摘要: 乐天集团作为其AI化倡议的一部分,发布了针对日语优化的开放式大型语言模型(LLMs)。这些高性能的语言模型旨在实现在各个领域中广泛应用人工智能技术,推动技术进步和创新。

Butternut AI 1.0:秒建AI网站

  • 摘要: Butternut AI是首款AI网站生成器,只需输入商业名称和关键词,即可快速打造定制化、响应式、内置SEO的多页面网站。

SEO AI写手:一键生成SEO内容

  • 摘要: SEO AI Writer是一款自动化工具,能通过分析谷歌搜索结果来创建博客内容。它能够制定结构化大纲,整合关键词以优化文章,并生成相关图片,提高内容的SEO友好度。

Claros:智能AI购物助手

  • 摘要: Claros是一款AI购物助手,旨在快速帮助用户在线找到更好的产品。该工具能够省去长时间的购物研究,提供比其他市场更加相关的商品推荐。

Alfred 5.5集成ChatGPT与DALL-E

  • 摘要: Alfred 5.5更新发布,新增Grid、Text、Image和PDF视图,使搜索结果更加直观生动。此版本重磅整合了ChatGPT与DALL-E,极大丰富了用户体验。

Legitt AI合同生成器:秒速合同草拟

  • 摘要: Legitt AI合同生成器是一款AI驱动的工具,能够在几秒内快速起草合同。该工具支持针对特定用例和需求的定制训练,提高合同制作的效率和准确性。

DataDepot:AI研究终端

  • 摘要: DataDepot是一款先进的AI研究工具,旨在帮助用户通过自然语言快速找到信息,并整合多家领先数据供应商的数据集,实时获取新见解。

QuizWizard AI:一键生成测验

  • 摘要: QuizWizard AI能将视频、文章或谷歌文档一键转化为互动式AI测验。轻松嵌入网站,提升用户参与度,转化为邮件订阅者。

Devika:智能AI编程助手

  • 摘要: Devika是一款开源AI软件工程师,能理解人类指令,研究信息并编写代码。它是Cognition AI的Devin的竞争对手,使用Python语言编写。

Lightning-AI:加速PyTorch模型

  • 摘要: Lightning-AI项目旨在通过Thunder源码编译器,实现PyTorch模型的快速加速。它支持多种硬件执行器同时使用,使用Python语言编写。

Unit-Mesh:多语言AI编程向导

  • 摘要: Unit-Mesh是一款AI编程向导,支持多语言,能自动生成代码,辅助修复bug。它还能自定义提示,并具备开发、测试、文档自动化功能。该项目使用Kotlin语言编写。

Janhq:开源离线版ChatGPT

  • 摘要: Janhq项目是ChatGPT的开源替代品,能够完全离线运行在个人电脑上。该项目使用TypeScript语言编写,旨在提供一个不依赖互联网的智能对话体验。

.NET智能组件AI实验项目

  • 摘要: dotnet-smartcomponents项目旨在为.NET应用程序提供全面的人工智能功能。该项目实验性地集成了端到端AI特性,虽然未标明编写语言,但专为.NET环境设计。

SakanaAI:模型合并优化项目

  • 摘要: SakanaAI是一个Github上的AI趋势项目,专注于利用进化算法优化模型合并策略。该项目使用Python语言编写,旨在通过自动化搜索最佳合并方案,提高模型性能。

相关文章:

大模型日报2024-03-24

利用LLMs评分及解释K-12科学答案 摘要: 本文研究了在K-12级科学教育中使用大型语言模型(LLMs)对短答案评分及解释。研究采用GPT-4结合少量样本学习和活跃学习,通过人机协作提供有意义的评估反馈。 MathVerse:多模态LLM解数学题效果…...

Android kotlin全局悬浮窗全屏功能和锁屏页面全屏悬浮窗功能一

1.前言 在进行app应用开发中,在实现某些功能中要求实现悬浮窗功能,分为应用内悬浮窗 ,全局悬浮窗和 锁屏页面悬浮窗功能 等,接下来就来实现这些悬浮窗全屏功能,首选看下第一部分功能实现 2.kotlin全局悬浮窗全屏功能和锁屏页面全屏悬浮窗功能一分析 悬浮窗是属于Androi…...

图像识别在安防领域的应用

图像识别技术在安防领域有着广泛的应用,它通过分析和理解图像中的视觉信息,为安防系统提供了强大的辅助功能。以下是一些主要的应用领域: 人脸识别:人脸识别技术是安防领域中最常见的应用之一。它可以帮助系统识别和验证个人身份…...

前端面试集中复习 - http篇

1. http请求方式 HTTP请求方式有哪些:GET POST PUT DELETE OPTIONS 1) GET POST 的区别? 场景上: GET 用于获取资源而不对服务器资源做更改提交的请求,多次执行结果一致。用于获取静态数据,幂等。 POST&#xff1…...

C++ - 类和对象(上)

目录 一、类的定义 二、访问限定符 public(公有) protected(保护) private(私有) 三、类声明和定义分离 四、外部变量和成员变量的区别与注意 五、类的实例化 六、类对象的模型 七、类的this指针…...

mysql基础4sql优化

SQL优化 插入数据优化 如果我们需要一次性往数据库表中插入多条记录,可以从以下三个方面进行优化。 insert into tb_test values(1,tom); insert into tb_test values(2,cat); insert into tb_test values(3,jerry);-- 优化方案一:批量插入数据 Inser…...

实现Spring Web MVC中的文件上传功能,并处理大文件和多文件上传

实现Spring Web MVC中的文件上传功能,并处理大文件和多文件上传 在Spring Web MVC中实现文件上传功能并处理大文件和多文件上传是一项常见的任务。下面是一个示例,演示如何在Spring Boot应用程序中实现这一功能: 添加Spring Web依赖&#x…...

搭建vite项目

文章目录 Vite 是一个基于 Webpack 的开发服务器,用于开发 Vue 3 和 Vite 应用程序 一、创建一个vite项目二、集成Vue Router1.安装 vue-routernext插件2.在 src 目录下创建一个名为 router 的文件夹,并在其中创建一个名为 index.js 的文件。在这个文件中…...

Docker 安装mysql 主从复制

目录 1 MySql主从复制简介 1.1 主从复制的概念 1.2 主从复制的作用 2. 搭建主从复制 2.1 pull mysql 镜像 2.2 新建主服务器容器实例 3307 2.2.1 master创建 my.cnf 2.2.2 重启master 2.2.3 进入mysql 容器,创建同步用户 2.3 新建从服务器容器实例 3308…...

GPT每日面试题—如何实现二分查找

充分利用ChatGPT的优势,帮助我们快速准备前端面试。今日问题:如何实现二分查找? Q:如果在前端面试中,被问到如何实现二分查找,如果回答比较好,给出必要的代码示例 A:当被问到如何实…...

机器学习神经网络由哪些构成?

机器学习神经网络通常由以下几个主要组件构成: 1. **输入层(Input Layer)**:输入层接受来自数据源(例如图像、文本等)的原始输入数据。每个输入特征通常表示为输入层中的一个节点。 2. **隐藏层&#xff…...

代码随想录算法训练营day19 | 二叉树阶段性总结

各个部分题目的代码题解都在我往日的二叉树的博客中。 (day14到day22) 目录 二叉树理论基础二叉树的遍历方式深度优先遍历广度优先遍历 求二叉树的属性二叉树的修改与制造求二叉搜索树的属性二叉树公共最先问题二叉搜索树的修改与构造总结 二叉树理论基础 二叉树的理论基础参…...

数据库引论:3、中级SQL

一些更复杂的查询表达 3.1 连接表达式 拼接多张表的几种方式 3.1.1 自然连接 natural join,自动连接在所有共同属性上相同的元组 join… using( A 1 , A 2 , ⋯ A_1,A_2,\cdots A1​,A2​,⋯):使用括号里的属性进行自然连接,除了这些属性之外的共同…...

毕业设计:日志记录编写(3/17起更新中)

目录 3/171.配置阿里云python加速镜像:2. 安装python3.9版本3. 爬虫技术选择4. 数据抓取和整理5. 难点和挑战 3/241.数据库建表信息2.后续进度安排3. 数据处理和分析 3/17 当前周期目标:构建基本的python环境:运行爬虫程序 1.配置阿里云pytho…...

(一)基于IDEA的JAVA基础7

关系运算符 运算符 含义 范例 结果 等于 12 false &#xff01; 不等于 1&#xff01;2 true > 大于 1>2 false < 小于 …...

MySQL数据库概念及MySQL的安装

文章目录 MySQL数据库一、数据库基本概念1、数据2、数据表3、数据库4、数据库管理系统&#xff08;DBMS&#xff09;4.1 数据库的建立和维护功能4.2 数据库的定义功能4.3 数据库的操纵功能4.4 数据库的运行管理功能4.5 数据库的通信功能&#xff08;数据库与外界对接&#xff0…...

redis实际应用场景及并发问题的解决

业务场景 接下来要模拟的业务场景: 每当被普通攻击的时候&#xff0c;有千分之三的概率掉落金币&#xff0c;每回合最多爆出两个金币。 1.每个回合只有15秒。 2.每次普通攻击的时间间隔是0.5s 3.这个服务是一个集群&#xff08;这个要求暂时不实现&#xff09; 编写接口&…...

考研数学|汤家凤《1800》基础部分什么时候做完?

从我个人的经验来看&#xff0c;做完汤家凤1800的基础部分在第一轮复习中并不是必须的&#xff0c;但是可以作为一个有效的复习工具。 我认为汤家凤1800的基础部分确实涵盖了考研高数的基础知识点&#xff0c;并且题目难度适中&#xff0c;适合用来巩固基础。在第一轮复习中&a…...

JS的设计模式(23种)

JavaScript设计模式是指在JavaScript编程中普遍应用的一系列经过验证的最佳实践和可重用的解决方案模板&#xff0c;它们用来解决在软件设计中频繁出现的问题&#xff0c;如对象的创建、职责分配、对象间通信以及系统架构等。 设计模式并不特指某个具体的代码片段&#xff0c;…...

[自研开源] MyData v0.7.5 更新日志

开源地址&#xff1a;gitee | github 详细介绍&#xff1a;MyData 基于 Web API 的数据集成平台 部署文档&#xff1a;用 Docker 部署 MyData 使用手册&#xff1a;MyData 使用手册 试用体验&#xff1a;https://demo.mydata.work 交流Q群&#xff1a;430089673 介绍 MyData …...

Spark 之 入门讲解详细版(1)

1、简介 1.1 Spark简介 Spark是加州大学伯克利分校AMP实验室&#xff08;Algorithms, Machines, and People Lab&#xff09;开发通用内存并行计算框架。Spark在2013年6月进入Apache成为孵化项目&#xff0c;8个月后成为Apache顶级项目&#xff0c;速度之快足见过人之处&…...

深入浅出:JavaScript 中的 `window.crypto.getRandomValues()` 方法

深入浅出&#xff1a;JavaScript 中的 window.crypto.getRandomValues() 方法 在现代 Web 开发中&#xff0c;随机数的生成看似简单&#xff0c;却隐藏着许多玄机。无论是生成密码、加密密钥&#xff0c;还是创建安全令牌&#xff0c;随机数的质量直接关系到系统的安全性。Jav…...

P3 QT项目----记事本(3.8)

3.8 记事本项目总结 项目源码 1.main.cpp #include "widget.h" #include <QApplication> int main(int argc, char *argv[]) {QApplication a(argc, argv);Widget w;w.show();return a.exec(); } 2.widget.cpp #include "widget.h" #include &q…...

Swagger和OpenApi的前世今生

Swagger与OpenAPI的关系演进是API标准化进程中的重要篇章&#xff0c;二者共同塑造了现代RESTful API的开发范式。 本期就扒一扒其技术演进的关键节点与核心逻辑&#xff1a; &#x1f504; 一、起源与初创期&#xff1a;Swagger的诞生&#xff08;2010-2014&#xff09; 核心…...

Java多线程实现之Thread类深度解析

Java多线程实现之Thread类深度解析 一、多线程基础概念1.1 什么是线程1.2 多线程的优势1.3 Java多线程模型 二、Thread类的基本结构与构造函数2.1 Thread类的继承关系2.2 构造函数 三、创建和启动线程3.1 继承Thread类创建线程3.2 实现Runnable接口创建线程 四、Thread类的核心…...

Java求职者面试指南:Spring、Spring Boot、MyBatis框架与计算机基础问题解析

Java求职者面试指南&#xff1a;Spring、Spring Boot、MyBatis框架与计算机基础问题解析 一、第一轮提问&#xff08;基础概念问题&#xff09; 1. 请解释Spring框架的核心容器是什么&#xff1f;它在Spring中起到什么作用&#xff1f; Spring框架的核心容器是IoC容器&#…...

PostgreSQL——环境搭建

一、Linux # 安装 PostgreSQL 15 仓库 sudo dnf install -y https://download.postgresql.org/pub/repos/yum/reporpms/EL-$(rpm -E %{rhel})-x86_64/pgdg-redhat-repo-latest.noarch.rpm# 安装之前先确认是否已经存在PostgreSQL rpm -qa | grep postgres# 如果存在&#xff0…...

vue3 daterange正则踩坑

<el-form-item label"空置时间" prop"vacantTime"> <el-date-picker v-model"form.vacantTime" type"daterange" start-placeholder"开始日期" end-placeholder"结束日期" clearable :editable"fal…...

OCR MLLM Evaluation

为什么需要评测体系&#xff1f;——背景与矛盾 ​​ 能干的事&#xff1a;​​ 看清楚发票、身份证上的字&#xff08;准确率>90%&#xff09;&#xff0c;速度飞快&#xff08;眨眼间完成&#xff09;。​​干不了的事&#xff1a;​​ 碰到复杂表格&#xff08;合并单元…...

PydanticAI快速入门示例

参考链接&#xff1a;https://ai.pydantic.dev/#why-use-pydanticai 示例代码 from pydantic_ai import Agent from pydantic_ai.models.openai import OpenAIModel from pydantic_ai.providers.openai import OpenAIProvider# 配置使用阿里云通义千问模型 model OpenAIMode…...