当前位置: 首页 > news >正文

2024年9月第2周AI资讯

阅读时间:3-4min

更新时间:2024.9.9-2024.9.13

目录

Groq推出多模态大模型LLaVA v1.5 7B

AI通过重读问题可以变得更聪明

美国Weave公司发布Isaac多功能个人机器人

特斯拉机器人出租车将实现无线充电

 Adobe视频编辑新时代

无人驾驶汽车超越人类

 AI辅助设计的步行桌“Carpentopod”

Mistral多模态Pixtral 12B


Groq推出多模态大模型LLaVA v1.5 7B

概要

Groq 刚刚推出了LLaVA v1.5 7B,这是一种功能强大的新型多模态大模型,可以理解图像和文本,据称运行速度比 OpenAI 的 GPT-4o 快 4 倍。

详情

  • LLaVA v1.5 7B 可以回答有关图像的问题、生成字幕以及进行涉及文本、语音和图片的对话。
  • 该模型还可用于各种任务,例如视觉产品检查、库存管理以及为视障用户创建图像描述。
  • Groq目前免费提供此模型

推荐理由

 Groq 今年早些时候因其极快的人工智能速度而走红,现在它将这些功能与强大的多模式模型结合起来。对于人工智能应用程序来说,越快越好,疯狂的速度与先进的模型相结合,为源源不断的新应用程序打开了大门。

链接

  1. Groq官方博客
  2. HuggingFace
  3. 开发者控制台

AI通过重读问题可以变得更聪明

概要

研究人员发现,让人工智能系统模仿人类行为,“重读”问题两次,可以显著提高他们在各种任务中的推理和解决问题的能力。

详情

  • 这项技术被称为 RE2(重读),通过在回答之前简单地重复问题,可以提高人工智能在数学、常识和符号推理方面的表现。
  • 它适用于不同的人工智能模型,并且可以与其他人工智能推理技术相结合。
  • 该方法在重复问题两次时最有效——重复次数越多,性能就会降低。
  • RE2 甚至改进了非指令微调的 AI 模型,显示出广泛的适用性。

推荐理由

RE2 为越来越多的研究增添了新内容,显示了模仿人类思维和处理方式来改进人工智能的潜力。这项研究的简单性还表明,许多人工智能公司在寻求最高性能模型的过程中可能忽视了基本的、受人类启发的提示技术。

链接

  1. 论文

 美国Weave公司发布Isaac多功能个人机器人

美国Weave公司发布Isaac多功能个人机器人

概要

Isaac是一款多功能个人机器人,旨在帮助完成各种家务任务,将于 2025 年秋季向首批客户发货。

详情

  • Isaac可以自主整理、折叠衣物、整理空间以及执行许多其他家务。
  • 机器人管家可以响应语音或文本命令,并可以通过应用程序进行编程。
  • 出于隐私原因,Isaac随身携带的相机在不使用时可以折叠起来并存放在外壳中。
  • 售价:59,000 美元(或 48 个月每月 1,385 美元)以及 1,000 美元的预订费。

推荐理由

对价格实惠、智能的个人机器人助手的竞争正在持续升温(特斯拉的 Optimus、1X 的 NEO Beta、国产的AGIBOT ,Weave 的Isaac),看来到 2025 年我们将开始在家庭中看到这些机器人。

链接

官网


特斯拉电动汽车将实现无线充电

 

概要

特斯拉的一项新专利展示了其先进的无线充电系统,有可能解决电动汽车手动充电的需要——允许自动机器人出租车在无需人工干预的情况下充电。

详情

  • 该专利于二月份提交并于最近公布,重点介绍了一种使用智能技术来适应无线充电条件变化的系统。
  • 它提到了一个接地垫和一个车辆垫,它们一起工作,无需任何电线即可为汽车充电。
  • 充电站可以估计和调整线圈电感的变化,从而提高效率和安全性。
  • 特斯拉可能会在下个月即将举行的 Robotaxi 活动中推出这种无线充电技术,以契合该技术使自动驾驶车辆能够自动充电的潜力。

推荐理由 

虽然电动汽车的无线充电并不能解决主要问题,但它可能会改变自动驾驶汽车的游戏规则。如果特斯拉的 Robotaxis 可以无线充电,它们就可以几乎无休止地自主运行,无需人工干预——这是保持出租车队 24/7 运行的一个重要功能。

链接

WIPO - Search International and National Patent Collections


 Adobe开启视频编辑新时代

 

概要

Adobe展示了其 Firefly AI 视频模型,其中包括扩展现有视频以及根据文本或图像提示创建新剪辑的工具。

详情

  • 即将推出三个关键功能:文本到视频、图像到视频和生成扩展。
  • 文本到视频可以根据提示创建剪辑,并提供相机控制和参考图像的选项。
  • 图像到视频将静态图像或插图转换为真人剪辑。
  • Premiere Pro 测试版中的生成式扩展可以添加素材来覆盖间隙或扩展镜头。

推荐理由

Sora 专注于从头开始生成视频,Adobe 的目标是为视频编辑本身创造“一个新时代”。很快,任何人都将能够通过AI改变相机角度、扩展场景并立即生成幕后花絮。

链接

Bringing generative AI to video with Adobe Firefly Video Model | Adobe Blog


 无人驾驶汽车超越人类

概要

Waymo 新碰撞数据的深入研究表明,无人驾驶汽车比人类驾驶的车辆安全得多,造成伤害的碰撞事故和每英里行驶安全气囊的部署次数更少。

详情

  • Waymo 车辆已行驶超过 2200 万英里,仅报告了 20 起造成伤害的事故。
  • 这个比率还不到类似条件下人类驾驶员预期的三分之一。
  • 在 23 起严重事故中,有 16 起涉及人类驾驶员追尾 Waymo 车辆。
  • Waymo 估计,其车辆发生碰撞而引发安全气囊展开的可能性是人类驾驶员的六分之一。

推荐理由

数据表明,我们现在拥有安全的自动驾驶汽车,并且这些人工智能驱动的汽车可以显着减少道路事故和伤害。

链接

Human drivers are to blame for most serious Waymo collisions


 AI辅助设计的步行桌“Carpentopod”

概要

这是一款荷兰工程师打造的无线行走木制咖啡桌,采用AI优化设计的腿部结构。

详情

  • 该桌子有 12 个腿(每端 6 个),由精密切割的层压竹制成,由两个电机控制。
  • 腿部结构优化了行走速度、间隙和效率。
  • Carpentier 开发了一款定制电机控制软件,并使用经过改造控制器进行远程操作。

推荐理由

该项目展示了创客如何将AI、传统工艺和现代制造技术结合起来,将AI用于设计优化。

链接

Carpentopod: A walking table project

bilibili:荷兰工程师打造了AI辅助设计的步行桌“Carpentopod”


Mistral发布多模态大模型Pixtral 12B

概要

法国AI初创公司 Mistral发布了Pixtral 12B,这是他们的第一个能够处理图像和文本的多模态模型,可以免费下载。

详情

  • Pixtral 12B 是一个拥有 120 亿个参数的模型,大小约为 24GB,基于 Mistral 的文本模型 Nemo 12B 构建。
  • Pixtral 12B 是初创公司的第一个多模式模型,这意味着它可以处理和回答有关图像和文本的问题。
  • 它可以在 Apache 2.0 许可证下通过GitHub和Hugging Face下载,允许不受限制的使用和微调。
  • Mistral 计划很快在其聊天机器人和 API 平台 Le Chat 和 Le Plateforme 上提供 Pixtral 12B。

推荐理由

Mistral 凭借一支由顶尖研究人员组成的精干团队以及最近一轮 6.45 亿美元的融资,该公司正在通过强大的开放模型积极突破人工智能的界限。

链接

https://huggingface.co/mistral-community/pixtral-12b-240910?utm_source=www.therundown.ai&utm_medium=referral&utm_campaign=google-s-new-ai-turns-notes-into-podcasts

相关文章:

2024年9月第2周AI资讯

阅读时间:3-4min 更新时间:2024.9.9-2024.9.13 目录 Groq推出多模态大模型LLaVA v1.5 7B AI通过重读问题可以变得更聪明 美国Weave公司发布Isaac多功能个人机器人 特斯拉机器人出租车将实现无线充电 Adobe视频编辑新时代 无人驾驶汽车超越人类 AI…...

【软件使用-MEGA】构建进化树报错

*_summary.txt报错: MEGA-CC 10.2.6 Molecular Evolutionary Genetics Analysis Build#: 10210527-x86_640% Reading distance matrix MEGA-CC has logged the following error:When 2024年09月13日 下午 01时32分49秒 下午Data …...

面试常见八股

JAVA篇 基础 1、自动拆箱和装箱 装箱:装箱是将值类型(如int、double、struct等)转换为object类型或任何接口类型的过程。由于object是所有类型的基类(在.NET中),并且接口是引用类型,因此装箱…...

第十八章 番外 余弦相似度

余弦相似度(Cosine Similarity)是一种衡量两个非零向量之间角度的度量方式,用于评估它们之间的相似性。它的值范围从 -1 到 1,其中 1 表示完全相同的方向(即向量完全相同),0 表示正交&#xff0…...

HPA和helm

HPA pod的数量进行扩缩容 针对控制器创建的pod deployment: replica: 静态:edit yaml:apply -f HPA:基于cpu的利用率来实现pod数量的自动伸缩。 Horizontal pod autoscaling yaml文件————主流——————…...

基于人工智能的智能语音助手

语音助手的自然语言处理模块是语音助手系统的关键组成部分。通过这个模块,系统能够识别用户的意图并做出相应的回应。我们可以使用NLP技术来解析文本输入,并将其转换为系统可以理解的命令或指令。在本项目中,我们将结合语音识别、自然语言处理…...

java实际开发——数据库存储金额时用什么数据类型?(MySQL、PostgreSQL)

目录 java开发时金额用的数据类型——BigDecimal MySQL存储金额数据时用的数据类型是——decimal PostgreSQL存储金额数据时用的数据类型是——decimal 或 money java开发时金额用的数据类型——BigDecimal https://blog.csdn.net/Jilit_jilit/article/details/142180903?…...

Java 设计模式-状态模式

目录 一. 概述 二. 主要角色 三. 代码示例 四. 优缺点 优点: 缺点: 五. 常见应用场景 一. 概述 状态模式是一种行为设计模式,它允许一个对象在其内部状态改变时改变它的行为。对象看起来好像修改了它的类。状态模式把所有的与一个特定…...

2024.9.13 Python与图像处理新国大EE5731课程大作业,索贝尔算子计算边缘,高斯核模糊边缘,Haar小波计算边缘

1.编写一个图像二维卷积程序。它应该能够处理任何灰度输入图像,并使用以下内核进行操作: %matplotlib inline import numpy as np import matplotlib.pyplot as plt from scipy import linalg import random as rm import math import cv2# import and …...

动态IP池的IP都是纯净IP吗?

在当今互联网时代,动态IP池作为一种网络资源管理策略,被广泛应用于数据抓取、市场调研、广告验证等多种场景中。动态IP池能够提供大量可轮换的IP地址,以帮助用户避免因频繁访问同一网站而被封禁IP的情况。然而,一个关键的问题是&a…...

【MySQL】查询表中重复数据、模糊查询列信息、快速copy表数据(1)

一、SQL查询重复的数据: 1、SQL格式: Select * From 数据表 Where 重复记录字段 in ( select 重复记录字段 From 数据表 Group By 重复记录字段 Having Count(重复记录字段)>1) 2、举例: 在这个patient_member_info表中,我们…...

计算机操作系统之并行性与并发性笔记

目录 在计算机操作系统中,并行性与并发性是两个既相似又有区别的重要概念 并行性: 并发性: 可以通过多任务处理和资源共享来具体说明 并发性的例子 并行性的例子 总结 在计算机操作系统中,并行性与并发性是两个既相似又有区别…...

顶级高效的ChatGPT论文润色提示词和使用技巧

在学术研究中,精确和高效地对文本进行润色和修改是一个必不可少的重要环节。随着学术论文篇幅的增长和内容的复杂度上升,找到一种能够有效整理和优化修改内容的方法变得尤为关键。本文将探讨如何利用ChatGPT作为工具,通过具体的指令和策略,来优化文本的修改过程,提高学术写…...

WebAPI (一)DOM树、DOM对象,操作元素样式(style className,classList)。表单元素属性。自定义属性。间歇函数定时器

文章目录 Web API基本认知一、 变量声明二、 DOM1. DOM 树2. DOM对象3. 获取DOM对象(1)、选择匹配的第一个元素(2)、选择匹配多个元素 三、 操作元素1. 操作元素内容2. 操作元素属性(1)、常用属性(href之类的)(2)、通过style属性操作CSS(3)、通过类名(cl…...

若依框架开发

若依环境 介绍 ‌若依是一款快速开发平台(低代码),用于快速构建企业级后台管理系统,它提供了许多常用的功能模块和组件,包括权限管理、代码生成、工作流、消息中心等 官方地址: https://www.ruoyi.vip/ ‌基于Spring Boot和Spring Cloud‌…...

局域网windows下使用Git

windows下如何使用局域网进行git部署 准备工作第一步 ,ip设置设置远程电脑的ip设置,如果不会设置请点击[这里](https://blog.csdn.net/Black_Friend/article/details/142170705?spm1001.2014.3001.5501)设置本地电脑的ip:验证 第二步&#x…...

Redis访问工具

使用Redis存储缓存数据,如何通过Java去访问Redis? 防止后面看晕,先来张图。 1. Redis的客户端库 Redis的客户端库是Redis官方提供的,用于让Java等编程语言与Redis服务器进行通信的工具包。常见的Redis客户端库有多个&#xff0c…...

vue3+ant design vue动态实现级联菜单~

1、这里使用的是ant design vue 的TreeSelect 树选择来实现的。 <a-form-item name"staffDept" label"责任部门" labelAlign"left"><a-tree-selectv-model:value"formState.staffDept"show-search//允许在下拉框中添加搜索框…...

软件可维护性因素例题

答案&#xff1a;C 知识点&#xff1a; 系统可维护性因素决定 可理解性 可测试性 可修改性 选项C可移植性错误...

git的一些操作

参考视频: git分支详解&#xff08;约10分钟掌握分支80%操作&#xff09;&#xff0c;git-branch&#xff0c;git分支管理&#xff0c;git分支操作&#xff0c;git分支基础和操作&#xff0c;2023年git基础使用教程 不同的分支相当于不同的平行世界 合并分支 两个分支是我们项…...

【杂谈】-递归进化:人工智能的自我改进与监管挑战

递归进化&#xff1a;人工智能的自我改进与监管挑战 文章目录 递归进化&#xff1a;人工智能的自我改进与监管挑战1、自我改进型人工智能的崛起2、人工智能如何挑战人类监管&#xff1f;3、确保人工智能受控的策略4、人类在人工智能发展中的角色5、平衡自主性与控制力6、总结与…...

聊聊 Pulsar:Producer 源码解析

一、前言 Apache Pulsar 是一个企业级的开源分布式消息传递平台&#xff0c;以其高性能、可扩展性和存储计算分离架构在消息队列和流处理领域独树一帜。在 Pulsar 的核心架构中&#xff0c;Producer&#xff08;生产者&#xff09; 是连接客户端应用与消息队列的第一步。生产者…...

unix/linux,sudo,其发展历程详细时间线、由来、历史背景

sudo 的诞生和演化,本身就是一部 Unix/Linux 系统管理哲学变迁的微缩史。来,让我们拨开时间的迷雾,一同探寻 sudo 那波澜壮阔(也颇为实用主义)的发展历程。 历史背景:su的时代与困境 ( 20 世纪 70 年代 - 80 年代初) 在 sudo 出现之前,Unix 系统管理员和需要特权操作的…...

蓝桥杯3498 01串的熵

问题描述 对于一个长度为 23333333的 01 串, 如果其信息熵为 11625907.5798&#xff0c; 且 0 出现次数比 1 少, 那么这个 01 串中 0 出现了多少次? #include<iostream> #include<cmath> using namespace std;int n 23333333;int main() {//枚举 0 出现的次数//因…...

代码随想录刷题day30

1、零钱兑换II 给你一个整数数组 coins 表示不同面额的硬币&#xff0c;另给一个整数 amount 表示总金额。 请你计算并返回可以凑成总金额的硬币组合数。如果任何硬币组合都无法凑出总金额&#xff0c;返回 0 。 假设每一种面额的硬币有无限个。 题目数据保证结果符合 32 位带…...

【JVM面试篇】高频八股汇总——类加载和类加载器

目录 1. 讲一下类加载过程&#xff1f; 2. Java创建对象的过程&#xff1f; 3. 对象的生命周期&#xff1f; 4. 类加载器有哪些&#xff1f; 5. 双亲委派模型的作用&#xff08;好处&#xff09;&#xff1f; 6. 讲一下类的加载和双亲委派原则&#xff1f; 7. 双亲委派模…...

tomcat入门

1 tomcat 是什么 apache开发的web服务器可以为java web程序提供运行环境tomcat是一款高效&#xff0c;稳定&#xff0c;易于使用的web服务器tomcathttp服务器Servlet服务器 2 tomcat 目录介绍 -bin #存放tomcat的脚本 -conf #存放tomcat的配置文件 ---catalina.policy #to…...

tauri项目,如何在rust端读取电脑环境变量

如果想在前端通过调用来获取环境变量的值&#xff0c;可以通过标准的依赖&#xff1a; std::env::var(name).ok() 想在前端通过调用来获取&#xff0c;可以写一个command函数&#xff1a; #[tauri::command] pub fn get_env_var(name: String) -> Result<String, Stri…...

【无标题】湖北理元理律师事务所:债务优化中的生活保障与法律平衡之道

文/法律实务观察组 在债务重组领域&#xff0c;专业机构的核心价值不仅在于减轻债务数字&#xff0c;更在于帮助债务人在履行义务的同时维持基本生活尊严。湖北理元理律师事务所的服务实践表明&#xff0c;合法债务优化需同步实现三重平衡&#xff1a; 法律刚性&#xff08;债…...

ZYNQ学习记录FPGA(一)ZYNQ简介

一、知识准备 1.一些术语,缩写和概念&#xff1a; 1&#xff09;ZYNQ全称&#xff1a;ZYNQ7000 All Pgrammable SoC 2&#xff09;SoC:system on chips(片上系统)&#xff0c;对比集成电路的SoB&#xff08;system on board&#xff09; 3&#xff09;ARM&#xff1a;处理器…...