当前位置: 首页 > news >正文

2024年9月第2周AI资讯

阅读时间:3-4min

更新时间:2024.9.9-2024.9.13

目录

Groq推出多模态大模型LLaVA v1.5 7B

AI通过重读问题可以变得更聪明

美国Weave公司发布Isaac多功能个人机器人

特斯拉机器人出租车将实现无线充电

 Adobe视频编辑新时代

无人驾驶汽车超越人类

 AI辅助设计的步行桌“Carpentopod”

Mistral多模态Pixtral 12B


Groq推出多模态大模型LLaVA v1.5 7B

概要

Groq 刚刚推出了LLaVA v1.5 7B,这是一种功能强大的新型多模态大模型,可以理解图像和文本,据称运行速度比 OpenAI 的 GPT-4o 快 4 倍。

详情

  • LLaVA v1.5 7B 可以回答有关图像的问题、生成字幕以及进行涉及文本、语音和图片的对话。
  • 该模型还可用于各种任务,例如视觉产品检查、库存管理以及为视障用户创建图像描述。
  • Groq目前免费提供此模型

推荐理由

 Groq 今年早些时候因其极快的人工智能速度而走红,现在它将这些功能与强大的多模式模型结合起来。对于人工智能应用程序来说,越快越好,疯狂的速度与先进的模型相结合,为源源不断的新应用程序打开了大门。

链接

  1. Groq官方博客
  2. HuggingFace
  3. 开发者控制台

AI通过重读问题可以变得更聪明

概要

研究人员发现,让人工智能系统模仿人类行为,“重读”问题两次,可以显著提高他们在各种任务中的推理和解决问题的能力。

详情

  • 这项技术被称为 RE2(重读),通过在回答之前简单地重复问题,可以提高人工智能在数学、常识和符号推理方面的表现。
  • 它适用于不同的人工智能模型,并且可以与其他人工智能推理技术相结合。
  • 该方法在重复问题两次时最有效——重复次数越多,性能就会降低。
  • RE2 甚至改进了非指令微调的 AI 模型,显示出广泛的适用性。

推荐理由

RE2 为越来越多的研究增添了新内容,显示了模仿人类思维和处理方式来改进人工智能的潜力。这项研究的简单性还表明,许多人工智能公司在寻求最高性能模型的过程中可能忽视了基本的、受人类启发的提示技术。

链接

  1. 论文

 美国Weave公司发布Isaac多功能个人机器人

美国Weave公司发布Isaac多功能个人机器人

概要

Isaac是一款多功能个人机器人,旨在帮助完成各种家务任务,将于 2025 年秋季向首批客户发货。

详情

  • Isaac可以自主整理、折叠衣物、整理空间以及执行许多其他家务。
  • 机器人管家可以响应语音或文本命令,并可以通过应用程序进行编程。
  • 出于隐私原因,Isaac随身携带的相机在不使用时可以折叠起来并存放在外壳中。
  • 售价:59,000 美元(或 48 个月每月 1,385 美元)以及 1,000 美元的预订费。

推荐理由

对价格实惠、智能的个人机器人助手的竞争正在持续升温(特斯拉的 Optimus、1X 的 NEO Beta、国产的AGIBOT ,Weave 的Isaac),看来到 2025 年我们将开始在家庭中看到这些机器人。

链接

官网


特斯拉电动汽车将实现无线充电

 

概要

特斯拉的一项新专利展示了其先进的无线充电系统,有可能解决电动汽车手动充电的需要——允许自动机器人出租车在无需人工干预的情况下充电。

详情

  • 该专利于二月份提交并于最近公布,重点介绍了一种使用智能技术来适应无线充电条件变化的系统。
  • 它提到了一个接地垫和一个车辆垫,它们一起工作,无需任何电线即可为汽车充电。
  • 充电站可以估计和调整线圈电感的变化,从而提高效率和安全性。
  • 特斯拉可能会在下个月即将举行的 Robotaxi 活动中推出这种无线充电技术,以契合该技术使自动驾驶车辆能够自动充电的潜力。

推荐理由 

虽然电动汽车的无线充电并不能解决主要问题,但它可能会改变自动驾驶汽车的游戏规则。如果特斯拉的 Robotaxis 可以无线充电,它们就可以几乎无休止地自主运行,无需人工干预——这是保持出租车队 24/7 运行的一个重要功能。

链接

WIPO - Search International and National Patent Collections


 Adobe开启视频编辑新时代

 

概要

Adobe展示了其 Firefly AI 视频模型,其中包括扩展现有视频以及根据文本或图像提示创建新剪辑的工具。

详情

  • 即将推出三个关键功能:文本到视频、图像到视频和生成扩展。
  • 文本到视频可以根据提示创建剪辑,并提供相机控制和参考图像的选项。
  • 图像到视频将静态图像或插图转换为真人剪辑。
  • Premiere Pro 测试版中的生成式扩展可以添加素材来覆盖间隙或扩展镜头。

推荐理由

Sora 专注于从头开始生成视频,Adobe 的目标是为视频编辑本身创造“一个新时代”。很快,任何人都将能够通过AI改变相机角度、扩展场景并立即生成幕后花絮。

链接

Bringing generative AI to video with Adobe Firefly Video Model | Adobe Blog


 无人驾驶汽车超越人类

概要

Waymo 新碰撞数据的深入研究表明,无人驾驶汽车比人类驾驶的车辆安全得多,造成伤害的碰撞事故和每英里行驶安全气囊的部署次数更少。

详情

  • Waymo 车辆已行驶超过 2200 万英里,仅报告了 20 起造成伤害的事故。
  • 这个比率还不到类似条件下人类驾驶员预期的三分之一。
  • 在 23 起严重事故中,有 16 起涉及人类驾驶员追尾 Waymo 车辆。
  • Waymo 估计,其车辆发生碰撞而引发安全气囊展开的可能性是人类驾驶员的六分之一。

推荐理由

数据表明,我们现在拥有安全的自动驾驶汽车,并且这些人工智能驱动的汽车可以显着减少道路事故和伤害。

链接

Human drivers are to blame for most serious Waymo collisions


 AI辅助设计的步行桌“Carpentopod”

概要

这是一款荷兰工程师打造的无线行走木制咖啡桌,采用AI优化设计的腿部结构。

详情

  • 该桌子有 12 个腿(每端 6 个),由精密切割的层压竹制成,由两个电机控制。
  • 腿部结构优化了行走速度、间隙和效率。
  • Carpentier 开发了一款定制电机控制软件,并使用经过改造控制器进行远程操作。

推荐理由

该项目展示了创客如何将AI、传统工艺和现代制造技术结合起来,将AI用于设计优化。

链接

Carpentopod: A walking table project

bilibili:荷兰工程师打造了AI辅助设计的步行桌“Carpentopod”


Mistral发布多模态大模型Pixtral 12B

概要

法国AI初创公司 Mistral发布了Pixtral 12B,这是他们的第一个能够处理图像和文本的多模态模型,可以免费下载。

详情

  • Pixtral 12B 是一个拥有 120 亿个参数的模型,大小约为 24GB,基于 Mistral 的文本模型 Nemo 12B 构建。
  • Pixtral 12B 是初创公司的第一个多模式模型,这意味着它可以处理和回答有关图像和文本的问题。
  • 它可以在 Apache 2.0 许可证下通过GitHub和Hugging Face下载,允许不受限制的使用和微调。
  • Mistral 计划很快在其聊天机器人和 API 平台 Le Chat 和 Le Plateforme 上提供 Pixtral 12B。

推荐理由

Mistral 凭借一支由顶尖研究人员组成的精干团队以及最近一轮 6.45 亿美元的融资,该公司正在通过强大的开放模型积极突破人工智能的界限。

链接

https://huggingface.co/mistral-community/pixtral-12b-240910?utm_source=www.therundown.ai&utm_medium=referral&utm_campaign=google-s-new-ai-turns-notes-into-podcasts

相关文章:

2024年9月第2周AI资讯

阅读时间:3-4min 更新时间:2024.9.9-2024.9.13 目录 Groq推出多模态大模型LLaVA v1.5 7B AI通过重读问题可以变得更聪明 美国Weave公司发布Isaac多功能个人机器人 特斯拉机器人出租车将实现无线充电 Adobe视频编辑新时代 无人驾驶汽车超越人类 AI…...

【软件使用-MEGA】构建进化树报错

*_summary.txt报错: MEGA-CC 10.2.6 Molecular Evolutionary Genetics Analysis Build#: 10210527-x86_640% Reading distance matrix MEGA-CC has logged the following error:When 2024年09月13日 下午 01时32分49秒 下午Data …...

面试常见八股

JAVA篇 基础 1、自动拆箱和装箱 装箱:装箱是将值类型(如int、double、struct等)转换为object类型或任何接口类型的过程。由于object是所有类型的基类(在.NET中),并且接口是引用类型,因此装箱…...

第十八章 番外 余弦相似度

余弦相似度(Cosine Similarity)是一种衡量两个非零向量之间角度的度量方式,用于评估它们之间的相似性。它的值范围从 -1 到 1,其中 1 表示完全相同的方向(即向量完全相同),0 表示正交&#xff0…...

HPA和helm

HPA pod的数量进行扩缩容 针对控制器创建的pod deployment: replica: 静态:edit yaml:apply -f HPA:基于cpu的利用率来实现pod数量的自动伸缩。 Horizontal pod autoscaling yaml文件————主流——————…...

基于人工智能的智能语音助手

语音助手的自然语言处理模块是语音助手系统的关键组成部分。通过这个模块,系统能够识别用户的意图并做出相应的回应。我们可以使用NLP技术来解析文本输入,并将其转换为系统可以理解的命令或指令。在本项目中,我们将结合语音识别、自然语言处理…...

java实际开发——数据库存储金额时用什么数据类型?(MySQL、PostgreSQL)

目录 java开发时金额用的数据类型——BigDecimal MySQL存储金额数据时用的数据类型是——decimal PostgreSQL存储金额数据时用的数据类型是——decimal 或 money java开发时金额用的数据类型——BigDecimal https://blog.csdn.net/Jilit_jilit/article/details/142180903?…...

Java 设计模式-状态模式

目录 一. 概述 二. 主要角色 三. 代码示例 四. 优缺点 优点: 缺点: 五. 常见应用场景 一. 概述 状态模式是一种行为设计模式,它允许一个对象在其内部状态改变时改变它的行为。对象看起来好像修改了它的类。状态模式把所有的与一个特定…...

2024.9.13 Python与图像处理新国大EE5731课程大作业,索贝尔算子计算边缘,高斯核模糊边缘,Haar小波计算边缘

1.编写一个图像二维卷积程序。它应该能够处理任何灰度输入图像,并使用以下内核进行操作: %matplotlib inline import numpy as np import matplotlib.pyplot as plt from scipy import linalg import random as rm import math import cv2# import and …...

动态IP池的IP都是纯净IP吗?

在当今互联网时代,动态IP池作为一种网络资源管理策略,被广泛应用于数据抓取、市场调研、广告验证等多种场景中。动态IP池能够提供大量可轮换的IP地址,以帮助用户避免因频繁访问同一网站而被封禁IP的情况。然而,一个关键的问题是&a…...

【MySQL】查询表中重复数据、模糊查询列信息、快速copy表数据(1)

一、SQL查询重复的数据: 1、SQL格式: Select * From 数据表 Where 重复记录字段 in ( select 重复记录字段 From 数据表 Group By 重复记录字段 Having Count(重复记录字段)>1) 2、举例: 在这个patient_member_info表中,我们…...

计算机操作系统之并行性与并发性笔记

目录 在计算机操作系统中,并行性与并发性是两个既相似又有区别的重要概念 并行性: 并发性: 可以通过多任务处理和资源共享来具体说明 并发性的例子 并行性的例子 总结 在计算机操作系统中,并行性与并发性是两个既相似又有区别…...

顶级高效的ChatGPT论文润色提示词和使用技巧

在学术研究中,精确和高效地对文本进行润色和修改是一个必不可少的重要环节。随着学术论文篇幅的增长和内容的复杂度上升,找到一种能够有效整理和优化修改内容的方法变得尤为关键。本文将探讨如何利用ChatGPT作为工具,通过具体的指令和策略,来优化文本的修改过程,提高学术写…...

WebAPI (一)DOM树、DOM对象,操作元素样式(style className,classList)。表单元素属性。自定义属性。间歇函数定时器

文章目录 Web API基本认知一、 变量声明二、 DOM1. DOM 树2. DOM对象3. 获取DOM对象(1)、选择匹配的第一个元素(2)、选择匹配多个元素 三、 操作元素1. 操作元素内容2. 操作元素属性(1)、常用属性(href之类的)(2)、通过style属性操作CSS(3)、通过类名(cl…...

若依框架开发

若依环境 介绍 ‌若依是一款快速开发平台(低代码),用于快速构建企业级后台管理系统,它提供了许多常用的功能模块和组件,包括权限管理、代码生成、工作流、消息中心等 官方地址: https://www.ruoyi.vip/ ‌基于Spring Boot和Spring Cloud‌…...

局域网windows下使用Git

windows下如何使用局域网进行git部署 准备工作第一步 ,ip设置设置远程电脑的ip设置,如果不会设置请点击[这里](https://blog.csdn.net/Black_Friend/article/details/142170705?spm1001.2014.3001.5501)设置本地电脑的ip:验证 第二步&#x…...

Redis访问工具

使用Redis存储缓存数据,如何通过Java去访问Redis? 防止后面看晕,先来张图。 1. Redis的客户端库 Redis的客户端库是Redis官方提供的,用于让Java等编程语言与Redis服务器进行通信的工具包。常见的Redis客户端库有多个&#xff0c…...

vue3+ant design vue动态实现级联菜单~

1、这里使用的是ant design vue 的TreeSelect 树选择来实现的。 <a-form-item name"staffDept" label"责任部门" labelAlign"left"><a-tree-selectv-model:value"formState.staffDept"show-search//允许在下拉框中添加搜索框…...

软件可维护性因素例题

答案&#xff1a;C 知识点&#xff1a; 系统可维护性因素决定 可理解性 可测试性 可修改性 选项C可移植性错误...

git的一些操作

参考视频: git分支详解&#xff08;约10分钟掌握分支80%操作&#xff09;&#xff0c;git-branch&#xff0c;git分支管理&#xff0c;git分支操作&#xff0c;git分支基础和操作&#xff0c;2023年git基础使用教程 不同的分支相当于不同的平行世界 合并分支 两个分支是我们项…...

相机Camera日志实例分析之二:相机Camx【专业模式开启直方图拍照】单帧流程日志详解

【关注我&#xff0c;后续持续新增专题博文&#xff0c;谢谢&#xff01;&#xff01;&#xff01;】 上一篇我们讲了&#xff1a; 这一篇我们开始讲&#xff1a; 目录 一、场景操作步骤 二、日志基础关键字分级如下 三、场景日志如下&#xff1a; 一、场景操作步骤 操作步…...

前端倒计时误差!

提示:记录工作中遇到的需求及解决办法 文章目录 前言一、误差从何而来?二、五大解决方案1. 动态校准法(基础版)2. Web Worker 计时3. 服务器时间同步4. Performance API 高精度计时5. 页面可见性API优化三、生产环境最佳实践四、终极解决方案架构前言 前几天听说公司某个项…...

2025 后端自学UNIAPP【项目实战:旅游项目】6、我的收藏页面

代码框架视图 1、先添加一个获取收藏景点的列表请求 【在文件my_api.js文件中添加】 // 引入公共的请求封装 import http from ./my_http.js// 登录接口&#xff08;适配服务端返回 Token&#xff09; export const login async (code, avatar) > {const res await http…...

大学生职业发展与就业创业指导教学评价

这里是引用 作为软工2203/2204班的学生&#xff0c;我们非常感谢您在《大学生职业发展与就业创业指导》课程中的悉心教导。这门课程对我们即将面临实习和就业的工科学生来说至关重要&#xff0c;而您认真负责的教学态度&#xff0c;让课程的每一部分都充满了实用价值。 尤其让我…...

Rapidio门铃消息FIFO溢出机制

关于RapidIO门铃消息FIFO的溢出机制及其与中断抖动的关系&#xff0c;以下是深入解析&#xff1a; 门铃FIFO溢出的本质 在RapidIO系统中&#xff0c;门铃消息FIFO是硬件控制器内部的缓冲区&#xff0c;用于临时存储接收到的门铃消息&#xff08;Doorbell Message&#xff09;。…...

LLMs 系列实操科普(1)

写在前面&#xff1a; 本期内容我们继续 Andrej Karpathy 的《How I use LLMs》讲座内容&#xff0c;原视频时长 ~130 分钟&#xff0c;以实操演示主流的一些 LLMs 的使用&#xff0c;由于涉及到实操&#xff0c;实际上并不适合以文字整理&#xff0c;但还是决定尽量整理一份笔…...

Redis:现代应用开发的高效内存数据存储利器

一、Redis的起源与发展 Redis最初由意大利程序员Salvatore Sanfilippo在2009年开发&#xff0c;其初衷是为了满足他自己的一个项目需求&#xff0c;即需要一个高性能的键值存储系统来解决传统数据库在高并发场景下的性能瓶颈。随着项目的开源&#xff0c;Redis凭借其简单易用、…...

微服务通信安全:深入解析mTLS的原理与实践

&#x1f525;「炎码工坊」技术弹药已装填&#xff01; 点击关注 → 解锁工业级干货【工具实测|项目避坑|源码燃烧指南】 一、引言&#xff1a;微服务时代的通信安全挑战 随着云原生和微服务架构的普及&#xff0c;服务间的通信安全成为系统设计的核心议题。传统的单体架构中&…...

云安全与网络安全:核心区别与协同作用解析

在数字化转型的浪潮中&#xff0c;云安全与网络安全作为信息安全的两大支柱&#xff0c;常被混淆但本质不同。本文将从概念、责任分工、技术手段、威胁类型等维度深入解析两者的差异&#xff0c;并探讨它们的协同作用。 一、核心区别 定义与范围 网络安全&#xff1a;聚焦于保…...

Java数组Arrays操作全攻略

Arrays类的概述 Java中的Arrays类位于java.util包中&#xff0c;提供了一系列静态方法用于操作数组&#xff08;如排序、搜索、填充、比较等&#xff09;。这些方法适用于基本类型数组和对象数组。 常用成员方法及代码示例 排序&#xff08;sort&#xff09; 对数组进行升序…...