当前位置: 首页 > news >正文

一分钟!图片生成32种动画;Adobe绘画工具大升级;复盘Kaggle首场LLM比赛;VR科普万字长文 | ShowMeAI日报

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦!

🔥 Adobe Firefly 大升级!图像高清、操作便利,体验感拉满

https://firefly.adobe.com

Adobe Firefly 升级了,增加了很多定制化功能,模型能力也更强大了!生成图片的默认分辨率居然是2048*2048,远超一般图片平台的清晰度了。本次升级要点如下,使用魔法访问上方链接,就可以免费体验了!

  1. 模型升级到 Firefly Image 2,可以创建更逼真的图像,图像质量更高

  2. 支持图生图:相当于 Midjourney 垫图功能

  3. 支持设置照片参数:可以像相机一样更改光圈、快门速度和视角等参数

  4. 提供提示词建议,支持添加反向提示词,支持云储存生成的图片

  5. 将鼠标放在生成的图片上,可以对图片进行二次编辑 ⋙ 官方博客

🧰 图片转动画在线AI工具,一分钟就可以做出32个动画

https://sketch.metademolab.com

前两天社群小伙伴找一个AI工具,用一张图片就可以做成动画。当时,整个群一起沉默了。。。不过!逛小红书时看到了「Animated Drawings」,完美满足需求!无需魔法,点击鼠标就可以让一张图片动起来,还能在32种动作类型中切换

  • 第1步:准备素材,注意四肢不与身体重叠,纯白背景,确保清晰度

  • 第2步:上传图片并裁剪出角色

  • 第3步:AI自动识别角色边界,将主体与背景分开

  • 第4步:AI智能识别骨骼,可以调整绑定关节

  • 第5步:系统预设了32种动画,点击可以查看角色动作

  • 第6步:点击图像右下角标识,可以下载动画 .mp4 视频,找在线工具就可以转成 .gif 格式啦 ⋙ 小红书-视频教程

🧩 Kaggle 首场大模型比赛,金牌解决方案复盘

https://www.kaggle.com/competitions/kaggle-llm-science-exam

Kaggle 作为全球知名的数据科学比赛平台,也参与到了大模型浪潮当中,陆续上线 LLM 相关的比赛和主题分享。

今天要讲的这场比赛「LLM Science Exam」,设定与传统的大模型测评场景比较类似,即给定科学类题目和5个选项ABCDE,选出一个正确答案。

在 Kaggle 平台限制了计算资源、项目时间的情况下,全球大牛们各显神通,给出了不同思路的解决方案。前5名的大佬们用了哪些模型和处理技巧?各类模型表现排名如何?在这篇笔记里写得很清晰了 ⋙ 阅读原文

👀 Poe主流大模型测评榜单:GPT-4完胜,但有意外收获!

https://poe.com/bot_rankings

Poe 是一款聚合了海外主流大模型的AI聊天机器人应用,最近和SurgeAI合作对主流LLM进行了4个维度的评估:推理、和非英语流利程度、创造力性、写作。结果如上图所示,整体客观可信。

GPT-4 拿到了所有第1名,一如既往是「别人家的孩子」。不过,Google-PaLM 对非英语地支持能力排在第2名,Llama-2-70b 在创造性和写作测评中获得第3名,倒是让人耳目一新!值得多做一些模型应用尝试和摸索。测评原理可以访问上方 Poe 链接查看博文~

📜 AI会对HR工作产生哪些影响?这里有一份调查报告

国内外的人才平台和招聘平台正在陆续引进大模型功能。AI对招聘和求职将带来什么影响呢?HR和应聘者持乐观还是悲观态度呢?这份报告给出了1000+人的调研结果。整体来说,双方都对技术发展持乐观态度,但也担心AI偏见等导致的决策失误。

选出了几个调研的关键数据,完整报告和分析可以前往下方原文查看:

  • 约 77% 的HR认为,AI很快就会足够先进,承担聘用决策的重任

  • 约 89% 的受访者认为,AI可以帮助求职者完成申请流程

  • 约 31% 的受访者同意由AI来决定他们是否被录用 ⋙ 阅读原文

📚 万字长文!VR 不完全科普指南,一文了解VR原理和前景

这是一篇易懂又全面的 VR (虚拟现实) 技术的科普文章,全面介绍了 VR 技术发展历史、核心原理和应用前景,读完可以对这一领域有着透彻的理解,跟上目前眼花缭乱的产品发布节奏。以下是文章要点,可以对照查看原文:

一、上帝的画笔:介绍了VR起源,它实现了让人类真正拿起创世神的画笔、描绘并体验虚拟世界的梦想

二、我们应该如何呈现世界

  • 一块屏幕:介绍了VR中使用的显示屏技术的发展和优劣势

  • 把光映入眼中:说明了VR利用凸透镜的原理实现近距离成像和视觉放大

  • 沉浸感的实现:通过双屏幕呈现立体视差,利用人眼合成立体图像的原理

  • 远近感知:讲解了人眼判断距离的生理机制,以及VR中利用眼动调节解决远近感知问题

三、世界应该如何与我们交互

  • 空间定位:介绍了IMU和内外部摄像头追踪的工作原理

  • 面部、眼动和手势追踪:说明了各种传感器实现面部追踪、眼动追踪和手势交互的技术

  • 全彩透视:可以将VR捕捉真实环境,实现数字孪生等应用

四、把大象塞进冰箱的最后一步:对VR头显的核心部件如传感器、芯片进行概述

五、后记:总结了作者的写作心得,对VR技术发展的期待 ⋙ 阅读原文

📋 从VAE到DDPM,一文搞懂AIGC 图像生成模型的发展历程

AIGC 指的是人工智能生成内容 (AI Generated Content),就是最近大火的基于AI生成文字、图片、视频、音频等。AIGC 生成图像的过程用到了 DALL-E、Stable Diffusion 等模型,它们都是基于Diffusion Model、特别是 Conditional DDPM 算法实现的。

这篇文章将原理、公式和代码结合在一起,展示了图像生成模型由简单到复杂的技术发展历程。如果你在学习 Diffusion Model 之前需要补充基础知识,记得回看这篇文章。

  1. AE (AutoEncoder):最基础的重构模型,通过编码器提取图片特征,解码器重构图片

  2. VAE (Variational AutoEncoder):在AE基础上,编码器输出是连续latent变量,使其服从某分布 (如高斯分布),可以生成新的样本

  3. CVAE (Conditional VAE):在VAE基础上引入条件,可以控制生成结果

  4. DDPM (Denoising Diffusion Probabilistic Model):一种生成模型,将数据逐步添加高斯噪音,再逐步去噪重构,可以生成高质量样本

  5. Conditional DDPM:在DDPM中引入条件,控制生成过程 ⋙ 阅读原文

📚 RLHF + Diffusion Models = ?一次很有意思的尝试!

https://www.tanishq.ai/blog/posts/ddpo.html

近年来,生成式AI主要有两大进展,一个是语言模型 (如ChatGPT、LLaMA-2),另一个是图像生成模型 (如DALL-E、Stable Diffusion)。语言模型使用了强化学习中的人类反馈 (RLHF) 技术,使其更容易遵循指示。因此作者提出, RLHF 能否也应用于后者?

  • 作者尝试将强化学习中的 DDPO 算法应用于Stable Diffusion等扩散模型,以优化生成图像的审美质量。具体来说,文章首先建立了将扩散模型形式化为马尔可夫决策过程的框架,然后推导出了DDPO的目标函数,并给出了完整的训练流程。

  • 在ImageNet动物数据集上进行的实验表明,这种方法可以有效提升图像的视觉质量和美感。当然,由于奖励函数本身并不包含语义指示,所以有时生成的图像会偏离原始提示。

总体来说,这项工作展现了强化学习在提升生成模型表现方面的潜力!

感谢贡献一手资讯、资料与使用体验的 ShowMeAI 社区同学们!

订阅合集 #ShowMeAI日报,查看历史消息,接收每日最新推送; 点击公众号底部菜单栏,或者回复关键字 日报 ,可以获取独家AI发展趋势报告、原创AI专题资料合集等。

◉ 点击 👀日报&周刊合集,订阅话题 #ShowMeAI日报,一览AI领域发展前沿,抓住最新发展机会!

◉ 点击 🎡生产力工具与行业应用大全,一起在信息浪潮里扑腾起来吧!

相关文章:

一分钟!图片生成32种动画;Adobe绘画工具大升级;复盘Kaggle首场LLM比赛;VR科普万字长文 | ShowMeAI日报

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦! 🔥 Adobe Firefly 大升级!图像高清、操作便利,体验感拉满 https://firefly.adobe.com Adobe Firefly 升级了&…...

[Framework] Android Handler 工作原理

Android 中的 Handler 都被人说烂了,但是还是想多说一次,因为在 Android 的系统中它真的非常重要而且它的机制并没有很复杂,无论是新手和老手都可以好好学习下,这对理解 Android 系统很重要,所以说学习的性价比非常高。…...

KITTI数据集中的二进制激光雷达数据(.bin文件)转换为点云数据(.pcd文件)(C++代码)

目录 main.cpp CMakeLists.txt main.cpp #include <pcl/io/pcd_io.h> #include <pcl/point_types.h> #include <fstream> #include <iostream> #include <vector>int main() {// Define file pathsstd::string input_filename "/home/f…...

全球AI人工智能领袖:Anthropic联合创始人丹妮拉·阿莫迪!

在创业界中&#xff0c;有许多杰出的女性企业家&#xff0c;而丹妮拉阿莫迪则是其中的佼佼者。作为Anthropic联合创始人&#xff0c;丹妮拉以她的智慧、勇气和远见闻名于世。 她的故事既是启迪&#xff0c;又是励志&#xff0c;让我们一起来看看她的独特之处。 丹妮拉阿莫迪毕…...

CoT 的方式使用 LLM 设计测试用例实践

前期准备 import SparkApi import os from dotenv import load_dotenv, find_dotenv#以下密钥信息从控制台获取_=load_dotenv(find_dotenv()) appid = os.getenv("SPARK_APP_ID") api_secret=os.getenv("SPARK_APP_SECRET") api_key=os.getenv("SPAR…...

神秘的锦衣卫

在看明朝电视剧经常听到的一句台词&#xff1a;锦衣卫办案&#xff0c;闲杂人等速速离开。锦衣卫是明朝特务机构&#xff0c;直接听命于皇帝&#xff0c;是亲军卫之一&#xff0c;也是最重要的一卫。 1、卫所制 卫所制是明代最主要的军事制度&#xff0c;其目标是寓兵于农、屯…...

Springboot中使用Redis

Redis 是一个基于内存的key-value的结构数据库适合存储热点数据 Macos安装Redis https://redis.io/docs/getting-started/installation/install-redis-on-mac-os/安装redis brew install redis查看安装信息&#xff1a; brew info redis前台启动redis: redis-server后台启…...

超声波波形生成电路设计

摘要 随着我国微型电子技术和嵌入式系统的发展&#xff0c;目前行业内相对比较传统的超声波技术无法满足客户的需求。为了改进传统超声波技术在被测设备上的短板问题&#xff0c;在本次毕业设计中&#xff0c;将使用相对先进、快捷、智能的控制机制。该超声波生成控制系统的控制…...

C#和JS交互之Microsoft.ClearScript.V8(V8引擎)

之前测试了很多JS引擎&#xff0c;都只支持es5语法&#xff0c;不支持执行es6&#xff0c;测试了下微软的V8反正能跑通&#xff0c;应该是支持的。还得是微软呀。 如图&#xff1a;安装相关包&#xff1a; 这是参考的官方V8代码 using Microsoft.ClearScript.JavaScript; us…...

9月活动回顾(免费领取PPT)|火山引擎DataLeap、ByteHouse多位专家带来DataOps、实时计算等前沿技术分享!

更多技术交流、求职机会&#xff0c;欢迎关注字节跳动数据平台微信公众号&#xff0c;回复【1】进入官方交流群 在上月举行的火山引擎开发者社区 Meetup 第12期暨超话数据专场《数智化转型背景下的火山引擎大数据技术揭秘》上&#xff0c;来自火山引擎DataLeap、EMR、DataSail、…...

salesforce的按钮执行js代码如何链接到apex代码

在Salesforce中&#xff0c;你可以通过自定义JavaScript按钮或链接来触发Apex代码的执行。这可以通过使用JavaScript Remoting或Visualforce页面来实现。以下是一些步骤来将JavaScript按钮与Apex代码链接起来&#xff1a; 使用JavaScript Remoting链接JavaScript按钮到Apex代码…...

C语言 —— 操作符

1. 操作符的分类 算术操作符: - * / % 移位操作符: << >> 位操作符: & | ^ 赋值操作符: - 单目操作符 关系操作符 逻辑操作符 条件操作符 逗号表达式 下标引用、函数调用和结构成员 2. 算术操作符 - * / % 注意 /操作符: 对于整型的除法运算结果依然是整数…...

物联网AI MicroPython传感器学习 之 CCS811空气质量检测传感器

学物联网&#xff0c;来万物简单IoT物联网&#xff01;&#xff01; 一、产品简介 通过CCS811传感器模块可以测量环境中TVOC(总挥发性有机物质)浓度和eCO2(二氧化碳)浓度&#xff0c;作为衡量空气质量&#xff08;IAQ&#xff09;的指标。 引脚定义 VCC&#xff1a;3.3VGND&…...

TCP/IP(十五)拥塞控制

一 拥塞控制 ① 拥塞控制必要性 思考&#xff1a; 为什么要有拥塞控制呀,不是有流量控制了吗&#xff1f; ② 拥赛窗口 cwnd 什么是拥塞窗口? 和发送窗口有什么关系呢?明白&#xff1a; cwnd、swnd、rwnd 缩写 含义 ③ 如何知道当前网络是否出现了拥塞呢&#xff1f;…...

vue3 404解决方法

在 Vue 3 应用中解决 404 错误通常涉及到 Vue Router&#xff0c;因为 404 错误通常与路由无法匹配到的路径有关. 1. **检查路由配置**&#xff1a;首先确保你的路由配置正确。确保每个路由路径都与你的组件正确匹配&#xff0c;并且在需要时添加必要的路由守卫。 2. **通配符…...

Unity中使用Xlua调用lua相关

//引用命名空间 using XLua; public class L1 : MonoBehaviour {// Start is called before the first frame updatevoid Start(){//Lua解析器 让我们在Unity中使用luaLuaEnv env new LuaEnv();//执行env.DoString("print(OK)");//执行一个Lua脚本 在resource文件夹…...

基于http的protobuf服务实现

本文介绍在http协议中&#xff0c;使用protobuf格式进行二进制数据通信。双方需设置http的header中ContentType为application/x-protobuf。 1、springboot下实现protobuf&#xff1a; 1&#xff09;pom.xml <dependency><groupId>org.springframework.boot</g…...

基于uniapp的商城外卖小程序

博主主页&#xff1a;猫头鹰源码 博主简介&#xff1a;Java领域优质创作者、CSDN博客专家、公司架构师、全网粉丝5万、专注Java技术领域和毕业设计项目实战 主要内容&#xff1a;毕业设计(Javaweb项目|小程序等)、简历模板、学习资料、面试题库、技术咨询 文末联系获取 项目介绍…...

【CSS】Tailwind CSS

直接参考 Tailwind CSS 安装提供了四种方式。因为我常用构建工具搭建项目&#xff0c;所以选择 Using PostCSS 。 其中 tailwind.config.js 的配置可以改为&#xff1a; module.exports {content: [./index.html, ./src/**/*.{vue,js,ts,jsx,tsx}],theme: {extend: {},},pl…...

leetcode-电话号码组合(C CODE)

1. 题目 给定一个仅包含数字 2-9 的字符串&#xff0c;返回所有它能表示的字母组合。答案可以按 任意顺序 返回。 给出数字到字母的映射如下&#xff08;与电话按键相同&#xff09;。注意 1 不对应任何字母。 示例 1&#xff1a; 输入&#xff1a;digits “23” 输出&#…...

Ubuntu系统下交叉编译openssl

一、参考资料 OpenSSL&&libcurl库的交叉编译 - hesetone - 博客园 二、准备工作 1. 编译环境 宿主机&#xff1a;Ubuntu 20.04.6 LTSHost&#xff1a;ARM32位交叉编译器&#xff1a;arm-linux-gnueabihf-gcc-11.1.0 2. 设置交叉编译工具链 在交叉编译之前&#x…...

React hook之useRef

React useRef 详解 useRef 是 React 提供的一个 Hook&#xff0c;用于在函数组件中创建可变的引用对象。它在 React 开发中有多种重要用途&#xff0c;下面我将全面详细地介绍它的特性和用法。 基本概念 1. 创建 ref const refContainer useRef(initialValue);initialValu…...

【SQL学习笔记1】增删改查+多表连接全解析(内附SQL免费在线练习工具)

可以使用Sqliteviz这个网站免费编写sql语句&#xff0c;它能够让用户直接在浏览器内练习SQL的语法&#xff0c;不需要安装任何软件。 链接如下&#xff1a; sqliteviz 注意&#xff1a; 在转写SQL语法时&#xff0c;关键字之间有一个特定的顺序&#xff0c;这个顺序会影响到…...

linux 下常用变更-8

1、删除普通用户 查询用户初始UID和GIDls -l /home/ ###家目录中查看UID cat /etc/group ###此文件查看GID删除用户1.编辑文件 /etc/passwd 找到对应的行&#xff0c;YW343:x:0:0::/home/YW343:/bin/bash 2.将标红的位置修改为用户对应初始UID和GID&#xff1a; YW3…...

WEB3全栈开发——面试专业技能点P2智能合约开发(Solidity)

一、Solidity合约开发 下面是 Solidity 合约开发 的概念、代码示例及讲解&#xff0c;适合用作学习或写简历项目背景说明。 &#x1f9e0; 一、概念简介&#xff1a;Solidity 合约开发 Solidity 是一种专门为 以太坊&#xff08;Ethereum&#xff09;平台编写智能合约的高级编…...

第 86 场周赛:矩阵中的幻方、钥匙和房间、将数组拆分成斐波那契序列、猜猜这个单词

Q1、[中等] 矩阵中的幻方 1、题目描述 3 x 3 的幻方是一个填充有 从 1 到 9 的不同数字的 3 x 3 矩阵&#xff0c;其中每行&#xff0c;每列以及两条对角线上的各数之和都相等。 给定一个由整数组成的row x col 的 grid&#xff0c;其中有多少个 3 3 的 “幻方” 子矩阵&am…...

iOS性能调优实战:借助克魔(KeyMob)与常用工具深度洞察App瓶颈

在日常iOS开发过程中&#xff0c;性能问题往往是最令人头疼的一类Bug。尤其是在App上线前的压测阶段或是处理用户反馈的高发期&#xff0c;开发者往往需要面对卡顿、崩溃、能耗异常、日志混乱等一系列问题。这些问题表面上看似偶发&#xff0c;但背后往往隐藏着系统资源调度不当…...

Linux nano命令的基本使用

参考资料 GNU nanoを使いこなすnano基础 目录 一. 简介二. 文件打开2.1 普通方式打开文件2.2 只读方式打开文件 三. 文件查看3.1 打开文件时&#xff0c;显示行号3.2 翻页查看 四. 文件编辑4.1 Ctrl K 复制 和 Ctrl U 粘贴4.2 Alt/Esc U 撤回 五. 文件保存与退出5.1 Ctrl …...

Caliper 负载(Workload)详细解析

Caliper 负载(Workload)详细解析 负载(Workload)是 Caliper 性能测试的核心部分,它定义了测试期间要执行的具体合约调用行为和交易模式。下面我将全面深入地讲解负载的各个方面。 一、负载模块基本结构 一个典型的负载模块(如 workload.js)包含以下基本结构: use strict;/…...

day36-多路IO复用

一、基本概念 &#xff08;服务器多客户端模型&#xff09; 定义&#xff1a;单线程或单进程同时监测若干个文件描述符是否可以执行IO操作的能力 作用&#xff1a;应用程序通常需要处理来自多条事件流中的事件&#xff0c;比如我现在用的电脑&#xff0c;需要同时处理键盘鼠标…...