沉浸式体验Stability AI最新超强AI图片生成模型Ultra
2024年9月4日,亚马逊云科技在Amazon Bedrock上新了Stability AI最新的的三款文本图像生成模型:他们分别是Stable Image Ultra、Stable Diffusion 3 Large 和 Stable Image Core。全新的模型在处理多主题提示词、图像质量和图片排版上较上一代模型有显著提升,能够更块地生成高质量的视觉内容,我们们的日常可以应用的场景包括市场营销、广告、媒体、娱乐、零售等多个领域。
这一代全新的模型令小李哥印象最深刻的就是可以生成具有惊人写实度的图像,细节、颜色和光线处理能力十分优秀,能够解决日常的渲染问题,比如生成真实的手部和面部图像。它们的高级提示理解能力还允许模型准确理解更为复杂的提示指令,比如处理空间推理、构图和风格等需求。大家听完介绍后是不是很心动呢?下面就跟着我一起了解这次Stability AI发布的新款模型,并学习如何在亚马逊云科技平台上调用该模型API。
这次Stability AI发布的三款模型是什么?
这三款Stability AI模型适用于不同的使用场景:
-
Stable Image Ultra
专为专业媒体机构和对图片内容要求极高的应用提供最高质量的接近于现实的输出,擅长呈现极致的细节与真实感。
-
Stable Diffusion 3 Large
在生成速度和输出质量之间进行了折中,非常适合创建高质量的大批量数字内容,如网站、新闻通讯和营销材料。 -
Stable Image Core
优化了图像生成的速度和成本,非常适合在概念构思阶段实现图像创意的样例。

利用Stability AI模型生成图片展示
小李哥觉得这次新发布的Stable Image Ultra和Stable Diffusion 3 Large与上一代模型Stable Diffusion XL (SDXL) 相比的最关键的提升就是——生成图像中的文字质量。在模型所使用的全新Diffusion Transformer架构支持下,生成的图片在拼写和排版出现的错误更少,这一架构实现了图像和文字的两个独立权重集,但能够在两种模式之间进行信息流动,从而增强了生成图像中的文字表现和准确度。
以下就是生成的图像示例:
Stable Image Ultra:
我们输入提示词:"照片,写实,一名女子坐在田野里看着风筝飞向天空,天空要下雨,图片中包括大量细节,概念艺术,复杂,专业构图。"我们可以得到以下生成图片:

Stable Diffusion 3 Large:
我们输入提示词:"漫画风格插图,一个男侦探站在街灯下,黑帮城市风格,该男侦探穿着风衣,戴着礼帽,天气阴暗且多雨,街道挂满了霓虹灯牌,路面湿漉漉的,反射忧郁的灯光,细节丰富。"我们可以得到以下生成图片:

Stable Image Core:
我们输入提示词:"生成一双白色和橙色运动鞋的3D图片,悬浮在中央,高质量,写实。"我们可以得到以下生成图片:

全新Stability AI模型在 Amazon Bedrock上的应用场景
文本生成图像模型在各行各业都可以被广泛应用,尤其是游戏、市场营销和广告部门的图像设计工作。这些模型可以快速生成高质量的视觉内容,用于广告活动、社交媒体图片和产品模型,加速生产力和产品交付周期。此外,这些AI模型能够在图像设计中带来更多超越常规想象的创意,提供实时的概念视觉表达,激发更多产品方面的创新。
对于电商业务,Stablitily AI生成的图像可以帮助创建大规模的多样化的产品展示和定制化的营销材料。在UI设计领域,利用该模型也可以快速生成样例界面,加速设计迭代周期。将AI应用到这些领域可以显著降低成本,提高生产力,并在视觉方面为开发者的项目和业务带来竞争优势。
热门应用场景:
-
广告和市场营销
- Stable Image Ultra可以用于生成产品展示图,如奢侈品牌广告
- Stable Diffusion 3 Large生成高质量产品营销图像和广告
- Stable Image Core快速生成社交媒体广告视觉概念,便于A/B 测试
-
电商
- Stable Image Ultra用于高端产品定制和定制商品设计图
- Stable Diffusion 3 Large生成电商网站上大多数产品的视觉内容
- Stable Image Core快速生成产品图像并更新商品图片列表
-
媒体和娱乐
- Stable Image Ultra生成超写实的艺术作品和游戏视觉
- Stable Diffusion 3 Large用于游戏内环境纹理、角色设计和游戏内道具
- Stable Image Core进行快速的游戏原型设计和概念艺术探索
在亚马逊云科技上使用全新Stability AI模型的方法
通过亚马逊云科技Amazon Bedrock控制台
1. 进入Amazon Bedrock服务后,在Playgrouds操作台选择图片模型,选中Stable Image Ultra模型

2. 在提示词中输入如下内容生成一个蒸汽机器人:
A stylized picture of a cute old steampunk robot with in its hands a sign written in chalk that says "Stability AI models in Amazon Bedrock".
3. 我们最终得到如下生成的图片

通过亚马逊云科技CLI命令行工具生成图片
我们可以运行以下Bash命令调用Amazon Bedrock上的Stability AI模型生成图片
aws bedrock-runtime invoke-model \
--model-id stability.stable-image-ultra-v1:0 \
--body "{\"prompt\":\"A stylized picture of a cute old steampunk robot with in its hands a sign written in chalk that says \\\"Stability AI models in Amazon Bedrock\\\".\",\"mode\":\"text-to-image\",\"aspect_ratio\":\"1:1\",\"output_format\":\"jpeg\"}" \
--cli-binary-format raw-in-base64-out \
--region us-west-2 \
/dev/stdout | jq -r '.images[0]' | base64 --decode > img.jpg
API调用参数如下:
1)--model-id stability.stable-image-ultra-v1:0: 模型ID
2)body.prompt: 图片生成提示词
3)body.mode:text-to-image: 生成模式选择为根据图片生成图片
4)aspect_ratio:1:1:生成图片比例为1比1
5)output_format: jpeg:输出格式选择JPEG
6) --cli-binary-format raw-in-base64-out:以Base64编码输出
7)--region: 大模型所在区域
通过Python代码生成图片
我们也可以使用亚马逊云科技的Python SDK Boto3编写代码,调用Amazon Bedrock上的Stability AI模型AI生成图片,实例代码如下:
import base64
import boto3
import json
import osMODEL_ID = "stability.stable-image-ultra-v1:0"bedrock_runtime = boto3.client("bedrock-runtime", region_name="us-west-2")print("Enter a prompt for the text-to-image model:")
prompt = input()body = {"prompt": prompt,"mode": "text-to-image"
}
response = bedrock_runtime.invoke_model(modelId=MODEL_ID, body=json.dumps(body))model_response = json.loads(response["body"].read())base64_image_data = model_response["images"][0]i, output_dir = 1, "output"
if not os.path.exists(output_dir):os.makedirs(output_dir)
while os.path.exists(os.path.join(output_dir, f"img_{i}.png")):i += 1image_data = base64.b64decode(base64_image_data)image_path = os.path.join(output_dir, f"img_{i}.png")
with open(image_path, "wb") as file:file.write(image_data)print(f"The generated image has been saved to {image_path}")
以上就是在亚马逊云科技上利用Stability AI全新发布的模型生成逼真现实度图片的全部步骤。欢迎大家关注小李哥未来获取更多国际前沿的亚马逊云科技生成式AI云开发/云架构方案。
相关文章:
沉浸式体验Stability AI最新超强AI图片生成模型Ultra
2024年9月4日,亚马逊云科技在Amazon Bedrock上新了Stability AI最新的的三款文本图像生成模型:他们分别是Stable Image Ultra、Stable Diffusion 3 Large 和 Stable Image Core。全新的模型在处理多主题提示词、图像质量和图片排版上较上一代模型有显著提…...
网络安全宣传周的时间,举办活动的方式和意义
网络安全宣传周是中国国家层面为提升公众网络安全意识、普及网络安全知识、推广网络安全技能而设立的一项重要活动。以下是对网络安全宣传周的时间,举办活动的方式和意义的介绍: 时间:国家网络安全宣传周自2014年首次举办以来,每…...
Jacoco的XML报告详解
使用jacococli完成jacoco测试报告生成后,会看到有一个.xml结尾的文件,这个就是xml格式的覆盖率报告。除了xml还有csv、html格式的报告,本文进介绍xml报告。 DTD文件 在介绍jacoco的xml报告之前,我们应该先看一下对应的DTD文件的内容。(DTD的全称为Document Type Definitio…...
【数据结构与算法 | 灵神题单 | 合并链表篇】力扣2, 21, 445, 2816
1. 力扣2:两数相加 1.1 题目: 给你两个 非空 的链表,表示两个非负的整数。它们每位数字都是按照 逆序 的方式存储的,并且每个节点只能存储 一位 数字。 请你将两个数相加,并以相同形式返回一个表示和的链表。 你可…...
【秒达开源】多功能中文工具箱源码:自部署 全开源 轻量级跨平台 GPT级支持+高效UI+Docker
【秒达开源】多功能中文工具箱源码发布:自部署、全开源、轻量级跨平台,GPT级支持高效UI,Docker/便携版任选,桌面友好丰富插件生态 这是一款集大成之作,专为追求高效与便捷的用户量身打造。它不仅支持完全自部署&#…...
【云原生安全篇】一文掌握Harbor集成Trivy应用实践
【云原生安全篇】一文掌握Harbor集成Trivy应用实践 目录 1 概念 1.1 什么是 Harbor 和 Trivy? 1.1.1 Harbor 1.1.2 Trivy 1.2 Harbor 与 Trivy 的关系 Trivy 在 Harbor 中的作用: 1.3 镜像扫描工作流程 2 实战案例:在Harbor 配置 Trivy …...
计算机网络30——Linux-gdb调试命令makefile
1、开始调试 编译时带-g为调试,带调试信息编译后的可执行文件更大 2、进入调试 使用gdb 可执行文件名——进入调试 失败版: 成功版: 3、l命令 l什么都不加——列出10行代码 l 行号——行号的行在中间,向上向下展示10行 4、st…...
【物联网】一篇文章带你认识RFID(射频识别技术)
基本原理 RFID是Radio Frequency Identification的缩写,即射频识别技术,其工作原理基于电磁感应理论(射频一般指微波,频段在1-100GHz,适用于短距离通信),是一种非接触式的自动识别技术…...
STM32G474RE之RTC
STM32G474RE之RTC使用HAL库实现RTC时间配置,以及报警配置,支持双路报警。 1、STM32G474RE的RTC晶振引脚: OSC32_IN为PC14,OSC32_OUT为PC15; 2、Vbat引脚 Vbat引脚是用来给外部晶振LSE和备份寄存器提供电源。当没有“…...
TwinCAT3 实时核中ADS实现C++ server、clinet数据传输
一、基本概念 ADS :Automation Device Specification,ADS设备间进行通信的协议规范。协议定义了ADS device之间如何寻址对方、ADS device之间可以执行哪些操作、执行这些操作需要哪些参数,以及操作完成后如何返回结果等。从编程角度看&#…...
apt:Debian 高级包管理器
apt 是 Advanced Package Tool 的缩写。 apt 是一个在 Debian 及其衍生版本(如 Ubuntu)上管理软件包的工具。以下是一些常见的 apt 命令和用法: 1. 更新软件包列表 sudo apt update2. 安装软件包 sudo apt install package_nam…...
基于React+JsonServer+Antddesign的读书笔记关联系统
文章目录 涉及技术系统功能JsonServer介绍JsonServer安装JsonServer使用创建React项目我的书架显示效果关键代码笔记显示效果关键代码人物关系显示效果关键代码个人中心显示效果关键代码完整代码和数据下载地址项目启动步骤启动json-server启动react项目涉及技术 React Antddes…...
【win工具】win安装flameshot并设置截图快捷键
1.下载flameshot软件2.windows端配置flameshot快捷键3.取消win自带截图快捷键 1.下载flameshot软件 https://flameshot.org/#download installer版本为安装包 portable版本为免安装版 2.windows端配置flameshot快捷键 https://cloud.tencent.com/developer/article/2114952 W…...
react 安装使用 antd+国际化+定制化主题+样式兼容
安装antd 现在从 yarn 或 npm 或 pnpm 安装并引入 antd。 yarn add antd修改 src/App.js,引入 antd 的按钮组件。 import React from react; import { Button } from antd;const App: React.FC () > (<div className"App"><Button type&q…...
【Kubernetes】常见面试题汇总(十六)
目录 48.简述 Kubernetes PodsecurityPolicy 机制能实现哪些安全策略? 49.简述 Kubernetes 网络模型? 50.简述 Kubernetes CNl 模型? 48.简述 Kubernetes PodsecurityPolicy 机制能实现哪些安全策略? 在 PodSecurityPolicy 对象…...
【mysql】mysql之优化
本站以分享各种运维经验和运维所需要的技能为主 《python零基础入门》:python零基础入门学习 《python运维脚本》: python运维脚本实践 《shell》:shell学习 《terraform》持续更新中:terraform_Aws学习零基础入门到最佳实战 《k8…...
Django REST framework 实现缓存机制以优化性能
Django REST framework 实现缓存机制以优化性能 页面首页中,导航菜单或轮播广告在项目中每一个页面都会被用户频繁访问到,所以我们可以实现缓存,减少MySQL数据库的查询压力,使用内存缓存可以加快数据查询速度。 cache_page 装饰…...
快速了解高并发解决方案
对《高并发的哲学原理》的个人总结,原书地址如下 https://pphc.lvwenhan.com/ 本书的核心思想就是拆分,服务细化拆分多资源并行。 通用设计方法 例子:每秒100万次http请求 通过架构解决性能问题,在面对并发需求时ÿ…...
SpringBoot框架下的房产销售系统设计与实现
摘 要 随着科学技术的飞速发展,各行各业都在努力与现代先进技术接轨,通过科技手段提高自身的优势;对于房产销售系统当然也不能排除在外,随着网络技术的不断成熟,带动了房产销售系统,它彻底改变了过去传统的…...
基于RFID的门禁系统的设计(论文+源码)
1系统方案设计 通过需求分析,基于RFID的门禁系统总体设计框图。系统采用STM32单片机作为系统主控核心,利用独立按键与RFID识别模块能够实现门禁系统密码与IC卡开门功能。WiFi模块实现系统与手机APP的通信,用户可以通过手机APP进行门禁开关操…...
2026届最火的十大降AI率神器解析与推荐
Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 人工智能生成内容也就是 AIGC 技术迅猛发展着,其在学术领域的应用引发着深刻变革…...
ChanlunX缠论插件:5分钟实现通达信专业缠论分析的完整指南
ChanlunX缠论插件:5分钟实现通达信专业缠论分析的完整指南 【免费下载链接】ChanlunX 缠中说禅炒股缠论可视化插件 项目地址: https://gitcode.com/gh_mirrors/ch/ChanlunX ChanlunX缠论插件是一款专为通达信用户设计的智能缠论分析工具,它通过DL…...
Ubuntu 22.04 下配置 Arduino IDE 2.x:从安装到第三方库的完整避坑指南
1. 准备工作:下载Arduino IDE 2.x 在Ubuntu 22.04上配置Arduino开发环境,第一步自然是获取官方IDE。我推荐直接从Arduino官网下载最新版本,避免使用老旧软件包带来的兼容性问题。打开浏览器访问arduino.cc/en/software,你会看到两…...
从零到一:手把手带你完成DevEco Studio环境搭建与项目启动
1. 环境准备:从下载到安装的完整指南 第一次接触HarmonyOS开发的朋友们,你们好!我是老张,在智能硬件行业摸爬滚打十多年,今天要带大家搞定DevEco Studio这个开发利器。很多人刚开始都会被环境搭建劝退,其实…...
Visual C++运行库终极解决方案:一站式修复所有Windows程序依赖问题
Visual C运行库终极解决方案:一站式修复所有Windows程序依赖问题 【免费下载链接】vcredist AIO Repack for latest Microsoft Visual C Redistributable Runtimes 项目地址: https://gitcode.com/gh_mirrors/vc/vcredist 你是否经常遇到"缺少msvcp140.…...
从公式到代码:傅里叶级数系数的完整推导与实现
1. 从三角函数到傅里叶级数:数学基础回顾 第一次接触傅里叶级数时,我被那一堆积分符号和三角函数搞得头晕眼花。后来才发现,理解它的关键其实藏在高中数学课本里——那些看似简单的三角函数公式,正是打开傅里叶变换大门的钥匙。 让…...
SAP屏幕导航:从SET到LEAVE,实战解析六大跳转策略
1. SAP屏幕导航的核心逻辑 在SAP ABAP开发中,屏幕导航就像是在迷宫中寻找出口。想象你手里有六把不同的钥匙(六种跳转策略),每把钥匙对应不同的门锁(业务场景)。选错钥匙要么打不开门,要么可能把…...
明日方舟终极自动化助手:MAA智能辅助工具完整实战指南
明日方舟终极自动化助手:MAA智能辅助工具完整实战指南 【免费下载链接】MaaAssistantArknights 《明日方舟》小助手,全日常一键长草!| A one-click tool for the daily tasks of Arknights, supporting all clients. 项目地址: https://git…...
Deepin Boot Maker:Linux启动盘制作的智能化解决方案
Deepin Boot Maker:Linux启动盘制作的智能化解决方案 【免费下载链接】deepin-boot-maker 项目地址: https://gitcode.com/gh_mirrors/de/deepin-boot-maker 在Linux系统安装领域,传统命令行操作的门槛让许多用户望而却步。Deepin Boot Maker作为…...
为什么你的“--style raw”输出毫无银盐颗粒感?深度解析Midjourney V6渲染管线中未公开的卤化银模拟层
更多请点击: https://intelliparadigm.com 第一章:卤化银模拟层的光学隐喻与历史语境 在数字成像技术蓬勃发展的今天,回溯胶片时代的物理成像机制,不仅具有技术考古价值,更构成理解当代计算摄影底层隐喻的关键支点。“…...

