【腾讯云 HAI域探秘】探索AI绘画之路:利用腾讯云HAI服务打造智能画家
目录
- 前言
- 1 使用HAI服务作画的步骤
- 1.1 注册腾讯云账户
- 1.2 创建算力服务器
- 1.3 进入模型管理界面
- 1.4 汉化界面
- 1.5 探索AI绘画
- 2 模型参数的含义和调整建议
- 2.1 模型参数的含义和示例
- 2.2 模型参数的调整建议
- 3 调整参数作画的实践和效果
- 3.1 实践说明
- 3.2 实践效果1
- 3.3 实践效果2
- 3.4 实践效果3
- 3.5 实践效果4
- 3.6 实践效果5
- 4 实践的思考
- 4.1 提升算力
- 4.2 参数调整与观察
- 结语
- 参考文献
前言
随着人工智能的飞速发展,AI在艺术创作领域的应用正经历着一场革命性的变革。在这个数字时代,腾讯云的高性能应用服务HAI(Hyper Application Inventor)为艺术家和创作者提供了前所未有的机会,让他们能够借助先进的技术实现更加创新和引人入胜的艺术创作。
在本博客中,我将分享如何巧妙地运用腾讯云的HAI服务进行AI绘画,通过对模型参数的微妙调整,观察图画效果,从而深入测试HAI在AI绘画领域的无限潜力。而通过对界面进行汉化,我们不仅提高了使用的便捷性,也为创作者提供了更加亲切的操作体验,使整个创作过程更加流畅而愉悦。在这个充满创意的旅程中,我们将揭开AI绘画的神秘面纱,探寻其在艺术创作中的独特魅力。
1 使用HAI服务作画的步骤
1.1 注册腾讯云账户
首先,你需要在腾讯云上注册一个账户。在完成注册后,申请高性能应用服务HAI,通过审核后,你将能够使用其强大的算力服务。
1.2 创建算力服务器
在HAI服务中的算力管理中,新建一个算力服务器。选择AI模型中的stable diffusion模型服务。根据你的需求选择服务器的具体参数,如果不确定,可以先使用提供的默认配置。生成算力服务器的过程可能需要2-8分钟,耐心等待生成完成。
1.3 进入模型管理界面
生成服务器后,点击算力链接,选择Gradio WebUI,进入模型管理界面。
1.4 汉化界面
在模型管理界面中,依次选择extension,available,勾选script,ads,installed,取消勾选localization,然后点击load from。在插件列表中搜索zh_CN,找到以zh_CN开头的插件并安装。
接着,选择setting,点击Reload UI,重启服务。再次选择setting,找到User Interface选项,下拉选择语言 zh_CN,点击Apply settings保存设置,点击Reload UI重启服务。
此时,你将得到一个汉化后的界面,使操作更加直观和友好。
1.5 探索AI绘画
现在,你可以开始探索AI绘画的奇妙世界了。通过Gradio WebUI,你可以轻松上传图片、调整参数,并观察AI模型的绘画效果。尝试不同的输入,看看AI是如何理解和呈现你的创意的。
2 模型参数的含义和调整建议
在使用腾讯云的HAI服务进行AI绘画时,理解并调整模型的参数是关键的一步,可以通过合理设置参数来获得更满意的绘画效果。
2.1 模型参数的含义和示例
参数名称 | 描述 | 示例 |
---|---|---|
提示词(Prompt) | 主要描述图像的关键信息,包括内容、风格等。这些词将直接影响模型生成的图像。提示词可以包括多个关键词,以逗号分隔。 | a pretty cat, cyberpunk art, kerem beyit, very cute robot zen, Playful, Independent, beeple |
反向提示词(Negative Prompt) | 反向提示词是为了告诉模型我们不需要的风格或内容,以避免生成不符合期望的图像。 | (deformed, distorted, disfigured:1.0), poorly drawn, bad anatomy, wrong anatomy, extra limb, missing limb, floating limbs, (mutated hands and fingers:1.5), disconnected limbs, mutation, mutated, ugly, disgusting, blurry, amputation, flowers, human, man, woman |
提示词相关性(CFG Scale) | 分类器自由引导尺度,即图像与提示符的一致程度。值越低,生成的结果越有创意。 | 7 |
采样方法(Sampling Method) | 采样模式,影响扩散算法的去噪声采样模式。不同的采样模式会产生不同的效果。 | 默认选择 “Euler”,具体效果可以逐步尝试中。 |
采样迭代步数(Sampling Steps) | 在生成图片时进行的迭代步骤。更高的迭代步数会增加计算时间和成本,但不一定意味着更好的结果。 | 80(注意:不少于50,过少可能导致图像质量下降) |
随机种子(Seed) | 随机数种子,用于确定扩散的初始状态。不懂的话,可以使用随机的种子。 | 1791574510 |
2.2 模型参数的调整建议
-
提示词:
这是启发AI模型的关键信息。在提示词中,可以包含描述图像内容、风格等方面的关键词。通过精准的提示词,可以引导模型生成符合期望的图像。 -
反向提示词:
这些词用于告诉模型生成图像时避免的风格或内容。通过添加反向提示词,可以有效地控制生成图像的质量和风格,确保结果更符合预期。 -
提示词相关性:
这个参数用于调整图像生成时分类器的自由引导尺度。较低的值可以产生更有创意的结果,但也可能导致图像与提示词之间的一致性减弱。建议先尝试默认值,再根据创意需求逐步调整。 -
采样方法:
选择不同的采样模式可以影响扩散算法的去噪声采样模式,从而影响生成的图像效果。默认选择 “Euler”,但可以尝试其他模式以观察不同效果,找到最适合你需求的采样方法。 -
采样迭代步数:
这个参数决定在生成图像时进行的迭代步骤。更高的迭代步数允许模型更多次地比对提示词和当前结果,但也会增加计算时间和成本。建议先使用默认值,再根据所需的图像质量和计算资源逐步调整。 -
随机种子:
随机种子用于确定扩散的初始状态。如果不理解其作用,可以使用默认的随机值。如果希望生成一组相似的图像,可以尝试不同的种子值,这样可以探索到多样性的图像生成效果。
通过灵活地调整这些参数,你可以在绘画过程中找到平衡点,确保生成的图像符合你的预期和创意需求。尽管每个参数的影响可能有些微妙,但通过逐步尝试和观察,你将能够更好地理解如何优化这些参数以获得最佳结果。
3 调整参数作画的实践和效果
3.1 实践说明
不同参数下图片效果,为了方便比较,采用了相同的提示词和反向提示词,采样方法都使用了Euler。调整采样步数的时候,会出现报错,所以采样步数也统一使用了80。
提示词:
A serene and picturesque riverbank scene unfolds, capturing the essence of tranquility as it portrays a delightful moment—a little girl, with genuine joy, feeding a group of charming ducks by the water’s edge.
一幅宁静而如画的河岸场景展现在眼前,捕捉到了宁静的精髓,描绘了一个令人愉悦的瞬间:一个小女孩带着真挚的喜悦,在水边喂食一群迷人的鸭子。
反向提示词:
Deformed, distorted, disfigured: 1.0, poorly drawn, bad anatomy, wrong anatomy: 1.0, extra limb, missing limb, floating limbs: 1.0, mutated hands and fingers: 1.5, disconnected limbs: 1.0, mutation, mutated: 1.0, ugly, disgusting: 1.0, blurry: 1.0, amputation: 1.0, flowers: 1.0, human, man, woman: 1.0.
以下是不同的尺寸、提示词相关性、随机种子等对应生成的图片效果。
3.2 实践效果1
- 参数
参数名称 | 参数值 |
---|---|
宽度 | 512 |
高度 | 512 |
提示词相关性 | 7 |
随机种子 | -2 |
- 图画效果
3.3 实践效果2
- 参数
参数名称 | 参数值 |
---|---|
宽度 | 800 |
高度 | 450 |
提示词相关性 | 7 |
随机种子 | -2 |
- 图画效果
- 参数详情
A serene and picturesque riverbank scene unfolds, capturing the essence of tranquility as it portrays a delightful moment—a little girl, with genuine joy, feeding a group of charming ducks by the water’s edge.
Negative prompt: Deformed, distorted, disfigured: 1.0, poorly drawn, bad anatomy, wrong anatomy: 1.0, extra limb, missing limb, floating limbs: 1.0, mutated hands and fingers: 1.5, disconnected limbs: 1.0, mutation, mutated: 1.0, ugly, disgusting: 1.0, blurry: 1.0, amputation: 1.0, flowers: 1.0, human, man, woman: 1.0.
Steps: 80, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: -2, Size: 800x450, Model hash: 6ce0161689, Model: v1-5-pruned-emaonly, Version: v1.6.0-2-g4afaaf8a
用时:20.6 sec.
A: 2.75 GB, R: 4.07 GB, Sys: 5.1/14.5791 GB (35.3%)
3.4 实践效果3
- 参数
参数名称 | 参数值 |
---|---|
宽度 | 800 |
高度 | 450 |
提示词相关性 | 5 |
随机种子 | -2 |
- 图画效果
3.5 实践效果4
- 参数
参数名称 | 参数值 |
---|---|
宽度 | 800 |
高度 | 450 |
提示词相关性 | 14 |
随机种子 | -2 |
- 图画效果
3.6 实践效果5
- 参数
参数名称 | 参数值 |
---|---|
宽度 | 800 |
高度 | 450 |
提示词相关性 | 14 |
随机种子 | 123456 |
- 图画效果
4 实践的思考
在我们的实践中,我们使用了基础的HAI算力,这意味着在设置采样步数和图像尺寸等参数时,存在一定的限制,可能会面临内存溢出或其他错误的问题。为了克服这些限制,我们有两个主要的调整方向:
4.1 提升算力
通过升级到更高级别的算力,我们可以获得更大的计算资源,从而能够处理更大尺寸的图像或者使用更复杂、细致的模型。这不仅可以提高生成图像的分辨率,还可以尝试使用更先进的算法和模型,以获得更具创意和艺术性的结果。
4.2 参数调整与观察
在相同算力下,我们可以进一步调整模型的参数,以观察不同参数值对生成图像的影响。例如,可以尝试不同的采样步数、提示词相关性或者其他模型特定的参数。通过系统地调整这些参数,我们能够找到最适合我们需求的组合,使图像达到最佳效果。
在调整参数时,需要注意的是权衡计算资源的使用和生成图像的质量。过高的参数值可能导致内存溢出或计算时间过长,而过低的值可能会影响图像的清晰度和艺术性。因此,调整参数时要根据实际情况权衡各种因素,以达到最佳的生成效果。
通过这样的调整和优化过程,我们能够在不同的算力和参数设置下,探索到更广泛的创作空间,创造出更令人惊叹的AI绘画作品。
结语
在整个实践过程中,我们不仅仅是在使用技术,更是在与AI进行一场创意的对话。AI绘画不仅可以为艺术家提供灵感,也为普通用户提供了一个轻松而有趣的创作平台。
通过腾讯云的HAI服务,我们不仅能够体验到先进的算力计算,还能享受到用户友好的界面和强大的功能。对于初学者来说,这是一个非常好的平台,可以在不深入了解复杂技术的情况下,快速上手AI绘画。
利用腾讯云的HAI服务进行AI作画是一次愉快的体验。这种技术的普及不仅为艺术家提供了更多可能性,也为普通用户打开了艺术创作的大门。在未来,随着技术的不断发展,我们可以期待更多有趣、实用的AI艺术应用的涌现。愿我们能在这个数字化的创作世界中,发现更多的惊喜和创新。
参考文献
https://csdn-res-1253910586.cos.ap-nanjing.myqcloud.com/HAI-AIGC.html
相关文章:

【腾讯云 HAI域探秘】探索AI绘画之路:利用腾讯云HAI服务打造智能画家
目录 前言1 使用HAI服务作画的步骤1.1 注册腾讯云账户1.2 创建算力服务器1.3 进入模型管理界面1.4 汉化界面1.5 探索AI绘画 2 模型参数的含义和调整建议2.1 模型参数的含义和示例2.2 模型参数的调整建议 3 调整参数作画的实践和效果3.1 实践说明3.2 实践效果13.3 实践效果23.4 …...
安卓常见设计模式10------责任链模式(Kotlin版)
1. W1 是什么,什么是责任链模式? 责任链模式(Chain of Responsibility Pattern)是一种行为型设计模式,它用于将请求的发送者和接收者解耦,并将请求沿着一个处理链进行传递,直到有一个处理者能…...
利用 Google Artifact Repository 构建maven jar 存储仓库
参考了google 官方文档 https://cloud.google.com/artifact-registry/docs/java/store-java#gcloud_1 首先 enable GAR api gcloud services enable artifactregistry.googleapis.com gcloud services list | grep -i artifact artifactregistry.googleapis.com Artifac…...

Facebook广告被暂停是什么原因?Facebook广告账号被封怎么办?
许多做海外广告投放的小伙伴经常遇到一个难题,那就是投放的Facebook广告被拒或 Facebook 广告帐户被关闭赞停的经历,随之而来的更可能是广告账户被封,导致资金的损失。本文将从我自身经验,为大家分享,Facebook广告被暂…...

Javaweb之javascript的BOM对象的详细解析
1.5.2 BOM对象 接下来我们学习BOM对象,BOM的全称是Browser Object Model,翻译过来是浏览器对象模型。也就是JavaScript将浏览器的各个组成部分封装成了对象。我们要操作浏览器的部分功能,可以通过操作BOM对象的相关属性或者函数来完成。例如:…...

使用Nginx和Spring Gateway为SkyWalking的增加登录认证功能
文章目录 1、使用Nginx增加认证。2、使用Spring Gateway增加认证 SkyWalking的可视化后台是没有用户认证功能的,默认下所有知道地址的用户都能访问,官网是建议通过网关增加认证。 本文介绍通过Nginx和Spring Gateway两种方式 1、使用Nginx增加认证。 生…...
Android 12.0 增加多张图片作为系统静态壁纸的功能实现
1.前言 在12.0的系统rom定制化开发中,在做系统定制化开发中,在对系统的静态壁纸做定制的时候,需要增加几种静态壁纸可以让用户自己设置壁纸,所以可以在壁纸的系统应用中 添加几种静态壁纸图片,然后配置好 就可以在选择壁纸的时候,作为静态壁纸,接下来看如何具体实现这个…...

无线优化之RRM模板
一、简介 RRM即,Radio Resource Management,射频资源管理 WLAN技术是以射频信号(如2.4G/5G的无线电磁波)作为传输介质,无线电磁波在传输过程中因周围环境导致无线信号衰减,从而影响无线用户上网的服务质量。 RRM模板主要用于保持最优的频射资源状态,自动检查周围无线…...

BI 数据可视化平台建设(1)—交叉表组件演变实战
作者:vivo 互联网大数据团队 - Zhu Jianchen 本文是vivo互联网大数据团队《BI数据可视化平台建设》系列文章第1篇 - 交叉表组件。 交叉表在数据分析里应用广泛,通过本文,你将了解到: 交叉表的基本概念,以及BI可视化平…...

Python---练习:求幸运数字6
案例: 幸运数字6(只要是6的倍数):输入任意数字,如数字8,生成nums列表,元素值为1~8,从中选取幸运数字移动到新列表lucky,打印nums与lucky。 思考: 要求是6的…...

【云栖2023】王峰:开源大数据平台3.0技术解读
本文根据2023云栖大会演讲实录整理而成,演讲信息如下: 演讲人:王峰 | 阿里云研究员,阿里云计算平台事业部开源大数据平台负责人 演讲主题:开源大数据平台3.0技术解读 实时化与Serverless是开源大数据3.0时代的必然选…...
如何改变Wi-Fi的IP地址,提高网络连接稳定性和速度
Wi-Fi已经成为我们日常生活中必不可少的一部分。大多数家庭和办公室都依赖于Wi-Fi来连接网络和进行各种在线活动。然而,有时我们可能会遇到网络连接不稳定或速度较慢的问题。这可能是由于IP地址的设置不当所导致的。虎观代理小二二将向您介绍如何改变Wi-Fi的IP地址&…...

APP 备案公钥、签名 MD5、SHA-1、SHA-256获取方法。
公钥和 MD5 值可以通过安卓开发工具、Keytool、Jadx-GUI 等多种工具获取,最简单的就是以 appuploader为例。 1.下载 appuploader工具 ,点击此处 下载 appuploader 工具。 2.下载完成后,解压压缩包,双击 appuploder 运行。 3.运…...

屏幕提词软件Presentation Prompter mac中文版使用方法
Presentation Prompter for mac是一款屏幕提词器软件,它可以将您的Mac电脑快速变成提词器,支持编写或导入,可以在一个或多个屏幕上平滑地滚动,Presentation Prompter 下载是为适用于现场表演者,新闻广播员,…...
Rc与Arc实现1vN所有权机制
Rc与Arc实现1vN所有权机制 观察引用计数的变化一个例子多线程无力的Rc< T >Arc Rust所有权机制要求一个值只能有一个所有者,在大多数情况下,都没有问题,但是考虑以下情况: 在图数据结构中,多个边可能会拥有同一个…...

建造者模式 rust和java的实现
文章目录 建造者模式介绍优点缺点使用场景 实现javarust rust代码仓库 建造者模式 建造者模式(Builder Pattern)使用多个简单的对象一步一步构建成一个复杂的对象。 一个 Builder 类会一步一步构造最终的对象。该 Builder 类是独立于其他对象的。 介绍…...
书写Prompt的经验总结
首先最重要的一点是Prompt无法全部模型都通用,可能你的Prompt在ChatGPT中使用很好,迁移到ChatGLM就不行了。不知道未来是否会出现Prompt的跨平台。 首先书写Prompt要明确告诉模型要做什么,而不是告诉它不要做什么。还要保证精简,…...
WebSocket实时应用
在开发一些前端页面的时候,总是能接收到这样的需求:如何保持页面并实现自动更新数据呢?以往的常规做法,是前端使用定时轮询后端接口,获取响应后重新渲染前端页面,这种做法虽然能达到类似的效果,…...

从零开始搭建React+TypeScript+webpack开发环境-基于lerna的webpack项目工程化改造
项目背景 在实际项目中,我们的前端项目往往是一个大型的Webpack项目,结构较为复杂。项目根目录下包含了各种配置文件、源代码、以及静态资源,整体布局相对扁平。Webpack的配置文件分散在不同的部分,包括入口文件、输出目录、加载…...
网络监控系统和防火墙的区别有哪些?
现如今,市面上保护企业网络安全的设备有很多,其中使用最多的当属网络监控系统和防火墙。 网络监控系统就是通过网页内容的自动采集处理、敏感词过滤、智能聚类分类、主题检测、专题聚焦、统计分析等多个环节,实现相关网络舆情监督管理的需要…...

XML Group端口详解
在XML数据映射过程中,经常需要对数据进行分组聚合操作。例如,当处理包含多个物料明细的XML文件时,可能需要将相同物料号的明细归为一组,或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码,增加了开…...

XCTF-web-easyupload
试了试php,php7,pht,phtml等,都没有用 尝试.user.ini 抓包修改将.user.ini修改为jpg图片 在上传一个123.jpg 用蚁剑连接,得到flag...

智慧医疗能源事业线深度画像分析(上)
引言 医疗行业作为现代社会的关键基础设施,其能源消耗与环境影响正日益受到关注。随着全球"双碳"目标的推进和可持续发展理念的深入,智慧医疗能源事业线应运而生,致力于通过创新技术与管理方案,重构医疗领域的能源使用模式。这一事业线融合了能源管理、可持续发…...

docker详细操作--未完待续
docker介绍 docker官网: Docker:加速容器应用程序开发 harbor官网:Harbor - Harbor 中文 使用docker加速器: Docker镜像极速下载服务 - 毫秒镜像 是什么 Docker 是一种开源的容器化平台,用于将应用程序及其依赖项(如库、运行时环…...

css实现圆环展示百分比,根据值动态展示所占比例
代码如下 <view class""><view class"circle-chart"><view v-if"!!num" class"pie-item" :style"{background: conic-gradient(var(--one-color) 0%,#E9E6F1 ${num}%),}"></view><view v-else …...

盘古信息PCB行业解决方案:以全域场景重构,激活智造新未来
一、破局:PCB行业的时代之问 在数字经济蓬勃发展的浪潮中,PCB(印制电路板)作为 “电子产品之母”,其重要性愈发凸显。随着 5G、人工智能等新兴技术的加速渗透,PCB行业面临着前所未有的挑战与机遇。产品迭代…...

2025年能源电力系统与流体力学国际会议 (EPSFD 2025)
2025年能源电力系统与流体力学国际会议(EPSFD 2025)将于本年度在美丽的杭州盛大召开。作为全球能源、电力系统以及流体力学领域的顶级盛会,EPSFD 2025旨在为来自世界各地的科学家、工程师和研究人员提供一个展示最新研究成果、分享实践经验及…...
鸿蒙中用HarmonyOS SDK应用服务 HarmonyOS5开发一个医院挂号小程序
一、开发准备 环境搭建: 安装DevEco Studio 3.0或更高版本配置HarmonyOS SDK申请开发者账号 项目创建: File > New > Create Project > Application (选择"Empty Ability") 二、核心功能实现 1. 医院科室展示 /…...

现代密码学 | 椭圆曲线密码学—附py代码
Elliptic Curve Cryptography 椭圆曲线密码学(ECC)是一种基于有限域上椭圆曲线数学特性的公钥加密技术。其核心原理涉及椭圆曲线的代数性质、离散对数问题以及有限域上的运算。 椭圆曲线密码学是多种数字签名算法的基础,例如椭圆曲线数字签…...

使用 Streamlit 构建支持主流大模型与 Ollama 的轻量级统一平台
🎯 使用 Streamlit 构建支持主流大模型与 Ollama 的轻量级统一平台 📌 项目背景 随着大语言模型(LLM)的广泛应用,开发者常面临多个挑战: 各大模型(OpenAI、Claude、Gemini、Ollama)接口风格不统一;缺乏一个统一平台进行模型调用与测试;本地模型 Ollama 的集成与前…...