政安晨的AI笔记——Bard大模型最新提示词创作绘画分析
AI大模型进入商业应用元年后的第一年,顶级模型大混战终于开始了。
Bard在追赶OpenAI的过程中,还是补上了画图的短板。
(相比于视频的5阶张量处理而言,图画做为4阶张量处理虽然不新鲜,但却是跨不过去的基础条件)
大模型的混战开始

Bard新增图像生成功能,只需要给Bard一段文字描述,例如:创造一张猫在冲浪板冲浪的图片,“Create an image of a cat riding on a surfboard”,Bard就能生成出客制化且种类多元的图片,这项新功能是采用升级版的Imagen 2模型来实现。
(上面的截图咱们存下来留作纪念,毕竟Bard不会一直都是实验版本)

当然,如果选择生成更多的话,可以这样(可以看到,它给出了不同风格的创作):

虽然目前生成的提示词仅支持英文,但此服务现为免费,无需额外付费。
Bard将使用SynthID工具,在生成的图像中嵌入数位可识别的浮水印来协助区别,并对涉及不良内容做出限制。
此次更新还包括Bard 将扩大运行Gemini Pro模型,支援超过40种语言与230个国家/地区,涵盖繁体中文。此外,回复查核功能也扩展超过40种语言。
使用复杂一点的提示词
咱们创作如下提示词:
生成一幅关于美人鱼传说的艺术作品,使用极其逼真的海洋和植物图像,色调柔和并加入3D阴影效果,属于混合风格的艺术,美人鱼所在的海洋远处有中世纪古老的海盗船,近处有一座若隐若现的瑰丽小岛。
因为当前Bard仅支持英文,所以咱们将创作提示词从中文翻译成英文:
Create an artwork about the legend of mermaids, using highly realistic images of the ocean and plants, with soft tones and added 3D shadow effects. It belongs to a mixed style of art. In the distant ocean where the mermaid resides, there are ancient medieval pirate ships, and nearby, there is a faint and magnificent hidden island.

效果确实不同凡响,咱们放大看看。

不过面部处理还稍微有些不够细致,但整体感觉已经很不错了。
我点击更多,又生成了一张,这次面部处理稍好一些。


同样提示词的随机化差异比较
我从网上找了某位大神的提示词及生成的图片,
第一组提示词随机度比较实验(艺术):
Generate a collage art, with photorealistic images of oceans and plants with muted colors and 3D shading, that’s mixed media.
翻译为:
生成一个拼贴艺术作品,使用逼真的海洋和植物图像,采用柔和的色彩和立体阴影,并且是混合媒体。
大神生成的:

我生成的:

我用同样的提示词继续创作:

挑出其中一张,确实可以做壁画:

这组生成图画从艺术感、3D、风格这几个方面看,都确实有不错的表现。
第二组提示词随机度比较实验(商业):
Generate an image of a futuristic car driving through an old mountain road surrounded by nature.
翻译为:
生成一张未来式汽车驶过被大自然环绕的古老山路的图片。
大神生成的:

我生成的:

挑选左上第一张打开:

我是真心觉得不错!
这组生成图从写实、环境融合、角度等多个方面,其实都已经触及到了商业化的门槛。
第三组提示词实验(社媒生活-图文同创):
Write a social media post and generate a mouthwatering image that I can use for a buffalo wing festival.
翻译为:
写一个社交媒体的帖子,并生成一张让人垂涎欲滴的照片,我可以用于水牛翅膀节活动。
我的生成如下(Bard现在只支持英文):

它真的帮我写出了一篇像模像样的社媒帖子。
写在最后
超级大模型的博弈虽然才刚刚开始,但人工智能领域的迭代不可能是线性的,人类智能与机器智能孪生的时代正在朝我们走来。
相关文章:
政安晨的AI笔记——Bard大模型最新提示词创作绘画分析
AI大模型进入商业应用元年后的第一年,顶级模型大混战终于开始了。 Bard在追赶OpenAI的过程中,还是补上了画图的短板。 (相比于视频的5阶张量处理而言,图画做为4阶张量处理虽然不新鲜,但却是跨不过去的基础条件&#…...
基础算法bfs -剪枝问题
问题描述:一个迷宫有 NXM 格,有一些格子是地板,能走;有一些格子是障碍,不能走。给一个起点S和一个终点D。一只小狗从 S出发,每步走一块地板,在每块地员不能停留,而且走过的地板都不能再走。给定一个 T,问小狗能正好走 T步到达D吗?输入:有很多测试样例。…...
在Meteor Lake上测试基于Stable Diffusion的AI应用
上个月刚刚推出的英特尔新一代Meteor Lake CPU,预示着AI PC的新时代到来。AI PC可以不依赖服务器直接在PC端处理AI推理工作负载,例如生成图像或转录音频。这些芯片的正式名称为Intel Core Ultra处理器,是首款配备专门用于处理人工智能任务的 …...
情人节心动礼物:共度情人节美好时刻的礼物推荐
情人节,这个充满浪漫与爱意的特殊日子,总是让人心跳加速,期待着与爱人共享甜蜜时光。在这一天,送出一份精心挑选的礼物,不仅能够表达你对另一半无尽的爱意,更能让这份爱升华,成为你们爱情故事中…...
远程手机搭建Termux环境,并通过ssh连接Termux
背景 Termux只能通过鼠标点击,无法使用电脑键盘,输入速度很慢,你想通过ssh 连接Termux,获得友好体验搞了个云手机,想像普通手机那样充当服务器想把自己的手机公开到局域网中供同事调试想把自己的模拟器公开到局域网中…...
基于EdgeWorkers的边缘应用如何进行单元测试?
随着各行各业数字化转型的持续深入,越来越多企业开始选择将一些应用程序放在距离最终用户更近的边缘位置来运行,借此降低延迟,提高应用程序响应速度,打造更出色的用户体验。 相比传统集中部署和运行的方式,这种边缘应…...
【linux】校招中的“熟悉linux操作系统”一般是指达到什么程度?
这样,你先在网上找一套完整openssh升级方案(不是yum或apt的,要源码安装的),然后在虚拟机上反复安装测试,直到把他理解了、背下来。 面试的时候让你简单说说linux命令什么的,你就直接把这个方案…...
【CSS系列】常用容易忽略的css
user-select user-select 是一个 CSS 属性,用于控制用户是否可以选择文本。通过设置 user-select 的值,可以决定用户是否可以选择元素中的文本,以及如何选择文本。 auto:默认值。浏览器可以选择文本。none:用户不能选…...
Java 数据结构 二叉树(二)红黑树
目录 数据结构图-树 简介 规则 旋转 重新着色 红黑树构建过程 前言-与正文无关 生活远不止眼前的苦劳与奔波,它还充满了无数值得我们去体验和珍惜的美好事物。在这个快节奏的世界中,我们往往容易陷入工作的漩涡,忘记了停下脚步…...
React18-完成弹窗封装
弹框封装 用法 // 创建 userRef.current?.open(create) // 修改 userRef.current?.open(edit,values){/* 创建用户 */} <CreateUser mRef{userRef} update{} />组件暴露open方法 文档地址:https://react.dev/reference/react/useImperativeHandle useIm…...
蓝桥杯2024/1/31-----底层测试模板
和之前一样建好工程文件夹,里边包含User(放工程文件,mian.c)、Driver(存放底层文件如Led.c,Led.h等) 新建的工程先搭建框架,可以先书写底层函数(此次书写了四个函数并包含…...
蓝桥杯备战(AcWing算法基础课)-高精度-乘-低精度
目录 前言 1 题目描述 2 分析 2.1 关键代码 2.2 关键代码分析 3 代码 前言 详细的代码里面有自己的理解注释 1 题目描述 给定两个非负整数(不含前导 00) A 和 B,请你计算 AB 的值。 输入格式 共两行,第一行包含整数 A&a…...
C++设计模式-里氏替换原则
里氏替换原则定义了继承规范。(封装、继承、多态) 定义1:类型S对象o1,类型T对象o2,o1换成o2时程序意图不变,那么S是T的子类。 定义2:使用子类不破坏父类的意图。 注意:如果子类不…...
compose LazyColumn + items没有自动刷新问题
val dataLists by remember { mutableStateOf(datas) } 数据更改后列表不刷新问题。 val dataLists by remember { mutableStateOf(datas) } LazyColumn(modifier Modifier.padding(top 5.dp)) {items(dataLists) {....}} 可以将mutableStateOf 改为mutableStateListOf解决…...
Java八大常用排序算法
1冒泡排序 对于冒泡排序相信我们都比较熟悉了,其核心思想就是相邻元素两两比较,把较大的元素放到后面,在一轮比较完成之后,最大的元素就位于最后一个位置了,就好像是气泡,慢慢的浮出了水面一样 Jave 实现 …...
编程笔记 html5cssjs 075 Javascript 常量和变量
编程笔记 html5&css&js 075 Javascript 常量和变量 一、JavaScript 变量二、JavaScript 常量三、示例:小结: 在JavaScript中,变量和常量是用来存储数据的占位符。它们的主要区别在于可变性:变量的值可以改变,而…...
题目 1159: 偶数求和
题目描述: 有一个长度为n(n<100)的数列,该数列定义为从2开始的递增有序偶数(公差为2的等差数列),现在要求你按照顺序每m个数求出一个平均值,如果最后不足m个,则以实际数量求平均值。编程输出该平均值序…...
呼吸灯--FPGA
目录 1.breath_led.v 2.tb_breath_led.v 呼吸灯就是从完全熄灭到完全点亮,再从完全点亮到完全熄灭。具体就是通过控制PWM的占空比控制亮灭程度。 绘制PWM波的步骤就是,首先灯是在第一个时钟周期保持高电平熄灭状态,在第二个时钟周期保持1/1…...
MySQL数据库①_MySQL入门(概念+使用)
目录 1. 数据库的概念 1.1 数据库的存储介质 1.2 主流数据库 2. MySQL的基本使用 2.1 链接数据库 2.2 服务器管理 2.3 数据库,服务器和表关系 2.4 简单MySQL语句 3. MySQL架构 4. SQL分类 5. 存储引擎 本篇完。 1. 数据库的概念 数据库是按照数据结构来…...
虚幻UE 特效-Niagara特效实战-魔法阵
回顾Niagara特效基础知识:虚幻UE 特效-Niagara特效初识 其他四篇实战:UE 特效-Niagara特效实战-烟雾、喷泉、 虚幻UE 特效-Niagara特效实战-火焰、烛火、 虚幻UE 特效-Niagara特效实战-雨天、 虚幻UE 特效-Niagara特效实战-眩晕。 本篇笔记记录了使用空模…...
Windows用户福音:不用Mac也能搞定uniapp的iOS证书和Profile文件(附详细截图)
Windows平台下高效生成uniapp iOS证书与Profile文件的完整指南 对于许多使用uniapp进行跨平台开发的Windows用户而言,iOS证书和Profile文件的生成一直是个令人头疼的问题。传统方法要求开发者必须拥有Mac设备,这无疑增加了开发门槛和成本。但事实上&…...
Nomic-Embed-Text-V2-MoE向量模型部署教程:Python环境配置与快速上手
Nomic-Embed-Text-V2-MoE向量模型部署教程:Python环境配置与快速上手 你是不是也遇到过这样的问题:想用最新的向量模型来处理文本,但一看到复杂的部署步骤和满屏的依赖报错就头疼?特别是像Nomic-Embed-Text-V2-MoE这种混合专家模…...
GLM-OCR系统资源优化:C盘清理与显存高效利用技巧
GLM-OCR系统资源优化:C盘清理与显存高效利用技巧 你是不是也遇到过这种情况:兴致勃勃地部署好GLM-OCR,准备大展身手,结果没跑几天,系统就弹窗提示“C盘空间不足”,或者程序运行越来越慢,甚至直…...
OpenClaw配置备份指南:gemma-3-12b-it模型迁移与快速恢复
OpenClaw配置备份指南:gemma-3-12b-it模型迁移与快速恢复 1. 为什么需要备份OpenClaw配置? 上周我的主力开发机突然硬盘故障,导致精心调校的OpenClaw配置全部丢失。整整两天时间,我都在重新配置模型参数、飞书通道和自定义技能—…...
拓世AI决策系统白皮书
拓世AI决策系统白皮书——基于六元结构的双环自适应决策架构版权与所有权声明本技术系统所有知识产权归拓世网络技术开发室(Tuoshi Network Technology Development Studio)独家所有。本系统由拓世网络技术开发室唯一技术开发者独立完成,未接…...
OpenClaw多通道管理:千问3.5-9B同时服务飞书与钉钉
OpenClaw多通道管理:千问3.5-9B同时服务飞书与钉钉 1. 为什么需要多通道管理? 上周三凌晨两点,我被手机连续震动吵醒——团队同时用飞书和钉钉给我发了紧急需求。半梦半醒间突然想到:既然OpenClaw能自动化处理消息,为…...
BGP选路实战:从理论到实验的十三条法则
1. BGP选路原则概述:网络工程师的导航系统 如果把互联网比作一个超级城市,BGP就是这座城市的路由导航系统。作为网络工程师,我们每天都要处理成千上万条路由信息,而BGP的十三条选路原则就是帮助我们做出最优路径选择的黄金法则。这…...
连登IEEE/Elsevier一区TOP刊!PINN+强化学习新突破!
**研究方法:**论文提出基于PINNs与强化学习融合的自适应优化控制方法,通过PINNs整合物理定律与在线数据建模系统动力学,借助自动微分特性辅助自适应动态规划迭代逼近连续时间哈密顿-雅可比-贝尔曼方程解,结合Actor-Critic框架优化…...
字节跳动开源Coze后,个人开发者如何快速上手?保姆级教程来了
字节跳动开源Coze实战指南:从零构建AI智能体的完整路径 当字节跳动宣布将Coze平台全面开源时,整个开发者社区为之振奋。这个被称作"AI智能体全栈工厂"的平台,如今终于揭开了神秘面纱,让个人开发者能够深入探索其技术内核…...
**发散创新:基于Python的本体推理与知识表示实战解析**在人工智能和语义网技术飞速发展的今天,**知识表
发散创新:基于Python的本体推理与知识表示实战解析 在人工智能和语义网技术飞速发展的今天,知识表示(Knowledge Representation) 已成为构建智能系统的底层核心能力之一。它不仅决定了系统对现实世界的理解深度,还直接…...
