全球AI模型百科全书,亚马逊云科技Bedrock上的100多款AI模型
今天小李哥给大家介绍的是亚马逊云科技上的AI模型管理平台Amazon Bedrock上的Marketplace,这是亚马逊云科技在今年re:Invent发布的一个全新功能,将亚马逊的电商基因带到了其云计算平台,让我们能够通过Amazon Bedrock访问100多种流行、新兴和专业的AI基础模型,可以说是AI模型的“百科全书”。我们现在可以在Amazon Bedrock中使用、测试和部署来自不同模型供应商(如IBM和Nvidia)的新模型,专业领域模型(如Upstages提供的适用于韩语处理的Solar Pro)以及Evolutionary Scale提供的ESM3蛋白质研究模型。大家在使用这些适用于不同场景的多样化AI模型的同时,不要忘了我们还可以访问Amazon Bedrock上的明星通用基础模型,例如Amazon、Anthropic和Meta提供的大语言模型。
通过Amazon Bedrock Marketplace部署的模型全面采用无服务器架构,可以通过Amazon Bedrock提供的标准API进行访问。Marketplace中可以兼容Converse API的模型,还可以将其与Amazon Bedrock上的其他功能,如Agents、知识库等工具一起集成使用。下图就是Marketplace上的多种模型类型截图。
Amazon Bedrock Marketplace的优势与特色?
随着生成式AI对开发者的项目以及企业业务带来革命性的变革,专门优化特定领域、语言或业务场景的模型需求正在飞速增长。然而精准找到和评估这些模型可能既复杂又昂贵,我们通常需要在不同的网站、模型供应商官网中发现这些模型,在抽象层中构建统一接口以在应用程序中统一集成它们,并创建复杂的安全和合规治理方案。
Amazon Bedrock Marketplace通过提供一个统一的集中平台,同时访问专业场景模型和通用大厂商模型,帮助开发者和企业解决这些应用开发挑战。
如何使用Amazon Bedrock Marketplace?
1. 登录亚马逊云科技Amazon Bedrock控制台中,导航到Foundation models页面,选择Model catalog。进入到Model Catalog后大家就可以根据特定的使用场景或希望交互的语言选择想要的模型,搜索选项包括无服务器Serverless模型(无需维护基础设施的模型)和Amazon Bedrock Marketplace上的模型。我们可以按模型厂商、模型的数据处理模态(例如文本、图像、向量化或音频)或任务类型(如分类或文本总结)进行筛选。

2. 比如我们想选择IBM Granite模型,首先我们可以搜索来自IBM Data and AI厂商的模型,并选择 模型版本 - Granite 3.0 2B Instruct,该模型主要用于集成企业用户的AI应用。选择该模型后,我们会进入到模型详情页面,可以查看模型供应商IBM为模型提供的官方介绍、定价和使用说明,包括示例API调用代码段。

3. Marketplace中的某些模型需要订阅才能使用。我们点击进入订阅页面可以查看模型定价和法律说明,在定价详情中包括了由供应商设定的模型使用价格。对于该模型,除了托管该模型的Amazon SageMaker基础设施成本之外没有模型额外的订阅成本,大家可以Amazon SageMaker定价页面上查看基础设施成本。我们点击 “订阅”(Subscribe)就可以开始使用该模型。

4. 在订阅完成后(通常需要几分钟),我们就可以可以开始部署模型到我们的账户内的SageMaker中。我们会跳转到部署的详情页面中,在本案例里我们使用默认设置和官方推荐的实例类型。

5. 打开高级设置(Advanced Settings)选项,我们可以选择在本账户的网络环境VPC中部署该模型,并添加用于访问S3存储桶和SNS短信通知服务的的IAM权限。如果我们没有选定现有的IAM权限,Amazon Bedrock Marketplace默认会为我们创建一个IAM权限角色。其他选择默认值后,点击Deploy进行部署。

6. 部署完成后,我们Marketplace模型部署页面中的模型状态将显示为“In Service”运行中,大家可以在部署页面中查看并编辑模型配置,可以执行的操作包括调整计算实例数量等。为了测试我们刚才的部署,我在模型交互对话框中打开模型,并输入提示词让模型生成一首诗歌。
在 Amazon Bedrock 中使用已部署的模型
7. 在模型交互对话框的页面中,我们可以在Marketplace类别下的Model Endpoints中,加载访问已部署的模型端点。我们还可以在Amazon Bedrock Agents、Amazon Bedrock 知识库、Amazon Bedrock提示词管理功能、Amazon Bedrock安全防护栏(Guardrails)等多种Bedrock AI功能中集成我们从Marketplace中部署的模型端点。

8. 比如小李哥从Marketplace中部署了一个用于图像生成的Stability AI Stable Diffusion 3.5 Large模型后,就可以在Amazon Bedrock模型交互图像生成页面中快速测试其图像生成能力。

如何通过AWS CLI和AWS SDK调用已部署的模型
对于已部署的模型,我们可直接通过亚马逊云科技,支持多种开发语言的SDK提供的Amazon Bedrock InvokeModel API进行访问。我们还可以使用亚马逊云科技命令行界面(AWS CLI),将模型端点的ARN资源名称作为我们要调用的模型ID,就可以调用模型生成回复了。对于应用于聊天场景的文生文模型,我们还可以使用Amazon Bedrock提供的统一标准API - Converse API进行内容生成,该API对模型差异进行了抽象处理,消除了模型的差异化,通过简单的参数改变就可以自由进行模型切换。
其他注意事项
Amazon Bedrock Marketplace目前在以下亚马逊区域可用:美国东部(弗吉尼亚北部、俄亥俄)美国西部(俄勒冈)、亚太地区(孟买、首尔、新加坡、悉尼、东京)、加拿大(中部)、欧洲(法兰克福、爱尔兰、伦敦、巴黎)、南美(圣保罗)。
另外在Amazon Bedrock Marketplace中,我们调用模型的收费,是向第三方模型提供商支付的,类型为软件订阅费用(某些模型订阅是免费的),总的费用还包括我们选择的计算实例类型和数量所产生的模型托管费用。
相关文章:
全球AI模型百科全书,亚马逊云科技Bedrock上的100多款AI模型
今天小李哥给大家介绍的是亚马逊云科技上的AI模型管理平台Amazon Bedrock上的Marketplace,这是亚马逊云科技在今年re:Invent发布的一个全新功能,将亚马逊的电商基因带到了其云计算平台,让我们能够通过Amazon Bedrock访问100多种流行、新兴和专…...
微信小程序中常见的 跳转方式 及其特点的表格总结(wx.navigateTo 适合需要返回上一页的场景)
文章目录 详细说明总结wx.navigateTo 的特点为什么 wx.navigateTo 最常用?其他跳转方式的使用频率总结 以下是微信小程序中常见的跳转方式及其特点的表格总结: 跳转方式API 方法特点适用场景wx.navigateTowx.navigateTo({ url: 路径 })保留当前页面&…...
【Elasticsearch】index:false
在 Elasticsearch 中,index 参数用于控制是否对某个字段建立索引。当设置 index: false 时,意味着该字段不会被编入倒排索引中,因此不能直接用于搜索查询。然而,这并不意味着该字段完全不可访问或没有其他用途。以下是关于 index:…...
新版IDEA创建数据库表
这是老版本的IDEA创建数据库表,下面可以自己勾选Not null(非空),Auto inc(自增长),Unique(唯一标识)和Primary key(主键) 这是新版的IDEA创建数据库表,Not null和Auto inc可以看得到,但Unique和Primary key…...
输入带空格的字符串,求单词个数
输入带空格的字符串,求单词个数 __ueooe_eui_sjje__ ---->3syue__jdjd____die_ ---->3shuue__dju__kk ---->3 #include <stdio.h> #include <string.h>// 自定义函数来判断字符是否为空白字符 int isSpace(char c) {return c || c \t || …...
C语言程序设计十大排序—希尔排序
文章目录 1.概念✅2.希尔排序🎈3.代码实现✅3.1 直接写✨3.2 函数✨ 4.总结✅ 1.概念✅ 排序是数据处理的基本操作之一,每次算法竞赛都很多题目用到排序。排序算法是计算机科学中基础且常用的算法,排序后的数据更易于处理和查找。在计算机发展…...
Excel制作合同到期自动提醒!
大家好,我是小鱼。 今天分享一下如何利用Excel制作合同到期提醒表,实现Excel表格自动计算合同到期日和天数,根据合同状态和到期天数自动填充颜色提醒,超实用。先看一下效果,已经到期的合同会自动被填充为红色…...
“AI质量评估系统:智能守护,让品质无忧
嘿,各位小伙伴们!今天咱们来聊聊一个在现代社会中越来越重要的角色——AI质量评估系统。你知道吗?在这个快速发展的时代,产品质量已经成为企业生存和发展的关键。而AI质量评估系统,就像是我们的智能守护神,…...
爬虫基础之爬取某基金网站+数据分析
声明: 本案例仅供学习参考使用,任何不法的活动均与本作者无关 网站:天天基金网(1234567.com.cn) --首批独立基金销售机构-- 东方财富网旗下基金平台! 本案例所需要的模块: 1.requests 2.re(内置) 3.pandas 4.pyecharts 其他均需要 pip install 模块名 爬取步骤: …...
使用 Aryn DocPrep、DocParse 和 Elasticsearch 向量数据库实现高质量 RAG
作者:来自 Elastic Hemant Malik 及 Jonathan Fritz 组织依靠自然语言查询从非结构化数据中获取见解,但要获得高质量的答案,首先要进行有效的数据准备。Aryn DocParse 和 DocPrep通过将复杂文档转换为结构化 JSON 或 markdown 来简化此过程&a…...
Couchbase UI: Server
在 Couchbase UI 中的 Server(服务器)标签页主要用于管理和监控集群中的各个节点。以下是 Server 标签页的主要内容和功能介绍: 1. 节点列表 显示集群中所有节点的列表,每个节点的详细信息包括: 节点地址࿱…...
Web3.0时代的挑战与机遇:以开源2+1链动模式AI智能名片S2B2C商城小程序为例的深度探讨
摘要:Web3.0作为互联网的下一代形态,承载着去中心化、开放性和安全性的重要愿景。然而,其高门槛、用户体验差等问题阻碍了Web3.0的主流化进程。本文旨在深入探讨Web3.0面临的挑战,并提出利用开源21链动模式、AI智能名片及S2B2C商城…...
langchain基础(一)
模型又可分为语言模型(擅长文本补全,输入和输出都是字符串)和聊天模型(擅长对话,输入时消息列表,输出是一个消息)两大类。 以调用openai的聊天模型为例,先安装langchain_openai库 1…...
【Android】布局文件layout.xml文件使用控件属性android:layout_weight使布局较为美观,以RadioButton为例
目录 说明举例 说明 简单来说,android:layout_weight为当前控件按比例分配剩余空间。且单个控件该属性的具体数值不重要,而是多个控件的属性值之比发挥作用,例如有2个控件,各自的android:layout_weight的值设为0.5和0.5࿰…...
RabbitMQ 架构分析
文章目录 前言一、RabbitMQ架构分析1、Broker2、Vhost3、Producer4、Messages5、Connections6、Channel7、Exchange7、Queue8、Consumer 二、消息路由机制1、Direct Exchange2、Topic Exchange3、Fanout Exchange4、Headers Exchange5、notice5.1、备用交换机(Alter…...
Qt Enter和HoverEnter事件
介绍 做PC开发的过程中或多或少都会接触到鼠标的悬停事件,Qt中处理鼠标悬停有Enter和HoverEnter两种事件 相同点 QEvent::Enter对应QEnterEvent,描述的是鼠标进入控件坐标范围之内的行为,QEnterEvent可以抓取鼠标的位置;QEvent…...
大语言模型之prompt工程
前言 随着人工智能的快速发展,我们正慢慢进入AIGC的新时代,其中对自然语言的处理成为了智能化的关键一环,在这个大背景下,“Prompt工程”由此产生,并且正逐渐成为有力的工具... LLM (Large Language Mode…...
WPF基础 | WPF 常用控件实战:Button、TextBox 等的基础应用
WPF基础 | WPF 常用控件实战:Button、TextBox 等的基础应用 一、前言二、Button 控件基础2.1 Button 的基本定义与显示2.2 按钮样式设置2.3 按钮大小与布局 三、Button 的交互功能3.1 点击事件处理3.2 鼠标悬停与离开效果3.3 按钮禁用与启用 四、TextBox 控件基础4.…...
[笔记] 极狐GitLab实例 : 手动备份步骤总结
官方备份文档 : 备份和恢复极狐GitLab 一. 要求 为了能够进行备份和恢复,请确保您系统已安装 Rsync。 如果您安装了极狐GitLab: 如果您使用 Omnibus 软件包,则无需额外操作。如果您使用源代码安装,您需要确定是否安装了 rsync。…...
随笔十七、eth0单网卡绑定双ip的问题
在调试语音对讲过程中遇到过一个“奇怪”问题:泰山派作为一端,可以收到对方发来的语音,而对方不能收到泰山派发出的语音。 用wireshark抓包UDP发现,泰山派发送的地址是192.168.1.30,而给泰山派实际设置的静态地址是19…...
Unity3D中Gfx.WaitForPresent优化方案
前言 在Unity中,Gfx.WaitForPresent占用CPU过高通常表示主线程在等待GPU完成渲染(即CPU被阻塞),这表明存在GPU瓶颈或垂直同步/帧率设置问题。以下是系统的优化方案: 对惹,这里有一个游戏开发交流小组&…...
MongoDB学习和应用(高效的非关系型数据库)
一丶 MongoDB简介 对于社交类软件的功能,我们需要对它的功能特点进行分析: 数据量会随着用户数增大而增大读多写少价值较低非好友看不到其动态信息地理位置的查询… 针对以上特点进行分析各大存储工具: mysql:关系型数据库&am…...
线程与协程
1. 线程与协程 1.1. “函数调用级别”的切换、上下文切换 1. 函数调用级别的切换 “函数调用级别的切换”是指:像函数调用/返回一样轻量地完成任务切换。 举例说明: 当你在程序中写一个函数调用: funcA() 然后 funcA 执行完后返回&…...
基于Uniapp开发HarmonyOS 5.0旅游应用技术实践
一、技术选型背景 1.跨平台优势 Uniapp采用Vue.js框架,支持"一次开发,多端部署",可同步生成HarmonyOS、iOS、Android等多平台应用。 2.鸿蒙特性融合 HarmonyOS 5.0的分布式能力与原子化服务,为旅游应用带来…...
论文浅尝 | 基于判别指令微调生成式大语言模型的知识图谱补全方法(ISWC2024)
笔记整理:刘治强,浙江大学硕士生,研究方向为知识图谱表示学习,大语言模型 论文链接:http://arxiv.org/abs/2407.16127 发表会议:ISWC 2024 1. 动机 传统的知识图谱补全(KGC)模型通过…...
Java 加密常用的各种算法及其选择
在数字化时代,数据安全至关重要,Java 作为广泛应用的编程语言,提供了丰富的加密算法来保障数据的保密性、完整性和真实性。了解这些常用加密算法及其适用场景,有助于开发者在不同的业务需求中做出正确的选择。 一、对称加密算法…...
C++.OpenGL (10/64)基础光照(Basic Lighting)
基础光照(Basic Lighting) 冯氏光照模型(Phong Lighting Model) #mermaid-svg-GLdskXwWINxNGHso {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-GLdskXwWINxNGHso .error-icon{fill:#552222;}#mermaid-svg-GLd…...
什么是Ansible Jinja2
理解 Ansible Jinja2 模板 Ansible 是一款功能强大的开源自动化工具,可让您无缝地管理和配置系统。Ansible 的一大亮点是它使用 Jinja2 模板,允许您根据变量数据动态生成文件、配置设置和脚本。本文将向您介绍 Ansible 中的 Jinja2 模板,并通…...
IP如何挑?2025年海外专线IP如何购买?
你花了时间和预算买了IP,结果IP质量不佳,项目效率低下不说,还可能带来莫名的网络问题,是不是太闹心了?尤其是在面对海外专线IP时,到底怎么才能买到适合自己的呢?所以,挑IP绝对是个技…...
【电力电子】基于STM32F103C8T6单片机双极性SPWM逆变(硬件篇)
本项目是基于 STM32F103C8T6 微控制器的 SPWM(正弦脉宽调制)电源模块,能够生成可调频率和幅值的正弦波交流电源输出。该项目适用于逆变器、UPS电源、变频器等应用场景。 供电电源 输入电压采集 上图为本设计的电源电路,图中 D1 为二极管, 其目的是防止正负极电源反接, …...


