全球AI模型百科全书,亚马逊云科技Bedrock上的100多款AI模型
今天小李哥给大家介绍的是亚马逊云科技上的AI模型管理平台Amazon Bedrock上的Marketplace,这是亚马逊云科技在今年re:Invent发布的一个全新功能,将亚马逊的电商基因带到了其云计算平台,让我们能够通过Amazon Bedrock访问100多种流行、新兴和专业的AI基础模型,可以说是AI模型的“百科全书”。我们现在可以在Amazon Bedrock中使用、测试和部署来自不同模型供应商(如IBM和Nvidia)的新模型,专业领域模型(如Upstages提供的适用于韩语处理的Solar Pro)以及Evolutionary Scale提供的ESM3蛋白质研究模型。大家在使用这些适用于不同场景的多样化AI模型的同时,不要忘了我们还可以访问Amazon Bedrock上的明星通用基础模型,例如Amazon、Anthropic和Meta提供的大语言模型。
通过Amazon Bedrock Marketplace部署的模型全面采用无服务器架构,可以通过Amazon Bedrock提供的标准API进行访问。Marketplace中可以兼容Converse API的模型,还可以将其与Amazon Bedrock上的其他功能,如Agents、知识库等工具一起集成使用。下图就是Marketplace上的多种模型类型截图。
Amazon Bedrock Marketplace的优势与特色?
随着生成式AI对开发者的项目以及企业业务带来革命性的变革,专门优化特定领域、语言或业务场景的模型需求正在飞速增长。然而精准找到和评估这些模型可能既复杂又昂贵,我们通常需要在不同的网站、模型供应商官网中发现这些模型,在抽象层中构建统一接口以在应用程序中统一集成它们,并创建复杂的安全和合规治理方案。
Amazon Bedrock Marketplace通过提供一个统一的集中平台,同时访问专业场景模型和通用大厂商模型,帮助开发者和企业解决这些应用开发挑战。
如何使用Amazon Bedrock Marketplace?
1. 登录亚马逊云科技Amazon Bedrock控制台中,导航到Foundation models页面,选择Model catalog。进入到Model Catalog后大家就可以根据特定的使用场景或希望交互的语言选择想要的模型,搜索选项包括无服务器Serverless模型(无需维护基础设施的模型)和Amazon Bedrock Marketplace上的模型。我们可以按模型厂商、模型的数据处理模态(例如文本、图像、向量化或音频)或任务类型(如分类或文本总结)进行筛选。

2. 比如我们想选择IBM Granite模型,首先我们可以搜索来自IBM Data and AI厂商的模型,并选择 模型版本 - Granite 3.0 2B Instruct,该模型主要用于集成企业用户的AI应用。选择该模型后,我们会进入到模型详情页面,可以查看模型供应商IBM为模型提供的官方介绍、定价和使用说明,包括示例API调用代码段。

3. Marketplace中的某些模型需要订阅才能使用。我们点击进入订阅页面可以查看模型定价和法律说明,在定价详情中包括了由供应商设定的模型使用价格。对于该模型,除了托管该模型的Amazon SageMaker基础设施成本之外没有模型额外的订阅成本,大家可以Amazon SageMaker定价页面上查看基础设施成本。我们点击 “订阅”(Subscribe)就可以开始使用该模型。

4. 在订阅完成后(通常需要几分钟),我们就可以可以开始部署模型到我们的账户内的SageMaker中。我们会跳转到部署的详情页面中,在本案例里我们使用默认设置和官方推荐的实例类型。

5. 打开高级设置(Advanced Settings)选项,我们可以选择在本账户的网络环境VPC中部署该模型,并添加用于访问S3存储桶和SNS短信通知服务的的IAM权限。如果我们没有选定现有的IAM权限,Amazon Bedrock Marketplace默认会为我们创建一个IAM权限角色。其他选择默认值后,点击Deploy进行部署。

6. 部署完成后,我们Marketplace模型部署页面中的模型状态将显示为“In Service”运行中,大家可以在部署页面中查看并编辑模型配置,可以执行的操作包括调整计算实例数量等。为了测试我们刚才的部署,我在模型交互对话框中打开模型,并输入提示词让模型生成一首诗歌。
在 Amazon Bedrock 中使用已部署的模型
7. 在模型交互对话框的页面中,我们可以在Marketplace类别下的Model Endpoints中,加载访问已部署的模型端点。我们还可以在Amazon Bedrock Agents、Amazon Bedrock 知识库、Amazon Bedrock提示词管理功能、Amazon Bedrock安全防护栏(Guardrails)等多种Bedrock AI功能中集成我们从Marketplace中部署的模型端点。

8. 比如小李哥从Marketplace中部署了一个用于图像生成的Stability AI Stable Diffusion 3.5 Large模型后,就可以在Amazon Bedrock模型交互图像生成页面中快速测试其图像生成能力。

如何通过AWS CLI和AWS SDK调用已部署的模型
对于已部署的模型,我们可直接通过亚马逊云科技,支持多种开发语言的SDK提供的Amazon Bedrock InvokeModel API进行访问。我们还可以使用亚马逊云科技命令行界面(AWS CLI),将模型端点的ARN资源名称作为我们要调用的模型ID,就可以调用模型生成回复了。对于应用于聊天场景的文生文模型,我们还可以使用Amazon Bedrock提供的统一标准API - Converse API进行内容生成,该API对模型差异进行了抽象处理,消除了模型的差异化,通过简单的参数改变就可以自由进行模型切换。
其他注意事项
Amazon Bedrock Marketplace目前在以下亚马逊区域可用:美国东部(弗吉尼亚北部、俄亥俄)美国西部(俄勒冈)、亚太地区(孟买、首尔、新加坡、悉尼、东京)、加拿大(中部)、欧洲(法兰克福、爱尔兰、伦敦、巴黎)、南美(圣保罗)。
另外在Amazon Bedrock Marketplace中,我们调用模型的收费,是向第三方模型提供商支付的,类型为软件订阅费用(某些模型订阅是免费的),总的费用还包括我们选择的计算实例类型和数量所产生的模型托管费用。
相关文章:
全球AI模型百科全书,亚马逊云科技Bedrock上的100多款AI模型
今天小李哥给大家介绍的是亚马逊云科技上的AI模型管理平台Amazon Bedrock上的Marketplace,这是亚马逊云科技在今年re:Invent发布的一个全新功能,将亚马逊的电商基因带到了其云计算平台,让我们能够通过Amazon Bedrock访问100多种流行、新兴和专…...
微信小程序中常见的 跳转方式 及其特点的表格总结(wx.navigateTo 适合需要返回上一页的场景)
文章目录 详细说明总结wx.navigateTo 的特点为什么 wx.navigateTo 最常用?其他跳转方式的使用频率总结 以下是微信小程序中常见的跳转方式及其特点的表格总结: 跳转方式API 方法特点适用场景wx.navigateTowx.navigateTo({ url: 路径 })保留当前页面&…...
【Elasticsearch】index:false
在 Elasticsearch 中,index 参数用于控制是否对某个字段建立索引。当设置 index: false 时,意味着该字段不会被编入倒排索引中,因此不能直接用于搜索查询。然而,这并不意味着该字段完全不可访问或没有其他用途。以下是关于 index:…...
新版IDEA创建数据库表
这是老版本的IDEA创建数据库表,下面可以自己勾选Not null(非空),Auto inc(自增长),Unique(唯一标识)和Primary key(主键) 这是新版的IDEA创建数据库表,Not null和Auto inc可以看得到,但Unique和Primary key…...
输入带空格的字符串,求单词个数
输入带空格的字符串,求单词个数 __ueooe_eui_sjje__ ---->3syue__jdjd____die_ ---->3shuue__dju__kk ---->3 #include <stdio.h> #include <string.h>// 自定义函数来判断字符是否为空白字符 int isSpace(char c) {return c || c \t || …...
C语言程序设计十大排序—希尔排序
文章目录 1.概念✅2.希尔排序🎈3.代码实现✅3.1 直接写✨3.2 函数✨ 4.总结✅ 1.概念✅ 排序是数据处理的基本操作之一,每次算法竞赛都很多题目用到排序。排序算法是计算机科学中基础且常用的算法,排序后的数据更易于处理和查找。在计算机发展…...
Excel制作合同到期自动提醒!
大家好,我是小鱼。 今天分享一下如何利用Excel制作合同到期提醒表,实现Excel表格自动计算合同到期日和天数,根据合同状态和到期天数自动填充颜色提醒,超实用。先看一下效果,已经到期的合同会自动被填充为红色…...
“AI质量评估系统:智能守护,让品质无忧
嘿,各位小伙伴们!今天咱们来聊聊一个在现代社会中越来越重要的角色——AI质量评估系统。你知道吗?在这个快速发展的时代,产品质量已经成为企业生存和发展的关键。而AI质量评估系统,就像是我们的智能守护神,…...
爬虫基础之爬取某基金网站+数据分析
声明: 本案例仅供学习参考使用,任何不法的活动均与本作者无关 网站:天天基金网(1234567.com.cn) --首批独立基金销售机构-- 东方财富网旗下基金平台! 本案例所需要的模块: 1.requests 2.re(内置) 3.pandas 4.pyecharts 其他均需要 pip install 模块名 爬取步骤: …...
使用 Aryn DocPrep、DocParse 和 Elasticsearch 向量数据库实现高质量 RAG
作者:来自 Elastic Hemant Malik 及 Jonathan Fritz 组织依靠自然语言查询从非结构化数据中获取见解,但要获得高质量的答案,首先要进行有效的数据准备。Aryn DocParse 和 DocPrep通过将复杂文档转换为结构化 JSON 或 markdown 来简化此过程&a…...
Couchbase UI: Server
在 Couchbase UI 中的 Server(服务器)标签页主要用于管理和监控集群中的各个节点。以下是 Server 标签页的主要内容和功能介绍: 1. 节点列表 显示集群中所有节点的列表,每个节点的详细信息包括: 节点地址࿱…...
Web3.0时代的挑战与机遇:以开源2+1链动模式AI智能名片S2B2C商城小程序为例的深度探讨
摘要:Web3.0作为互联网的下一代形态,承载着去中心化、开放性和安全性的重要愿景。然而,其高门槛、用户体验差等问题阻碍了Web3.0的主流化进程。本文旨在深入探讨Web3.0面临的挑战,并提出利用开源21链动模式、AI智能名片及S2B2C商城…...
langchain基础(一)
模型又可分为语言模型(擅长文本补全,输入和输出都是字符串)和聊天模型(擅长对话,输入时消息列表,输出是一个消息)两大类。 以调用openai的聊天模型为例,先安装langchain_openai库 1…...
【Android】布局文件layout.xml文件使用控件属性android:layout_weight使布局较为美观,以RadioButton为例
目录 说明举例 说明 简单来说,android:layout_weight为当前控件按比例分配剩余空间。且单个控件该属性的具体数值不重要,而是多个控件的属性值之比发挥作用,例如有2个控件,各自的android:layout_weight的值设为0.5和0.5࿰…...
RabbitMQ 架构分析
文章目录 前言一、RabbitMQ架构分析1、Broker2、Vhost3、Producer4、Messages5、Connections6、Channel7、Exchange7、Queue8、Consumer 二、消息路由机制1、Direct Exchange2、Topic Exchange3、Fanout Exchange4、Headers Exchange5、notice5.1、备用交换机(Alter…...
Qt Enter和HoverEnter事件
介绍 做PC开发的过程中或多或少都会接触到鼠标的悬停事件,Qt中处理鼠标悬停有Enter和HoverEnter两种事件 相同点 QEvent::Enter对应QEnterEvent,描述的是鼠标进入控件坐标范围之内的行为,QEnterEvent可以抓取鼠标的位置;QEvent…...
大语言模型之prompt工程
前言 随着人工智能的快速发展,我们正慢慢进入AIGC的新时代,其中对自然语言的处理成为了智能化的关键一环,在这个大背景下,“Prompt工程”由此产生,并且正逐渐成为有力的工具... LLM (Large Language Mode…...
WPF基础 | WPF 常用控件实战:Button、TextBox 等的基础应用
WPF基础 | WPF 常用控件实战:Button、TextBox 等的基础应用 一、前言二、Button 控件基础2.1 Button 的基本定义与显示2.2 按钮样式设置2.3 按钮大小与布局 三、Button 的交互功能3.1 点击事件处理3.2 鼠标悬停与离开效果3.3 按钮禁用与启用 四、TextBox 控件基础4.…...
[笔记] 极狐GitLab实例 : 手动备份步骤总结
官方备份文档 : 备份和恢复极狐GitLab 一. 要求 为了能够进行备份和恢复,请确保您系统已安装 Rsync。 如果您安装了极狐GitLab: 如果您使用 Omnibus 软件包,则无需额外操作。如果您使用源代码安装,您需要确定是否安装了 rsync。…...
随笔十七、eth0单网卡绑定双ip的问题
在调试语音对讲过程中遇到过一个“奇怪”问题:泰山派作为一端,可以收到对方发来的语音,而对方不能收到泰山派发出的语音。 用wireshark抓包UDP发现,泰山派发送的地址是192.168.1.30,而给泰山派实际设置的静态地址是19…...
快速掌握Clarke与Park变换的几何本质
1. 从三相坐标系到静止两相系的几何之旅 想象一下你站在一个布满彩色灯带的游乐场中央,头顶有三盏呈120度分布的聚光灯(A、B、C相),它们交替明暗形成旋转的光影。Clarke变换就像给你戴上一副特殊眼镜,能将三盏灯的光影…...
别再为‘file must be a file‘报错头疼了!手把手教你用Apifox搞定Dify文件上传接口
深度解析Dify文件上传接口:从报错排查到Apifox高效调试实战 当你正在为Dify AI应用集成文件上传功能时,是否曾在Apifox中反复遭遇file must be a file的报错而束手无策?这种看似简单的接口调试背后,隐藏着文件传输机制、参数组合…...
AsyncAPI消息版本兼容性终极指南:如何优雅处理API变更
AsyncAPI消息版本兼容性终极指南:如何优雅处理API变更 【免费下载链接】spec The AsyncAPI specification allows you to create machine-readable definitions of your asynchronous APIs. 项目地址: https://gitcode.com/gh_mirrors/spec/spec AsyncAPI是描…...
Python 官方下载页面(如 python.org/downloads/)的片段,列出了 Windows 平台下 Python 3.13.11
Python 官方下载页面(如 python.org/downloads/)的片段,列出了 Windows 平台下 Python 3.13.11(发布于 2025 年 12 月 5 日)的多种安装包选项。以下是各选项的简要说明: Windows installer (64-bit / 32-b…...
基于SSM + Vue的二手物品交易网站系统(角色:用户、管理员)
文章目录前言一、详细操作演示视频二、具体实现截图三、技术栈1.前端-Vue.js2.后端-SpringBoot3.数据库-MySQL4.系统架构-B/S四、系统测试1.系统测试概述2.系统功能测试3.系统测试结论五、项目代码参考六、数据库代码参考七、项目论文示例结语前言 💛博主介绍&#…...
CameraFileCopy:重新定义无网络文件传输的安卓应用
CameraFileCopy:重新定义无网络文件传输的安卓应用 【免费下载链接】cfc Demo/test android app for libcimbar. Copy files over the cell phone camera! 项目地址: https://gitcode.com/gh_mirrors/cfc/cfc 在移动设备普及的今天,我们依然经常面…...
BULLM_ExtendMotor:8通道I²C电机驱动Arduino HAL库
1. 项目概述BULLM_ExtendMotor 是专为牛明工作室(BULLM Studio)8通道电机驱动扩展板设计的嵌入式控制库。该扩展板采用 IC 总线通信,集成 8 路独立可逆直流电机驱动通道,每通道支持 PWM 调速与方向控制,适用于多轴运动…...
OpenClaw调试技巧:ollama-QwQ-32B任务失败日志分析方法
OpenClaw调试技巧:ollama-QwQ-32B任务失败日志分析方法 1. 为什么需要关注OpenClaw任务失败日志 上周我在尝试用OpenClaw自动整理项目文档时,遇到了一个令人抓狂的问题:明明配置好了ollama-QwQ-32B模型,任务却总是莫名其妙地卡在…...
AI智能体应用工程师:少数人掌握的高薪未来,你离入场还有多远
AI智能体应用工程师 — 国家战略人才项目|企业刚需资质—国务院发布关于实施“人工智能”行动。文中指出:到2027年,率先实现人工智能与6大重点领域广泛深度融合,新一代智能体终端、智能体等应用普及率超过70%。 各地省政府于2025年市级“A1产业”专项基金…...
内存检测从入门到精通:Memtest86+实战指南
内存检测从入门到精通:Memtest86实战指南 【免费下载链接】memtest86plus memtest86plus: 一个独立的内存测试工具,用于x86和x86-64架构的计算机,提供比BIOS内存测试更全面的检查。 项目地址: https://gitcode.com/gh_mirrors/me/memtest86…...


