全球AI模型百科全书,亚马逊云科技Bedrock上的100多款AI模型
今天小李哥给大家介绍的是亚马逊云科技上的AI模型管理平台Amazon Bedrock上的Marketplace,这是亚马逊云科技在今年re:Invent发布的一个全新功能,将亚马逊的电商基因带到了其云计算平台,让我们能够通过Amazon Bedrock访问100多种流行、新兴和专业的AI基础模型,可以说是AI模型的“百科全书”。我们现在可以在Amazon Bedrock中使用、测试和部署来自不同模型供应商(如IBM和Nvidia)的新模型,专业领域模型(如Upstages提供的适用于韩语处理的Solar Pro)以及Evolutionary Scale提供的ESM3蛋白质研究模型。大家在使用这些适用于不同场景的多样化AI模型的同时,不要忘了我们还可以访问Amazon Bedrock上的明星通用基础模型,例如Amazon、Anthropic和Meta提供的大语言模型。
通过Amazon Bedrock Marketplace部署的模型全面采用无服务器架构,可以通过Amazon Bedrock提供的标准API进行访问。Marketplace中可以兼容Converse API的模型,还可以将其与Amazon Bedrock上的其他功能,如Agents、知识库等工具一起集成使用。下图就是Marketplace上的多种模型类型截图。
Amazon Bedrock Marketplace的优势与特色?
随着生成式AI对开发者的项目以及企业业务带来革命性的变革,专门优化特定领域、语言或业务场景的模型需求正在飞速增长。然而精准找到和评估这些模型可能既复杂又昂贵,我们通常需要在不同的网站、模型供应商官网中发现这些模型,在抽象层中构建统一接口以在应用程序中统一集成它们,并创建复杂的安全和合规治理方案。
Amazon Bedrock Marketplace通过提供一个统一的集中平台,同时访问专业场景模型和通用大厂商模型,帮助开发者和企业解决这些应用开发挑战。
如何使用Amazon Bedrock Marketplace?
1. 登录亚马逊云科技Amazon Bedrock控制台中,导航到Foundation models页面,选择Model catalog。进入到Model Catalog后大家就可以根据特定的使用场景或希望交互的语言选择想要的模型,搜索选项包括无服务器Serverless模型(无需维护基础设施的模型)和Amazon Bedrock Marketplace上的模型。我们可以按模型厂商、模型的数据处理模态(例如文本、图像、向量化或音频)或任务类型(如分类或文本总结)进行筛选。
2. 比如我们想选择IBM Granite模型,首先我们可以搜索来自IBM Data and AI厂商的模型,并选择 模型版本 - Granite 3.0 2B Instruct,该模型主要用于集成企业用户的AI应用。选择该模型后,我们会进入到模型详情页面,可以查看模型供应商IBM为模型提供的官方介绍、定价和使用说明,包括示例API调用代码段。
3. Marketplace中的某些模型需要订阅才能使用。我们点击进入订阅页面可以查看模型定价和法律说明,在定价详情中包括了由供应商设定的模型使用价格。对于该模型,除了托管该模型的Amazon SageMaker基础设施成本之外没有模型额外的订阅成本,大家可以Amazon SageMaker定价页面上查看基础设施成本。我们点击 “订阅”(Subscribe)就可以开始使用该模型。
4. 在订阅完成后(通常需要几分钟),我们就可以可以开始部署模型到我们的账户内的SageMaker中。我们会跳转到部署的详情页面中,在本案例里我们使用默认设置和官方推荐的实例类型。
5. 打开高级设置(Advanced Settings)选项,我们可以选择在本账户的网络环境VPC中部署该模型,并添加用于访问S3存储桶和SNS短信通知服务的的IAM权限。如果我们没有选定现有的IAM权限,Amazon Bedrock Marketplace默认会为我们创建一个IAM权限角色。其他选择默认值后,点击Deploy进行部署。
6. 部署完成后,我们Marketplace模型部署页面中的模型状态将显示为“In Service”运行中,大家可以在部署页面中查看并编辑模型配置,可以执行的操作包括调整计算实例数量等。为了测试我们刚才的部署,我在模型交互对话框中打开模型,并输入提示词让模型生成一首诗歌。
在 Amazon Bedrock 中使用已部署的模型
7. 在模型交互对话框的页面中,我们可以在Marketplace类别下的Model Endpoints中,加载访问已部署的模型端点。我们还可以在Amazon Bedrock Agents、Amazon Bedrock 知识库、Amazon Bedrock提示词管理功能、Amazon Bedrock安全防护栏(Guardrails)等多种Bedrock AI功能中集成我们从Marketplace中部署的模型端点。
8. 比如小李哥从Marketplace中部署了一个用于图像生成的Stability AI Stable Diffusion 3.5 Large模型后,就可以在Amazon Bedrock模型交互图像生成页面中快速测试其图像生成能力。
如何通过AWS CLI和AWS SDK调用已部署的模型
对于已部署的模型,我们可直接通过亚马逊云科技,支持多种开发语言的SDK提供的Amazon Bedrock InvokeModel API进行访问。我们还可以使用亚马逊云科技命令行界面(AWS CLI),将模型端点的ARN资源名称作为我们要调用的模型ID,就可以调用模型生成回复了。对于应用于聊天场景的文生文模型,我们还可以使用Amazon Bedrock提供的统一标准API - Converse API进行内容生成,该API对模型差异进行了抽象处理,消除了模型的差异化,通过简单的参数改变就可以自由进行模型切换。
其他注意事项
Amazon Bedrock Marketplace目前在以下亚马逊区域可用:美国东部(弗吉尼亚北部、俄亥俄)美国西部(俄勒冈)、亚太地区(孟买、首尔、新加坡、悉尼、东京)、加拿大(中部)、欧洲(法兰克福、爱尔兰、伦敦、巴黎)、南美(圣保罗)。
另外在Amazon Bedrock Marketplace中,我们调用模型的收费,是向第三方模型提供商支付的,类型为软件订阅费用(某些模型订阅是免费的),总的费用还包括我们选择的计算实例类型和数量所产生的模型托管费用。
相关文章:

全球AI模型百科全书,亚马逊云科技Bedrock上的100多款AI模型
今天小李哥给大家介绍的是亚马逊云科技上的AI模型管理平台Amazon Bedrock上的Marketplace,这是亚马逊云科技在今年re:Invent发布的一个全新功能,将亚马逊的电商基因带到了其云计算平台,让我们能够通过Amazon Bedrock访问100多种流行、新兴和专…...

微信小程序中常见的 跳转方式 及其特点的表格总结(wx.navigateTo 适合需要返回上一页的场景)
文章目录 详细说明总结wx.navigateTo 的特点为什么 wx.navigateTo 最常用?其他跳转方式的使用频率总结 以下是微信小程序中常见的跳转方式及其特点的表格总结: 跳转方式API 方法特点适用场景wx.navigateTowx.navigateTo({ url: 路径 })保留当前页面&…...
【Elasticsearch】index:false
在 Elasticsearch 中,index 参数用于控制是否对某个字段建立索引。当设置 index: false 时,意味着该字段不会被编入倒排索引中,因此不能直接用于搜索查询。然而,这并不意味着该字段完全不可访问或没有其他用途。以下是关于 index:…...

新版IDEA创建数据库表
这是老版本的IDEA创建数据库表,下面可以自己勾选Not null(非空),Auto inc(自增长),Unique(唯一标识)和Primary key(主键) 这是新版的IDEA创建数据库表,Not null和Auto inc可以看得到,但Unique和Primary key…...

输入带空格的字符串,求单词个数
输入带空格的字符串,求单词个数 __ueooe_eui_sjje__ ---->3syue__jdjd____die_ ---->3shuue__dju__kk ---->3 #include <stdio.h> #include <string.h>// 自定义函数来判断字符是否为空白字符 int isSpace(char c) {return c || c \t || …...

C语言程序设计十大排序—希尔排序
文章目录 1.概念✅2.希尔排序🎈3.代码实现✅3.1 直接写✨3.2 函数✨ 4.总结✅ 1.概念✅ 排序是数据处理的基本操作之一,每次算法竞赛都很多题目用到排序。排序算法是计算机科学中基础且常用的算法,排序后的数据更易于处理和查找。在计算机发展…...

Excel制作合同到期自动提醒!
大家好,我是小鱼。 今天分享一下如何利用Excel制作合同到期提醒表,实现Excel表格自动计算合同到期日和天数,根据合同状态和到期天数自动填充颜色提醒,超实用。先看一下效果,已经到期的合同会自动被填充为红色…...

“AI质量评估系统:智能守护,让品质无忧
嘿,各位小伙伴们!今天咱们来聊聊一个在现代社会中越来越重要的角色——AI质量评估系统。你知道吗?在这个快速发展的时代,产品质量已经成为企业生存和发展的关键。而AI质量评估系统,就像是我们的智能守护神,…...

爬虫基础之爬取某基金网站+数据分析
声明: 本案例仅供学习参考使用,任何不法的活动均与本作者无关 网站:天天基金网(1234567.com.cn) --首批独立基金销售机构-- 东方财富网旗下基金平台! 本案例所需要的模块: 1.requests 2.re(内置) 3.pandas 4.pyecharts 其他均需要 pip install 模块名 爬取步骤: …...

使用 Aryn DocPrep、DocParse 和 Elasticsearch 向量数据库实现高质量 RAG
作者:来自 Elastic Hemant Malik 及 Jonathan Fritz 组织依靠自然语言查询从非结构化数据中获取见解,但要获得高质量的答案,首先要进行有效的数据准备。Aryn DocParse 和 DocPrep通过将复杂文档转换为结构化 JSON 或 markdown 来简化此过程&a…...

Couchbase UI: Server
在 Couchbase UI 中的 Server(服务器)标签页主要用于管理和监控集群中的各个节点。以下是 Server 标签页的主要内容和功能介绍: 1. 节点列表 显示集群中所有节点的列表,每个节点的详细信息包括: 节点地址࿱…...

Web3.0时代的挑战与机遇:以开源2+1链动模式AI智能名片S2B2C商城小程序为例的深度探讨
摘要:Web3.0作为互联网的下一代形态,承载着去中心化、开放性和安全性的重要愿景。然而,其高门槛、用户体验差等问题阻碍了Web3.0的主流化进程。本文旨在深入探讨Web3.0面临的挑战,并提出利用开源21链动模式、AI智能名片及S2B2C商城…...

langchain基础(一)
模型又可分为语言模型(擅长文本补全,输入和输出都是字符串)和聊天模型(擅长对话,输入时消息列表,输出是一个消息)两大类。 以调用openai的聊天模型为例,先安装langchain_openai库 1…...

【Android】布局文件layout.xml文件使用控件属性android:layout_weight使布局较为美观,以RadioButton为例
目录 说明举例 说明 简单来说,android:layout_weight为当前控件按比例分配剩余空间。且单个控件该属性的具体数值不重要,而是多个控件的属性值之比发挥作用,例如有2个控件,各自的android:layout_weight的值设为0.5和0.5࿰…...

RabbitMQ 架构分析
文章目录 前言一、RabbitMQ架构分析1、Broker2、Vhost3、Producer4、Messages5、Connections6、Channel7、Exchange7、Queue8、Consumer 二、消息路由机制1、Direct Exchange2、Topic Exchange3、Fanout Exchange4、Headers Exchange5、notice5.1、备用交换机(Alter…...
Qt Enter和HoverEnter事件
介绍 做PC开发的过程中或多或少都会接触到鼠标的悬停事件,Qt中处理鼠标悬停有Enter和HoverEnter两种事件 相同点 QEvent::Enter对应QEnterEvent,描述的是鼠标进入控件坐标范围之内的行为,QEnterEvent可以抓取鼠标的位置;QEvent…...

大语言模型之prompt工程
前言 随着人工智能的快速发展,我们正慢慢进入AIGC的新时代,其中对自然语言的处理成为了智能化的关键一环,在这个大背景下,“Prompt工程”由此产生,并且正逐渐成为有力的工具... LLM (Large Language Mode…...

WPF基础 | WPF 常用控件实战:Button、TextBox 等的基础应用
WPF基础 | WPF 常用控件实战:Button、TextBox 等的基础应用 一、前言二、Button 控件基础2.1 Button 的基本定义与显示2.2 按钮样式设置2.3 按钮大小与布局 三、Button 的交互功能3.1 点击事件处理3.2 鼠标悬停与离开效果3.3 按钮禁用与启用 四、TextBox 控件基础4.…...

[笔记] 极狐GitLab实例 : 手动备份步骤总结
官方备份文档 : 备份和恢复极狐GitLab 一. 要求 为了能够进行备份和恢复,请确保您系统已安装 Rsync。 如果您安装了极狐GitLab: 如果您使用 Omnibus 软件包,则无需额外操作。如果您使用源代码安装,您需要确定是否安装了 rsync。…...
随笔十七、eth0单网卡绑定双ip的问题
在调试语音对讲过程中遇到过一个“奇怪”问题:泰山派作为一端,可以收到对方发来的语音,而对方不能收到泰山派发出的语音。 用wireshark抓包UDP发现,泰山派发送的地址是192.168.1.30,而给泰山派实际设置的静态地址是19…...

渗透实战PortSwigger靶场-XSS Lab 14:大多数标签和属性被阻止
<script>标签被拦截 我们需要把全部可用的 tag 和 event 进行暴力破解 XSS cheat sheet: https://portswigger.net/web-security/cross-site-scripting/cheat-sheet 通过爆破发现body可以用 再把全部 events 放进去爆破 这些 event 全部可用 <body onres…...

Vue2 第一节_Vue2上手_插值表达式{{}}_访问数据和修改数据_Vue开发者工具
文章目录 1.Vue2上手-如何创建一个Vue实例,进行初始化渲染2. 插值表达式{{}}3. 访问数据和修改数据4. vue响应式5. Vue开发者工具--方便调试 1.Vue2上手-如何创建一个Vue实例,进行初始化渲染 准备容器引包创建Vue实例 new Vue()指定配置项 ->渲染数据 准备一个容器,例如: …...
Qwen3-Embedding-0.6B深度解析:多语言语义检索的轻量级利器
第一章 引言:语义表示的新时代挑战与Qwen3的破局之路 1.1 文本嵌入的核心价值与技术演进 在人工智能领域,文本嵌入技术如同连接自然语言与机器理解的“神经突触”——它将人类语言转化为计算机可计算的语义向量,支撑着搜索引擎、推荐系统、…...
06 Deep learning神经网络编程基础 激活函数 --吴恩达
深度学习激活函数详解 一、核心作用 引入非线性:使神经网络可学习复杂模式控制输出范围:如Sigmoid将输出限制在(0,1)梯度传递:影响反向传播的稳定性二、常见类型及数学表达 Sigmoid σ ( x ) = 1 1 +...

html-<abbr> 缩写或首字母缩略词
定义与作用 <abbr> 标签用于表示缩写或首字母缩略词,它可以帮助用户更好地理解缩写的含义,尤其是对于那些不熟悉该缩写的用户。 title 属性的内容提供了缩写的详细说明。当用户将鼠标悬停在缩写上时,会显示一个提示框。 示例&#x…...

【分享】推荐一些办公小工具
1、PDF 在线转换 https://smallpdf.com/cn/pdf-tools 推荐理由:大部分的转换软件需要收费,要么功能不齐全,而开会员又用不了几次浪费钱,借用别人的又不安全。 这个网站它不需要登录或下载安装。而且提供的免费功能就能满足日常…...

GruntJS-前端自动化任务运行器从入门到实战
Grunt 完全指南:从入门到实战 一、Grunt 是什么? Grunt是一个基于 Node.js 的前端自动化任务运行器,主要用于自动化执行项目开发中重复性高的任务,例如文件压缩、代码编译、语法检查、单元测试、文件合并等。通过配置简洁的任务…...

深入浅出深度学习基础:从感知机到全连接神经网络的核心原理与应用
文章目录 前言一、感知机 (Perceptron)1.1 基础介绍1.1.1 感知机是什么?1.1.2 感知机的工作原理 1.2 感知机的简单应用:基本逻辑门1.2.1 逻辑与 (Logic AND)1.2.2 逻辑或 (Logic OR)1.2.3 逻辑与非 (Logic NAND) 1.3 感知机的实现1.3.1 简单实现 (基于阈…...
深入浅出WebGL:在浏览器中解锁3D世界的魔法钥匙
WebGL:在浏览器中解锁3D世界的魔法钥匙 引言:网页的边界正在消失 在数字化浪潮的推动下,网页早已不再是静态信息的展示窗口。如今,我们可以在浏览器中体验逼真的3D游戏、交互式数据可视化、虚拟实验室,甚至沉浸式的V…...
从零手写Java版本的LSM Tree (一):LSM Tree 概述
🔥 推荐一个高质量的Java LSM Tree开源项目! https://github.com/brianxiadong/java-lsm-tree java-lsm-tree 是一个从零实现的Log-Structured Merge Tree,专为高并发写入场景设计。 核心亮点: ⚡ 极致性能:写入速度超…...