当前位置: 首页 > news >正文

【大模型】硅基流动对接DeepSeek使用详解

目录

一、前言

二、硅基流动介绍

2.1 硅基流动平台介绍

2.1.1 平台是做什么的

2.2 主要特点与功能

2.2.1 适用场景

三、硅基流动快速使用

3.1 账户注册

3.2 token获取

3.2.1 获取token技巧

四、Cherry-Studio对接DeepSeek

4.1 获取 Cherry-Studio

4.2 Cherry-Studio配置DeepSeek

4.2.1 设置api密钥

4.2.2 模型检查

4.3 与DeepSeek对话

4.4 补充说明

五、应用程序基于硅基流动对接DeepSeek

5.1 获取API文档

5.2 代码对接硅基流动使用DeepSeek

5.2.1 python代码操作示例 - 对话模型能力

5.2.1 python代码操作示例 - 生图模型能力

六、写在文末


一、前言

近期,随着DeepSeek的热度越来越高,各大厂商和大模型平台开始支持对DeepSeek的部署或接入,可以预见在接下来的一段时间内,DeepSeek的关注度将会持续走高,对于开发者或用户来说,有幸见证了这一波时代的AI红利,如何能够快速应用DeepSeek,做第一波尝鲜的人,本文将先介绍如何基于硅流流动平台快速使用和对接DeepSeek过程。

二、硅基流动介绍

2.1 硅基流动平台介绍

硅基流动(SiliconCloud)是一家致力于打造大模型时代的AI基础设施的公司,主要提供高效、低成本且全面的生成式人工智能(GenAI)模型服务。硅基流动的核心目标是通过优化大模型使用体验,帮助用户实现“Token 自由”,即以更低成本和更高效率使用先进的大语言模型(LLMs)及其他生成式人工智能(AI)模型。

快速入口:硅基流动统一登录 ,注册登录进去之后默认进到模型广场

2.1.1 平台是做什么的

硅基流动是一家专注于大规模AI计算的技术公司,由清华大学高性能计算研究所孙广宇教授团队创立。公司核心团队来自清华大学、MIT等顶尖高校,在高性能计算和AI系统方面有深厚的技术积累。主要产品和服务包括:

  • SiliconLLM: 高性能LLM推理引擎,支持各种主流大语言模型的高效部署。

  • SiliconCloud: 一站式AI云计算平台,提供LLM训练推理等服务。

  • OneDiff: 开源的AI编译框架,可自动优化AI模型性能。

产品核心优势在于深厚的系统优化技术,能大幅提升AI模型的计算效率,帮助企业降低AI部署成本。目标市场主要面向有大规模AI计算需求的企业客户。

2.2 主要特点与功能

硅基流动具备如下特点:

  • 丰富的大模型支持

    • 平台集成多种主流开源大模型,包括文本生成模型如DeepSeek R1 & V3、Qwen2.5、GLM-4、Llama-3.X、Gemma-2、InternLM、Yi-1.5等,以及图片生成模型如Janus-Pro、Stable Diffusion(SDXL)、FLUX等。

  • 多模态模型支持

    • 支持文本生成语音、文本生成图像、文本生成视频等功能。代码生成模型包括Qwen2.5-Coder-32B-Instruct等。

  • 高性价比优势

    • 提供行业内较低的API调用价格,例如Qwen2-72B模型的调用费用仅为4.13元/百万Token。对于9B及以下的模型,平台提供永久免费API服务,适合个人开发者及小型项目使用。

  • 便捷的使用体验

    • 用户无需自建硬件或进行复杂配置,只需通过API调用模型。平台提供统一的API接口,支持多种模型的无缝切换,显著提升开发效率。

  • 推理加速与性能优化

    • 平台内置推理加速引擎(如SiliconLLM和OneDiff),显著提升模型的响应速度及生成效率。支持大模型的微调与托管,用户可根据自定义数据优化模型性能。

  • 免费体验与开发支持

    • 提供免费体验中心(Playground),用户可直接测试文本生成、图像生成、文本生成语音、文本生成视频等功能。提供详尽的文档和社区支持,降低开发门槛,促进开发者使用和创造。

  • 应用接入大模型简单

    • 在该平台上,针对一些主流的大模型,提供了快速便捷的对接入口,方便开发者快速进行接入使用。

2.2.1 适用场景

硅基流动适用于各种需要高效、低成本AI服务的场景,包括但不限于文本生成、图像生成、语音生成、视频生成等。其便捷的使用体验和高性价比的优势使得硅基流动成为开发者和企业在AI应用开发中的理想选择。

  • 企业级 AI 应用开发:

    • 通过低成本的 API 服务,迅速将大模型集成到企业产品中。

  • 个人开发者与 AI 爱好者:

    • 无需依赖昂贵的硬件支持,便可使用顶尖大模型进行实验和创新。

  • 多模态内容生成:

    • 支持文本、语音、图像和视频的生成,适用于内容创作者和设计师。

  • 模型微调与定制:

    • 企业可上传自有数据,对模型进行微调,从而满足特定业务需求。

硅基流动(SiliconCloud)致力于为开发者提供一个集成多种开源大模型并配备优化 API 服务的高效、灵活且经济高效的 AI 开发平台。它不仅支持个人开发者快速将创意转化为实际项目,也为企业用户提供了简化的途径来实现生成式 AI 应用的迅速落地。通过整合这些资源和服务,该平台有效地降低了技术实施的门槛与成本,使得更广泛的用户群体能够轻松接触和应用先进的大语言模型与生成式 AI 技术。

三、硅基流动快速使用

3.1 账户注册

正常注册并登录进去后,进入到展示模型列表页面,即模型广场,可以看到,这里提供了非常多的模型可供选择和使用

3.2 token获取

类似于使用其他的开源大模型,比如ChatGPT,文心一言等,如果你通过平台的方式使用,或者后续集成到代码中进行使用时,需要走token计费,典型的像我们在代码中调用ChatGPT的openai接口时,都是按照token进行计费的,在这里,硅基流动也类似,只不过目前新账号注册之后,官方会默认赠送一定的付费额度

3.2.1 获取token技巧

也可以通过邀请好友注册的方式获取一定额度的token,如下,在我的邀请这里,将邀请链接发送给好友,好友通过这个链接注册成功后,平台就会为你赠送一定的额度。比如在下面的个人邀请列表中可以看到邀请的用户注册信息。

四、Cherry-Studio对接DeepSeek

如何基于上述硅基流动平台在本地使用deepseek呢?这里推荐两个本地客户端工具Cherry-Studio,Chatbox,两个工具都可以作为本地管理AI大模型的工具使用,下面以Cherry-Studio为例进行说明。

4.1 获取 Cherry-Studio

Cherry-Studio下载地址:Cherry Studio - 全能的AI助手

网盘中提供了不同操作系统的安装包,根据你的操作系统进行选择下载即可

我这里选择windows版本的下载到本地之后,直接双击安装即可

安装成功后,启动工具主页如下图所示

4.2 Cherry-Studio配置DeepSeek

4.2.1 设置api密钥

点击右下方的设置按钮,拷贝硅基流动官网上面的那个你创建的apikey到这里

即下面这个密钥,如果还没有的话,点击新建API密钥即可,然后拷贝到上面的那个地方

4.2.2 模型检查

密钥贴进去之后,为了确保后续对接模型能够正常使用,点击后面的检查按钮,在弹出的下拉框中

上一步配置完成之后,在默认模型菜单栏中,将下面的三个选型全部选择为deepseek-v3的这个模型

4.3 与DeepSeek对话

在上面的配置都完成之后,回到消息对话窗口,在顶部就可以看到模型切换为deepseek-v3的模型了

然后你就可以在当前的对话窗口进行对话了,比如在下面我输入了一个早上好,模型就给了回复

  • 这里要注意的是,你在这个窗口与deepseek对话,消耗的是你在硅基流动平台的token额度,因此需要及时关注自己的账户额度情况。

更多的可以自己尝试,可以像使用其他大模型一样使用

费用账单检查,在硅基流动官网的费用账单那里实时关注自己的额度使用情况

4.4 补充说明

在硅基流动官网的文档中心中,从下面的入口点进去

在文档中心的左侧可以发现,除了上面推荐的两种工具,还有很多其他类型的客户端工具可以选择使用,包括怎么在工具中进行配置都有详细的说明

五、应用程序基于硅基流动对接DeepSeek

5.1 获取API文档

如何在应用程序中使用DeepSeek功能呢,如下在硅基流动官网展示的DeepSeek模型详情中,也提供了不同开发语言,以DeepSeek-R1模型为例,进去之后点击API文档

进入到当前模型的API文档对接中心,在这里提供了完善的对接说明,包括种主流开发语言的示例代码

5.2 代码对接硅基流动使用DeepSeek

在文档中心的左侧,可以提供了很多模型能力,比如推理能力,视频转换能力,文本转语音能力等,下面用代码体验下其中的模型能力。

5.2.1 python代码操作示例 - 对话模型能力

参考下面的代码示例,在python程序中使用deepseek,注意替换参数中的token为你自己的

import requestsurl = "https://api.siliconflow.cn/v1/chat/completions"payload = {"model": "deepseek-ai/DeepSeek-V3","messages": [{"role": "user","content": "中国大模型行业2025年将会迎来哪些机遇和挑战?"}],"stream": False,"max_tokens": 512,"stop": ["null"],"temperature": 0.7,"top_p": 0.7,"top_k": 50,"frequency_penalty": 0.5,"n": 1,"response_format": {"type": "text"},"tools": [{"type": "function","function": {"description": "<string>","name": "<string>","parameters": {},"strict": False}}]
}
headers = {"Authorization": "Bearer <token>","Content-Type": "application/json"
}response = requests.request("POST", url, json=payload, headers=headers)print(response.text)

运行上面的代码,在控制台输出了响应结果

5.2.1 python代码操作示例 - 生图模型能力

进入生图模型能力文档中心:创建图片生成请求 - SiliconFlow,可以参考其中的详细说明进行对接。

参考下面的示例代码

import requestsurl = "https://api.siliconflow.cn/v1/images/generations"payload = {"model": "deepseek-ai/Janus-Pro-7B","prompt": "an island near sea, with seagulls, moon shining over the sea, light house, boats int he background, fish flying over the sea","seed": 4999999999
}
headers = {"Authorization": "Bearer 你的apikey","Content-Type": "application/json"
}response = requests.request("POST", url, json=payload, headers=headers)print(response.text)

运行上面的代码,在控制台中输出了生成的图片的url链接,可以在浏览器中打开链接看看效果

六、写在文末

本文详细介绍了硅基流动这个平台的使用,以及如何基于硅基流动对接和使用DeepSeek大模型,最后通过本地客户端工具演示了如何像使用官方的DeepSeek一样去使用,以及如何在代码中集成和使用DeepSeek提供的相关的模型能力,希望对看到的同学有用,本篇到此结束,感谢观看。

相关文章:

【大模型】硅基流动对接DeepSeek使用详解

目录 一、前言 二、硅基流动介绍 2.1 硅基流动平台介绍 2.1.1 平台是做什么的 2.2 主要特点与功能 2.2.1 适用场景 三、硅基流动快速使用 3.1 账户注册 3.2 token获取 3.2.1 获取token技巧 四、Cherry-Studio对接DeepSeek 4.1 获取 Cherry-Studio 4.2 Cherry-Stud…...

[Windows] PDF补丁丁v1.1.0.4627绿色版

[Windows] PDF补丁丁 链接&#xff1a;https://pan.xunlei.com/s/VOIdp50MV2BkOrFott_SCev1A1?pwdvbw4# PDFPatcher 是一款专门用于编辑 PDF 文件的软件&#xff0c;其主要功能包括添加、删除、修改、替换和提取 PDF 文件中的文本、图像、页面等内容&#xff0c;以及支持密码…...

Oracle 变更redo log文件位置

更改Oracle数据库的Redo log文件位置&#xff0c;可以按照以下步骤操作。 1.查询当前Redo log文件信息 select * from v$log; select * from v$logfile;通过查询结果可知Redo log文件放在/oradata/redofile 目录下。 2.拷贝redo log文件到新的位置/Data/redolog $cd /orada…...

使用Redis实现业务信息缓存(缓存详解,缓存更新策略,缓存三大问题)

一、什么是缓存? 缓存是一种高效的数据存储方式,它通过将数据保存在内存中来提供快速的读写访问。这种机制特别适用于需要高速数据访问的应用场景,如网站、应用程序和服务。在处理大量数据和高并发请求时, 缓存能显著提高性能和用户体验。 Redis就是一款常用的缓存中间件。…...

已验证正常,Java输入字符串生成PDF文件

Java输入字符串生成PDF文件过程&#xff1a; 在Java开发中&#xff0c;如何将字符串转换为 PDF 是一个常见的需求。网上找了很多例子都无法生成&#xff0c;经过多次尝试&#xff0c;终于实现了&#xff0c;特此记录一下。 1、引入pom.xml 添加所需的依赖 <dependency>&…...

android手机安装deepseek-r1:1.5b

序 本文主要展示一下如何在android手机上安装deepseek-r1:1.5b 步骤 安装termux 到https://termux.dev/cn/index.html去下载 然后执行termux-setup-storage以获取手机存储权限 安装构建依赖 pkg install git cmake golang下载ollama git clone --depth 1 https://gitee.…...

51单片机俄罗斯方块清屏函数

/************************************************************************************************************** * 名称&#xff1a;LED_Clr * 功能&#xff1a;清屏 * 参数&#xff1a;NULL * 返回&#xff1a;NULL * 备注&#xff1a;temp数组为动态显示数据&#xff…...

PLSQL: 存储过程,用户自定义函数[oracle]

注意: raise notice是高斯的输出语句; DBMS_OUT_PUT.PUT_LINE是oracle的输出语句 存储过程 Stored Procedure 存储过程可以封装数据访问逻辑&#xff0c;使得应用程序可以通过调用存储过程来执行这些逻辑&#xff0c;而不是直接执行SQL语句。这有助于提高代码的可重用性、可…...

深度学习-医学影像诊断

以下以使用深度学习进行医学影像&#xff08;如 X 光片&#xff09;的肺炎诊断为例&#xff0c;为你展示基于 PyTorch 框架的代码实现。我们将构建一个简单的卷积神经网络&#xff08;CNN&#xff09;模型&#xff0c;使用公开的肺炎 X 光影像数据集进行训练和评估。 1. 安装必…...

备战蓝桥杯:双指针(滑动窗口)算法之逛花展

P1638 逛画展 - 洛谷 | 计算机科学教育新生态 这道题我们只要用一个kind和一个mp[N]的数组就能解决了 我们的解法1就是暴力枚举&#xff0c;先固定2&#xff0c;从2开始找连续的满足所有种类的最短的子数组&#xff0c;然后固定5&#xff0c;3&#xff0c;1&#xff0c;3&…...

Linux如何设置软件开机启动呢?

有很多软件&#xff0c;我们安装完之后&#xff0c;服务器一旦重启&#xff0c;软件也需要我们手动再次启动&#xff0c;有很多的软件我们不想手动重启&#xff0c;例如Redis、Mysql、MQ等&#xff0c;那我们怎么配置软件跟着服务器也一起启动呢&#xff0c;今天就给大家带来软…...

Vue(3)

一.生命周期及其四个阶段 Vue生命周期&#xff1a;一个Vue实例从创建到销毁的整个过程 生命周期四个阶段&#xff1a;①创建②挂载③更新④销毁 <body><div id"app"><h3>{{ title }}</h3><div><button click"count--"&…...

11vue3实战-----封装缓存工具

11vue3实战-----封装缓存工具 1.背景2.pinia的持久化思路3.以localStorage为例解决问题4.封装缓存工具 1.背景 在上一章节&#xff0c;实现登录功能时候&#xff0c;当账号密码正确&#xff0c;身份验证成功之后&#xff0c;把用户信息保存起来&#xff0c;是用的pinia。然而p…...

第16章 Single Thread Execution设计模式(Java高并发编程详解:多线程与系统设计)

简单来说&#xff0c; Single Thread Execution就是采用排他式的操作保证在同一时刻只能有一个线程访问共享资源。 1.机场过安检 1.1非线程安全 先模拟一个非线程安全的安检口类&#xff0c;旅客(线程)分别手持登机牌和身份证接受工作人员的检查&#xff0c;示例代码如所示。…...

MySQL 8.0.41 终端修改root密码

1.在 MySQL 命令行中&#xff0c;运行以下命令修改密码 ALTER USER rootlocalhost IDENTIFIED BY new_password; 其中&#xff0c;new_password替换为你想要设置的新密码 2.退出 MySQL终端&#xff0c;重新打开&#xff0c;使用新密码进入&#xff0c;修改成功...

微信小程序案例2——天气微信小程序(学会绑定数据)

文章目录 一、项目步骤1 创建一个weather项目2 进入index.wxml、index.js、index.wxss文件,清空所有内容,进入App.json,修改导航栏标题为“中国天气网”。3进入index.wxml,进行当天天气情况的界面布局,包括温度、最低温、最高温、天气情况、城市、星期、风行情况,代码如下…...

android的Compose 简介

Jetpack Compose 简介 Jetpack Compose 是 Android 官方推出的声明式 UI 工具包&#xff0c;用于替代传统 XML 布局&#xff0c;简化界面开发流程。它基于 Kotlin 语言&#xff0c;通过函数式编程实现高效、灵活的 UI 构建&#xff0c;支持实时预览和更直观的状态管理。 优势…...

缓存实战:Redis 与本地缓存

引言 在现代互联网应用中&#xff0c;缓存是提升系统性能和用户体验的关键技术之一。通过将频繁访问的数据存储在快速访问的存储介质中&#xff0c;可以显著减少对数据库的直接访问压力&#xff0c;从而提高系统的响应速度和吞吐量。 本文将从实战的角度出发&#xff0c;详细…...

apisix的real-ip插件使用说明

k8s集群入口一般都需要过负载均衡&#xff0c;然后再到apisix。 这时候如果后台业务需要获取客户端ip&#xff0c;可能拿到的是lb或者网关的内网ip。 这里一般要获取真实ip需要做几个处理。 1. 负载均衡上&#xff0c;一般支持配置获取真实ip参数&#xff0c;需要配置上。然…...

音视频协议

1. 多媒体信息 1.1 多媒体信息的两个主要特点&#xff1a; 信息量很大 标准语音&#xff1a;64Kbits(8KHz采样&#xff0c;8位编码)高质量音频&#xff1a;3Mbps(100KHz采样&#xff0c;12位编码) 在传输多媒体数据时&#xff0c;对时延和时延抖动均有较高要求 1.2 处理时延…...

脑机新手指南(八):OpenBCI_GUI:从环境搭建到数据可视化(下)

一、数据处理与分析实战 &#xff08;一&#xff09;实时滤波与参数调整 基础滤波操作 60Hz 工频滤波&#xff1a;勾选界面右侧 “60Hz” 复选框&#xff0c;可有效抑制电网干扰&#xff08;适用于北美地区&#xff0c;欧洲用户可调整为 50Hz&#xff09;。 平滑处理&…...

智慧工地云平台源码,基于微服务架构+Java+Spring Cloud +UniApp +MySql

智慧工地管理云平台系统&#xff0c;智慧工地全套源码&#xff0c;java版智慧工地源码&#xff0c;支持PC端、大屏端、移动端。 智慧工地聚焦建筑行业的市场需求&#xff0c;提供“平台网络终端”的整体解决方案&#xff0c;提供劳务管理、视频管理、智能监测、绿色施工、安全管…...

c++ 面试题(1)-----深度优先搜索(DFS)实现

操作系统&#xff1a;ubuntu22.04 IDE:Visual Studio Code 编程语言&#xff1a;C11 题目描述 地上有一个 m 行 n 列的方格&#xff0c;从坐标 [0,0] 起始。一个机器人可以从某一格移动到上下左右四个格子&#xff0c;但不能进入行坐标和列坐标的数位之和大于 k 的格子。 例…...

NLP学习路线图(二十三):长短期记忆网络(LSTM)

在自然语言处理(NLP)领域,我们时刻面临着处理序列数据的核心挑战。无论是理解句子的结构、分析文本的情感,还是实现语言的翻译,都需要模型能够捕捉词语之间依时序产生的复杂依赖关系。传统的神经网络结构在处理这种序列依赖时显得力不从心,而循环神经网络(RNN) 曾被视为…...

数据库分批入库

今天在工作中&#xff0c;遇到一个问题&#xff0c;就是分批查询的时候&#xff0c;由于批次过大导致出现了一些问题&#xff0c;一下是问题描述和解决方案&#xff1a; 示例&#xff1a; // 假设已有数据列表 dataList 和 PreparedStatement pstmt int batchSize 1000; // …...

腾讯云V3签名

想要接入腾讯云的Api&#xff0c;必然先按其文档计算出所要求的签名。 之前也调用过腾讯云的接口&#xff0c;但总是卡在签名这一步&#xff0c;最后放弃选择SDK&#xff0c;这次终于自己代码实现。 可能腾讯云翻新了接口文档&#xff0c;现在阅读起来&#xff0c;清晰了很多&…...

Golang——9、反射和文件操作

反射和文件操作 1、反射1.1、reflect.TypeOf()获取任意值的类型对象1.2、reflect.ValueOf()1.3、结构体反射 2、文件操作2.1、os.Open()打开文件2.2、方式一&#xff1a;使用Read()读取文件2.3、方式二&#xff1a;bufio读取文件2.4、方式三&#xff1a;os.ReadFile读取2.5、写…...

Caliper 配置文件解析:fisco-bcos.json

config.yaml 文件 config.yaml 是 Caliper 的主配置文件,通常包含以下内容: test:name: fisco-bcos-test # 测试名称description: Performance test of FISCO-BCOS # 测试描述workers:type: local # 工作进程类型number: 5 # 工作进程数量monitor:type: - docker- pro…...

Vite中定义@软链接

在webpack中可以直接通过符号表示src路径&#xff0c;但是vite中默认不可以。 如何实现&#xff1a; vite中提供了resolve.alias&#xff1a;通过别名在指向一个具体的路径 在vite.config.js中 import { join } from pathexport default defineConfig({plugins: [vue()],//…...

PHP 8.5 即将发布:管道操作符、强力调试

前不久&#xff0c;PHP宣布了即将在 2025 年 11 月 20 日 正式发布的 PHP 8.5&#xff01;作为 PHP 语言的又一次重要迭代&#xff0c;PHP 8.5 承诺带来一系列旨在提升代码可读性、健壮性以及开发者效率的改进。而更令人兴奋的是&#xff0c;借助强大的本地开发环境 ServBay&am…...