当前位置: 首页 > news >正文

【大模型】硅基流动对接DeepSeek使用详解

目录

一、前言

二、硅基流动介绍

2.1 硅基流动平台介绍

2.1.1 平台是做什么的

2.2 主要特点与功能

2.2.1 适用场景

三、硅基流动快速使用

3.1 账户注册

3.2 token获取

3.2.1 获取token技巧

四、Cherry-Studio对接DeepSeek

4.1 获取 Cherry-Studio

4.2 Cherry-Studio配置DeepSeek

4.2.1 设置api密钥

4.2.2 模型检查

4.3 与DeepSeek对话

4.4 补充说明

五、应用程序基于硅基流动对接DeepSeek

5.1 获取API文档

5.2 代码对接硅基流动使用DeepSeek

5.2.1 python代码操作示例 - 对话模型能力

5.2.1 python代码操作示例 - 生图模型能力

六、写在文末


一、前言

近期,随着DeepSeek的热度越来越高,各大厂商和大模型平台开始支持对DeepSeek的部署或接入,可以预见在接下来的一段时间内,DeepSeek的关注度将会持续走高,对于开发者或用户来说,有幸见证了这一波时代的AI红利,如何能够快速应用DeepSeek,做第一波尝鲜的人,本文将先介绍如何基于硅流流动平台快速使用和对接DeepSeek过程。

二、硅基流动介绍

2.1 硅基流动平台介绍

硅基流动(SiliconCloud)是一家致力于打造大模型时代的AI基础设施的公司,主要提供高效、低成本且全面的生成式人工智能(GenAI)模型服务。硅基流动的核心目标是通过优化大模型使用体验,帮助用户实现“Token 自由”,即以更低成本和更高效率使用先进的大语言模型(LLMs)及其他生成式人工智能(AI)模型。

快速入口:硅基流动统一登录 ,注册登录进去之后默认进到模型广场

2.1.1 平台是做什么的

硅基流动是一家专注于大规模AI计算的技术公司,由清华大学高性能计算研究所孙广宇教授团队创立。公司核心团队来自清华大学、MIT等顶尖高校,在高性能计算和AI系统方面有深厚的技术积累。主要产品和服务包括:

  • SiliconLLM: 高性能LLM推理引擎,支持各种主流大语言模型的高效部署。

  • SiliconCloud: 一站式AI云计算平台,提供LLM训练推理等服务。

  • OneDiff: 开源的AI编译框架,可自动优化AI模型性能。

产品核心优势在于深厚的系统优化技术,能大幅提升AI模型的计算效率,帮助企业降低AI部署成本。目标市场主要面向有大规模AI计算需求的企业客户。

2.2 主要特点与功能

硅基流动具备如下特点:

  • 丰富的大模型支持

    • 平台集成多种主流开源大模型,包括文本生成模型如DeepSeek R1 & V3、Qwen2.5、GLM-4、Llama-3.X、Gemma-2、InternLM、Yi-1.5等,以及图片生成模型如Janus-Pro、Stable Diffusion(SDXL)、FLUX等。

  • 多模态模型支持

    • 支持文本生成语音、文本生成图像、文本生成视频等功能。代码生成模型包括Qwen2.5-Coder-32B-Instruct等。

  • 高性价比优势

    • 提供行业内较低的API调用价格,例如Qwen2-72B模型的调用费用仅为4.13元/百万Token。对于9B及以下的模型,平台提供永久免费API服务,适合个人开发者及小型项目使用。

  • 便捷的使用体验

    • 用户无需自建硬件或进行复杂配置,只需通过API调用模型。平台提供统一的API接口,支持多种模型的无缝切换,显著提升开发效率。

  • 推理加速与性能优化

    • 平台内置推理加速引擎(如SiliconLLM和OneDiff),显著提升模型的响应速度及生成效率。支持大模型的微调与托管,用户可根据自定义数据优化模型性能。

  • 免费体验与开发支持

    • 提供免费体验中心(Playground),用户可直接测试文本生成、图像生成、文本生成语音、文本生成视频等功能。提供详尽的文档和社区支持,降低开发门槛,促进开发者使用和创造。

  • 应用接入大模型简单

    • 在该平台上,针对一些主流的大模型,提供了快速便捷的对接入口,方便开发者快速进行接入使用。

2.2.1 适用场景

硅基流动适用于各种需要高效、低成本AI服务的场景,包括但不限于文本生成、图像生成、语音生成、视频生成等。其便捷的使用体验和高性价比的优势使得硅基流动成为开发者和企业在AI应用开发中的理想选择。

  • 企业级 AI 应用开发:

    • 通过低成本的 API 服务,迅速将大模型集成到企业产品中。

  • 个人开发者与 AI 爱好者:

    • 无需依赖昂贵的硬件支持,便可使用顶尖大模型进行实验和创新。

  • 多模态内容生成:

    • 支持文本、语音、图像和视频的生成,适用于内容创作者和设计师。

  • 模型微调与定制:

    • 企业可上传自有数据,对模型进行微调,从而满足特定业务需求。

硅基流动(SiliconCloud)致力于为开发者提供一个集成多种开源大模型并配备优化 API 服务的高效、灵活且经济高效的 AI 开发平台。它不仅支持个人开发者快速将创意转化为实际项目,也为企业用户提供了简化的途径来实现生成式 AI 应用的迅速落地。通过整合这些资源和服务,该平台有效地降低了技术实施的门槛与成本,使得更广泛的用户群体能够轻松接触和应用先进的大语言模型与生成式 AI 技术。

三、硅基流动快速使用

3.1 账户注册

正常注册并登录进去后,进入到展示模型列表页面,即模型广场,可以看到,这里提供了非常多的模型可供选择和使用

3.2 token获取

类似于使用其他的开源大模型,比如ChatGPT,文心一言等,如果你通过平台的方式使用,或者后续集成到代码中进行使用时,需要走token计费,典型的像我们在代码中调用ChatGPT的openai接口时,都是按照token进行计费的,在这里,硅基流动也类似,只不过目前新账号注册之后,官方会默认赠送一定的付费额度

3.2.1 获取token技巧

也可以通过邀请好友注册的方式获取一定额度的token,如下,在我的邀请这里,将邀请链接发送给好友,好友通过这个链接注册成功后,平台就会为你赠送一定的额度。比如在下面的个人邀请列表中可以看到邀请的用户注册信息。

四、Cherry-Studio对接DeepSeek

如何基于上述硅基流动平台在本地使用deepseek呢?这里推荐两个本地客户端工具Cherry-Studio,Chatbox,两个工具都可以作为本地管理AI大模型的工具使用,下面以Cherry-Studio为例进行说明。

4.1 获取 Cherry-Studio

Cherry-Studio下载地址:Cherry Studio - 全能的AI助手

网盘中提供了不同操作系统的安装包,根据你的操作系统进行选择下载即可

我这里选择windows版本的下载到本地之后,直接双击安装即可

安装成功后,启动工具主页如下图所示

4.2 Cherry-Studio配置DeepSeek

4.2.1 设置api密钥

点击右下方的设置按钮,拷贝硅基流动官网上面的那个你创建的apikey到这里

即下面这个密钥,如果还没有的话,点击新建API密钥即可,然后拷贝到上面的那个地方

4.2.2 模型检查

密钥贴进去之后,为了确保后续对接模型能够正常使用,点击后面的检查按钮,在弹出的下拉框中

上一步配置完成之后,在默认模型菜单栏中,将下面的三个选型全部选择为deepseek-v3的这个模型

4.3 与DeepSeek对话

在上面的配置都完成之后,回到消息对话窗口,在顶部就可以看到模型切换为deepseek-v3的模型了

然后你就可以在当前的对话窗口进行对话了,比如在下面我输入了一个早上好,模型就给了回复

  • 这里要注意的是,你在这个窗口与deepseek对话,消耗的是你在硅基流动平台的token额度,因此需要及时关注自己的账户额度情况。

更多的可以自己尝试,可以像使用其他大模型一样使用

费用账单检查,在硅基流动官网的费用账单那里实时关注自己的额度使用情况

4.4 补充说明

在硅基流动官网的文档中心中,从下面的入口点进去

在文档中心的左侧可以发现,除了上面推荐的两种工具,还有很多其他类型的客户端工具可以选择使用,包括怎么在工具中进行配置都有详细的说明

五、应用程序基于硅基流动对接DeepSeek

5.1 获取API文档

如何在应用程序中使用DeepSeek功能呢,如下在硅基流动官网展示的DeepSeek模型详情中,也提供了不同开发语言,以DeepSeek-R1模型为例,进去之后点击API文档

进入到当前模型的API文档对接中心,在这里提供了完善的对接说明,包括种主流开发语言的示例代码

5.2 代码对接硅基流动使用DeepSeek

在文档中心的左侧,可以提供了很多模型能力,比如推理能力,视频转换能力,文本转语音能力等,下面用代码体验下其中的模型能力。

5.2.1 python代码操作示例 - 对话模型能力

参考下面的代码示例,在python程序中使用deepseek,注意替换参数中的token为你自己的

import requestsurl = "https://api.siliconflow.cn/v1/chat/completions"payload = {"model": "deepseek-ai/DeepSeek-V3","messages": [{"role": "user","content": "中国大模型行业2025年将会迎来哪些机遇和挑战?"}],"stream": False,"max_tokens": 512,"stop": ["null"],"temperature": 0.7,"top_p": 0.7,"top_k": 50,"frequency_penalty": 0.5,"n": 1,"response_format": {"type": "text"},"tools": [{"type": "function","function": {"description": "<string>","name": "<string>","parameters": {},"strict": False}}]
}
headers = {"Authorization": "Bearer <token>","Content-Type": "application/json"
}response = requests.request("POST", url, json=payload, headers=headers)print(response.text)

运行上面的代码,在控制台输出了响应结果

5.2.1 python代码操作示例 - 生图模型能力

进入生图模型能力文档中心:创建图片生成请求 - SiliconFlow,可以参考其中的详细说明进行对接。

参考下面的示例代码

import requestsurl = "https://api.siliconflow.cn/v1/images/generations"payload = {"model": "deepseek-ai/Janus-Pro-7B","prompt": "an island near sea, with seagulls, moon shining over the sea, light house, boats int he background, fish flying over the sea","seed": 4999999999
}
headers = {"Authorization": "Bearer 你的apikey","Content-Type": "application/json"
}response = requests.request("POST", url, json=payload, headers=headers)print(response.text)

运行上面的代码,在控制台中输出了生成的图片的url链接,可以在浏览器中打开链接看看效果

六、写在文末

本文详细介绍了硅基流动这个平台的使用,以及如何基于硅基流动对接和使用DeepSeek大模型,最后通过本地客户端工具演示了如何像使用官方的DeepSeek一样去使用,以及如何在代码中集成和使用DeepSeek提供的相关的模型能力,希望对看到的同学有用,本篇到此结束,感谢观看。

相关文章:

【大模型】硅基流动对接DeepSeek使用详解

目录 一、前言 二、硅基流动介绍 2.1 硅基流动平台介绍 2.1.1 平台是做什么的 2.2 主要特点与功能 2.2.1 适用场景 三、硅基流动快速使用 3.1 账户注册 3.2 token获取 3.2.1 获取token技巧 四、Cherry-Studio对接DeepSeek 4.1 获取 Cherry-Studio 4.2 Cherry-Stud…...

[Windows] PDF补丁丁v1.1.0.4627绿色版

[Windows] PDF补丁丁 链接&#xff1a;https://pan.xunlei.com/s/VOIdp50MV2BkOrFott_SCev1A1?pwdvbw4# PDFPatcher 是一款专门用于编辑 PDF 文件的软件&#xff0c;其主要功能包括添加、删除、修改、替换和提取 PDF 文件中的文本、图像、页面等内容&#xff0c;以及支持密码…...

Oracle 变更redo log文件位置

更改Oracle数据库的Redo log文件位置&#xff0c;可以按照以下步骤操作。 1.查询当前Redo log文件信息 select * from v$log; select * from v$logfile;通过查询结果可知Redo log文件放在/oradata/redofile 目录下。 2.拷贝redo log文件到新的位置/Data/redolog $cd /orada…...

使用Redis实现业务信息缓存(缓存详解,缓存更新策略,缓存三大问题)

一、什么是缓存? 缓存是一种高效的数据存储方式,它通过将数据保存在内存中来提供快速的读写访问。这种机制特别适用于需要高速数据访问的应用场景,如网站、应用程序和服务。在处理大量数据和高并发请求时, 缓存能显著提高性能和用户体验。 Redis就是一款常用的缓存中间件。…...

已验证正常,Java输入字符串生成PDF文件

Java输入字符串生成PDF文件过程&#xff1a; 在Java开发中&#xff0c;如何将字符串转换为 PDF 是一个常见的需求。网上找了很多例子都无法生成&#xff0c;经过多次尝试&#xff0c;终于实现了&#xff0c;特此记录一下。 1、引入pom.xml 添加所需的依赖 <dependency>&…...

android手机安装deepseek-r1:1.5b

序 本文主要展示一下如何在android手机上安装deepseek-r1:1.5b 步骤 安装termux 到https://termux.dev/cn/index.html去下载 然后执行termux-setup-storage以获取手机存储权限 安装构建依赖 pkg install git cmake golang下载ollama git clone --depth 1 https://gitee.…...

51单片机俄罗斯方块清屏函数

/************************************************************************************************************** * 名称&#xff1a;LED_Clr * 功能&#xff1a;清屏 * 参数&#xff1a;NULL * 返回&#xff1a;NULL * 备注&#xff1a;temp数组为动态显示数据&#xff…...

PLSQL: 存储过程,用户自定义函数[oracle]

注意: raise notice是高斯的输出语句; DBMS_OUT_PUT.PUT_LINE是oracle的输出语句 存储过程 Stored Procedure 存储过程可以封装数据访问逻辑&#xff0c;使得应用程序可以通过调用存储过程来执行这些逻辑&#xff0c;而不是直接执行SQL语句。这有助于提高代码的可重用性、可…...

深度学习-医学影像诊断

以下以使用深度学习进行医学影像&#xff08;如 X 光片&#xff09;的肺炎诊断为例&#xff0c;为你展示基于 PyTorch 框架的代码实现。我们将构建一个简单的卷积神经网络&#xff08;CNN&#xff09;模型&#xff0c;使用公开的肺炎 X 光影像数据集进行训练和评估。 1. 安装必…...

备战蓝桥杯:双指针(滑动窗口)算法之逛花展

P1638 逛画展 - 洛谷 | 计算机科学教育新生态 这道题我们只要用一个kind和一个mp[N]的数组就能解决了 我们的解法1就是暴力枚举&#xff0c;先固定2&#xff0c;从2开始找连续的满足所有种类的最短的子数组&#xff0c;然后固定5&#xff0c;3&#xff0c;1&#xff0c;3&…...

Linux如何设置软件开机启动呢?

有很多软件&#xff0c;我们安装完之后&#xff0c;服务器一旦重启&#xff0c;软件也需要我们手动再次启动&#xff0c;有很多的软件我们不想手动重启&#xff0c;例如Redis、Mysql、MQ等&#xff0c;那我们怎么配置软件跟着服务器也一起启动呢&#xff0c;今天就给大家带来软…...

Vue(3)

一.生命周期及其四个阶段 Vue生命周期&#xff1a;一个Vue实例从创建到销毁的整个过程 生命周期四个阶段&#xff1a;①创建②挂载③更新④销毁 <body><div id"app"><h3>{{ title }}</h3><div><button click"count--"&…...

11vue3实战-----封装缓存工具

11vue3实战-----封装缓存工具 1.背景2.pinia的持久化思路3.以localStorage为例解决问题4.封装缓存工具 1.背景 在上一章节&#xff0c;实现登录功能时候&#xff0c;当账号密码正确&#xff0c;身份验证成功之后&#xff0c;把用户信息保存起来&#xff0c;是用的pinia。然而p…...

第16章 Single Thread Execution设计模式(Java高并发编程详解:多线程与系统设计)

简单来说&#xff0c; Single Thread Execution就是采用排他式的操作保证在同一时刻只能有一个线程访问共享资源。 1.机场过安检 1.1非线程安全 先模拟一个非线程安全的安检口类&#xff0c;旅客(线程)分别手持登机牌和身份证接受工作人员的检查&#xff0c;示例代码如所示。…...

MySQL 8.0.41 终端修改root密码

1.在 MySQL 命令行中&#xff0c;运行以下命令修改密码 ALTER USER rootlocalhost IDENTIFIED BY new_password; 其中&#xff0c;new_password替换为你想要设置的新密码 2.退出 MySQL终端&#xff0c;重新打开&#xff0c;使用新密码进入&#xff0c;修改成功...

微信小程序案例2——天气微信小程序(学会绑定数据)

文章目录 一、项目步骤1 创建一个weather项目2 进入index.wxml、index.js、index.wxss文件,清空所有内容,进入App.json,修改导航栏标题为“中国天气网”。3进入index.wxml,进行当天天气情况的界面布局,包括温度、最低温、最高温、天气情况、城市、星期、风行情况,代码如下…...

android的Compose 简介

Jetpack Compose 简介 Jetpack Compose 是 Android 官方推出的声明式 UI 工具包&#xff0c;用于替代传统 XML 布局&#xff0c;简化界面开发流程。它基于 Kotlin 语言&#xff0c;通过函数式编程实现高效、灵活的 UI 构建&#xff0c;支持实时预览和更直观的状态管理。 优势…...

缓存实战:Redis 与本地缓存

引言 在现代互联网应用中&#xff0c;缓存是提升系统性能和用户体验的关键技术之一。通过将频繁访问的数据存储在快速访问的存储介质中&#xff0c;可以显著减少对数据库的直接访问压力&#xff0c;从而提高系统的响应速度和吞吐量。 本文将从实战的角度出发&#xff0c;详细…...

apisix的real-ip插件使用说明

k8s集群入口一般都需要过负载均衡&#xff0c;然后再到apisix。 这时候如果后台业务需要获取客户端ip&#xff0c;可能拿到的是lb或者网关的内网ip。 这里一般要获取真实ip需要做几个处理。 1. 负载均衡上&#xff0c;一般支持配置获取真实ip参数&#xff0c;需要配置上。然…...

音视频协议

1. 多媒体信息 1.1 多媒体信息的两个主要特点&#xff1a; 信息量很大 标准语音&#xff1a;64Kbits(8KHz采样&#xff0c;8位编码)高质量音频&#xff1a;3Mbps(100KHz采样&#xff0c;12位编码) 在传输多媒体数据时&#xff0c;对时延和时延抖动均有较高要求 1.2 处理时延…...

Unity3D中Gfx.WaitForPresent优化方案

前言 在Unity中&#xff0c;Gfx.WaitForPresent占用CPU过高通常表示主线程在等待GPU完成渲染&#xff08;即CPU被阻塞&#xff09;&#xff0c;这表明存在GPU瓶颈或垂直同步/帧率设置问题。以下是系统的优化方案&#xff1a; 对惹&#xff0c;这里有一个游戏开发交流小组&…...

《Qt C++ 与 OpenCV:解锁视频播放程序设计的奥秘》

引言:探索视频播放程序设计之旅 在当今数字化时代,多媒体应用已渗透到我们生活的方方面面,从日常的视频娱乐到专业的视频监控、视频会议系统,视频播放程序作为多媒体应用的核心组成部分,扮演着至关重要的角色。无论是在个人电脑、移动设备还是智能电视等平台上,用户都期望…...

vue3 字体颜色设置的多种方式

在Vue 3中设置字体颜色可以通过多种方式实现&#xff0c;这取决于你是想在组件内部直接设置&#xff0c;还是在CSS/SCSS/LESS等样式文件中定义。以下是几种常见的方法&#xff1a; 1. 内联样式 你可以直接在模板中使用style绑定来设置字体颜色。 <template><div :s…...

selenium学习实战【Python爬虫】

selenium学习实战【Python爬虫】 文章目录 selenium学习实战【Python爬虫】一、声明二、学习目标三、安装依赖3.1 安装selenium库3.2 安装浏览器驱动3.2.1 查看Edge版本3.2.2 驱动安装 四、代码讲解4.1 配置浏览器4.2 加载更多4.3 寻找内容4.4 完整代码 五、报告文件爬取5.1 提…...

Spring数据访问模块设计

前面我们已经完成了IoC和web模块的设计&#xff0c;聪明的码友立马就知道了&#xff0c;该到数据访问模块了&#xff0c;要不就这俩玩个6啊&#xff0c;查库势在必行&#xff0c;至此&#xff0c;它来了。 一、核心设计理念 1、痛点在哪 应用离不开数据&#xff08;数据库、No…...

精益数据分析(97/126):邮件营销与用户参与度的关键指标优化指南

精益数据分析&#xff08;97/126&#xff09;&#xff1a;邮件营销与用户参与度的关键指标优化指南 在数字化营销时代&#xff0c;邮件列表效度、用户参与度和网站性能等指标往往决定着创业公司的增长成败。今天&#xff0c;我们将深入解析邮件打开率、网站可用性、页面参与时…...

Python+ZeroMQ实战:智能车辆状态监控与模拟模式自动切换

目录 关键点 技术实现1 技术实现2 摘要&#xff1a; 本文将介绍如何利用Python和ZeroMQ消息队列构建一个智能车辆状态监控系统。系统能够根据时间策略自动切换驾驶模式&#xff08;自动驾驶、人工驾驶、远程驾驶、主动安全&#xff09;&#xff0c;并通过实时消息推送更新车…...

群晖NAS如何在虚拟机创建飞牛NAS

套件中心下载安装Virtual Machine Manager 创建虚拟机 配置虚拟机 飞牛官网下载 https://iso.liveupdate.fnnas.com/x86_64/trim/fnos-0.9.2-863.iso 群晖NAS如何在虚拟机创建飞牛NAS - 个人信息分享...

【学习笔记】erase 删除顺序迭代器后迭代器失效的解决方案

目录 使用 erase 返回值继续迭代使用索引进行遍历 我们知道类似 vector 的顺序迭代器被删除后&#xff0c;迭代器会失效&#xff0c;因为顺序迭代器在内存中是连续存储的&#xff0c;元素删除后&#xff0c;后续元素会前移。 但一些场景中&#xff0c;我们又需要在执行删除操作…...

云原生安全实战:API网关Envoy的鉴权与限流详解

&#x1f525;「炎码工坊」技术弹药已装填&#xff01; 点击关注 → 解锁工业级干货【工具实测|项目避坑|源码燃烧指南】 一、基础概念 1. API网关 作为微服务架构的统一入口&#xff0c;负责路由转发、安全控制、流量管理等核心功能。 2. Envoy 由Lyft开源的高性能云原生…...