当前位置: 首页 > news >正文

【大模型】硅基流动对接DeepSeek使用详解

目录

一、前言

二、硅基流动介绍

2.1 硅基流动平台介绍

2.1.1 平台是做什么的

2.2 主要特点与功能

2.2.1 适用场景

三、硅基流动快速使用

3.1 账户注册

3.2 token获取

3.2.1 获取token技巧

四、Cherry-Studio对接DeepSeek

4.1 获取 Cherry-Studio

4.2 Cherry-Studio配置DeepSeek

4.2.1 设置api密钥

4.2.2 模型检查

4.3 与DeepSeek对话

4.4 补充说明

五、应用程序基于硅基流动对接DeepSeek

5.1 获取API文档

5.2 代码对接硅基流动使用DeepSeek

5.2.1 python代码操作示例 - 对话模型能力

5.2.1 python代码操作示例 - 生图模型能力

六、写在文末


一、前言

近期,随着DeepSeek的热度越来越高,各大厂商和大模型平台开始支持对DeepSeek的部署或接入,可以预见在接下来的一段时间内,DeepSeek的关注度将会持续走高,对于开发者或用户来说,有幸见证了这一波时代的AI红利,如何能够快速应用DeepSeek,做第一波尝鲜的人,本文将先介绍如何基于硅流流动平台快速使用和对接DeepSeek过程。

二、硅基流动介绍

2.1 硅基流动平台介绍

硅基流动(SiliconCloud)是一家致力于打造大模型时代的AI基础设施的公司,主要提供高效、低成本且全面的生成式人工智能(GenAI)模型服务。硅基流动的核心目标是通过优化大模型使用体验,帮助用户实现“Token 自由”,即以更低成本和更高效率使用先进的大语言模型(LLMs)及其他生成式人工智能(AI)模型。

快速入口:硅基流动统一登录 ,注册登录进去之后默认进到模型广场

2.1.1 平台是做什么的

硅基流动是一家专注于大规模AI计算的技术公司,由清华大学高性能计算研究所孙广宇教授团队创立。公司核心团队来自清华大学、MIT等顶尖高校,在高性能计算和AI系统方面有深厚的技术积累。主要产品和服务包括:

  • SiliconLLM: 高性能LLM推理引擎,支持各种主流大语言模型的高效部署。

  • SiliconCloud: 一站式AI云计算平台,提供LLM训练推理等服务。

  • OneDiff: 开源的AI编译框架,可自动优化AI模型性能。

产品核心优势在于深厚的系统优化技术,能大幅提升AI模型的计算效率,帮助企业降低AI部署成本。目标市场主要面向有大规模AI计算需求的企业客户。

2.2 主要特点与功能

硅基流动具备如下特点:

  • 丰富的大模型支持

    • 平台集成多种主流开源大模型,包括文本生成模型如DeepSeek R1 & V3、Qwen2.5、GLM-4、Llama-3.X、Gemma-2、InternLM、Yi-1.5等,以及图片生成模型如Janus-Pro、Stable Diffusion(SDXL)、FLUX等。

  • 多模态模型支持

    • 支持文本生成语音、文本生成图像、文本生成视频等功能。代码生成模型包括Qwen2.5-Coder-32B-Instruct等。

  • 高性价比优势

    • 提供行业内较低的API调用价格,例如Qwen2-72B模型的调用费用仅为4.13元/百万Token。对于9B及以下的模型,平台提供永久免费API服务,适合个人开发者及小型项目使用。

  • 便捷的使用体验

    • 用户无需自建硬件或进行复杂配置,只需通过API调用模型。平台提供统一的API接口,支持多种模型的无缝切换,显著提升开发效率。

  • 推理加速与性能优化

    • 平台内置推理加速引擎(如SiliconLLM和OneDiff),显著提升模型的响应速度及生成效率。支持大模型的微调与托管,用户可根据自定义数据优化模型性能。

  • 免费体验与开发支持

    • 提供免费体验中心(Playground),用户可直接测试文本生成、图像生成、文本生成语音、文本生成视频等功能。提供详尽的文档和社区支持,降低开发门槛,促进开发者使用和创造。

  • 应用接入大模型简单

    • 在该平台上,针对一些主流的大模型,提供了快速便捷的对接入口,方便开发者快速进行接入使用。

2.2.1 适用场景

硅基流动适用于各种需要高效、低成本AI服务的场景,包括但不限于文本生成、图像生成、语音生成、视频生成等。其便捷的使用体验和高性价比的优势使得硅基流动成为开发者和企业在AI应用开发中的理想选择。

  • 企业级 AI 应用开发:

    • 通过低成本的 API 服务,迅速将大模型集成到企业产品中。

  • 个人开发者与 AI 爱好者:

    • 无需依赖昂贵的硬件支持,便可使用顶尖大模型进行实验和创新。

  • 多模态内容生成:

    • 支持文本、语音、图像和视频的生成,适用于内容创作者和设计师。

  • 模型微调与定制:

    • 企业可上传自有数据,对模型进行微调,从而满足特定业务需求。

硅基流动(SiliconCloud)致力于为开发者提供一个集成多种开源大模型并配备优化 API 服务的高效、灵活且经济高效的 AI 开发平台。它不仅支持个人开发者快速将创意转化为实际项目,也为企业用户提供了简化的途径来实现生成式 AI 应用的迅速落地。通过整合这些资源和服务,该平台有效地降低了技术实施的门槛与成本,使得更广泛的用户群体能够轻松接触和应用先进的大语言模型与生成式 AI 技术。

三、硅基流动快速使用

3.1 账户注册

正常注册并登录进去后,进入到展示模型列表页面,即模型广场,可以看到,这里提供了非常多的模型可供选择和使用

3.2 token获取

类似于使用其他的开源大模型,比如ChatGPT,文心一言等,如果你通过平台的方式使用,或者后续集成到代码中进行使用时,需要走token计费,典型的像我们在代码中调用ChatGPT的openai接口时,都是按照token进行计费的,在这里,硅基流动也类似,只不过目前新账号注册之后,官方会默认赠送一定的付费额度

3.2.1 获取token技巧

也可以通过邀请好友注册的方式获取一定额度的token,如下,在我的邀请这里,将邀请链接发送给好友,好友通过这个链接注册成功后,平台就会为你赠送一定的额度。比如在下面的个人邀请列表中可以看到邀请的用户注册信息。

四、Cherry-Studio对接DeepSeek

如何基于上述硅基流动平台在本地使用deepseek呢?这里推荐两个本地客户端工具Cherry-Studio,Chatbox,两个工具都可以作为本地管理AI大模型的工具使用,下面以Cherry-Studio为例进行说明。

4.1 获取 Cherry-Studio

Cherry-Studio下载地址:Cherry Studio - 全能的AI助手

网盘中提供了不同操作系统的安装包,根据你的操作系统进行选择下载即可

我这里选择windows版本的下载到本地之后,直接双击安装即可

安装成功后,启动工具主页如下图所示

4.2 Cherry-Studio配置DeepSeek

4.2.1 设置api密钥

点击右下方的设置按钮,拷贝硅基流动官网上面的那个你创建的apikey到这里

即下面这个密钥,如果还没有的话,点击新建API密钥即可,然后拷贝到上面的那个地方

4.2.2 模型检查

密钥贴进去之后,为了确保后续对接模型能够正常使用,点击后面的检查按钮,在弹出的下拉框中

上一步配置完成之后,在默认模型菜单栏中,将下面的三个选型全部选择为deepseek-v3的这个模型

4.3 与DeepSeek对话

在上面的配置都完成之后,回到消息对话窗口,在顶部就可以看到模型切换为deepseek-v3的模型了

然后你就可以在当前的对话窗口进行对话了,比如在下面我输入了一个早上好,模型就给了回复

  • 这里要注意的是,你在这个窗口与deepseek对话,消耗的是你在硅基流动平台的token额度,因此需要及时关注自己的账户额度情况。

更多的可以自己尝试,可以像使用其他大模型一样使用

费用账单检查,在硅基流动官网的费用账单那里实时关注自己的额度使用情况

4.4 补充说明

在硅基流动官网的文档中心中,从下面的入口点进去

在文档中心的左侧可以发现,除了上面推荐的两种工具,还有很多其他类型的客户端工具可以选择使用,包括怎么在工具中进行配置都有详细的说明

五、应用程序基于硅基流动对接DeepSeek

5.1 获取API文档

如何在应用程序中使用DeepSeek功能呢,如下在硅基流动官网展示的DeepSeek模型详情中,也提供了不同开发语言,以DeepSeek-R1模型为例,进去之后点击API文档

进入到当前模型的API文档对接中心,在这里提供了完善的对接说明,包括种主流开发语言的示例代码

5.2 代码对接硅基流动使用DeepSeek

在文档中心的左侧,可以提供了很多模型能力,比如推理能力,视频转换能力,文本转语音能力等,下面用代码体验下其中的模型能力。

5.2.1 python代码操作示例 - 对话模型能力

参考下面的代码示例,在python程序中使用deepseek,注意替换参数中的token为你自己的

import requestsurl = "https://api.siliconflow.cn/v1/chat/completions"payload = {"model": "deepseek-ai/DeepSeek-V3","messages": [{"role": "user","content": "中国大模型行业2025年将会迎来哪些机遇和挑战?"}],"stream": False,"max_tokens": 512,"stop": ["null"],"temperature": 0.7,"top_p": 0.7,"top_k": 50,"frequency_penalty": 0.5,"n": 1,"response_format": {"type": "text"},"tools": [{"type": "function","function": {"description": "<string>","name": "<string>","parameters": {},"strict": False}}]
}
headers = {"Authorization": "Bearer <token>","Content-Type": "application/json"
}response = requests.request("POST", url, json=payload, headers=headers)print(response.text)

运行上面的代码,在控制台输出了响应结果

5.2.1 python代码操作示例 - 生图模型能力

进入生图模型能力文档中心:创建图片生成请求 - SiliconFlow,可以参考其中的详细说明进行对接。

参考下面的示例代码

import requestsurl = "https://api.siliconflow.cn/v1/images/generations"payload = {"model": "deepseek-ai/Janus-Pro-7B","prompt": "an island near sea, with seagulls, moon shining over the sea, light house, boats int he background, fish flying over the sea","seed": 4999999999
}
headers = {"Authorization": "Bearer 你的apikey","Content-Type": "application/json"
}response = requests.request("POST", url, json=payload, headers=headers)print(response.text)

运行上面的代码,在控制台中输出了生成的图片的url链接,可以在浏览器中打开链接看看效果

六、写在文末

本文详细介绍了硅基流动这个平台的使用,以及如何基于硅基流动对接和使用DeepSeek大模型,最后通过本地客户端工具演示了如何像使用官方的DeepSeek一样去使用,以及如何在代码中集成和使用DeepSeek提供的相关的模型能力,希望对看到的同学有用,本篇到此结束,感谢观看。

相关文章:

【大模型】硅基流动对接DeepSeek使用详解

目录 一、前言 二、硅基流动介绍 2.1 硅基流动平台介绍 2.1.1 平台是做什么的 2.2 主要特点与功能 2.2.1 适用场景 三、硅基流动快速使用 3.1 账户注册 3.2 token获取 3.2.1 获取token技巧 四、Cherry-Studio对接DeepSeek 4.1 获取 Cherry-Studio 4.2 Cherry-Stud…...

[Windows] PDF补丁丁v1.1.0.4627绿色版

[Windows] PDF补丁丁 链接&#xff1a;https://pan.xunlei.com/s/VOIdp50MV2BkOrFott_SCev1A1?pwdvbw4# PDFPatcher 是一款专门用于编辑 PDF 文件的软件&#xff0c;其主要功能包括添加、删除、修改、替换和提取 PDF 文件中的文本、图像、页面等内容&#xff0c;以及支持密码…...

Oracle 变更redo log文件位置

更改Oracle数据库的Redo log文件位置&#xff0c;可以按照以下步骤操作。 1.查询当前Redo log文件信息 select * from v$log; select * from v$logfile;通过查询结果可知Redo log文件放在/oradata/redofile 目录下。 2.拷贝redo log文件到新的位置/Data/redolog $cd /orada…...

使用Redis实现业务信息缓存(缓存详解,缓存更新策略,缓存三大问题)

一、什么是缓存? 缓存是一种高效的数据存储方式,它通过将数据保存在内存中来提供快速的读写访问。这种机制特别适用于需要高速数据访问的应用场景,如网站、应用程序和服务。在处理大量数据和高并发请求时, 缓存能显著提高性能和用户体验。 Redis就是一款常用的缓存中间件。…...

已验证正常,Java输入字符串生成PDF文件

Java输入字符串生成PDF文件过程&#xff1a; 在Java开发中&#xff0c;如何将字符串转换为 PDF 是一个常见的需求。网上找了很多例子都无法生成&#xff0c;经过多次尝试&#xff0c;终于实现了&#xff0c;特此记录一下。 1、引入pom.xml 添加所需的依赖 <dependency>&…...

android手机安装deepseek-r1:1.5b

序 本文主要展示一下如何在android手机上安装deepseek-r1:1.5b 步骤 安装termux 到https://termux.dev/cn/index.html去下载 然后执行termux-setup-storage以获取手机存储权限 安装构建依赖 pkg install git cmake golang下载ollama git clone --depth 1 https://gitee.…...

51单片机俄罗斯方块清屏函数

/************************************************************************************************************** * 名称&#xff1a;LED_Clr * 功能&#xff1a;清屏 * 参数&#xff1a;NULL * 返回&#xff1a;NULL * 备注&#xff1a;temp数组为动态显示数据&#xff…...

PLSQL: 存储过程,用户自定义函数[oracle]

注意: raise notice是高斯的输出语句; DBMS_OUT_PUT.PUT_LINE是oracle的输出语句 存储过程 Stored Procedure 存储过程可以封装数据访问逻辑&#xff0c;使得应用程序可以通过调用存储过程来执行这些逻辑&#xff0c;而不是直接执行SQL语句。这有助于提高代码的可重用性、可…...

深度学习-医学影像诊断

以下以使用深度学习进行医学影像&#xff08;如 X 光片&#xff09;的肺炎诊断为例&#xff0c;为你展示基于 PyTorch 框架的代码实现。我们将构建一个简单的卷积神经网络&#xff08;CNN&#xff09;模型&#xff0c;使用公开的肺炎 X 光影像数据集进行训练和评估。 1. 安装必…...

备战蓝桥杯:双指针(滑动窗口)算法之逛花展

P1638 逛画展 - 洛谷 | 计算机科学教育新生态 这道题我们只要用一个kind和一个mp[N]的数组就能解决了 我们的解法1就是暴力枚举&#xff0c;先固定2&#xff0c;从2开始找连续的满足所有种类的最短的子数组&#xff0c;然后固定5&#xff0c;3&#xff0c;1&#xff0c;3&…...

Linux如何设置软件开机启动呢?

有很多软件&#xff0c;我们安装完之后&#xff0c;服务器一旦重启&#xff0c;软件也需要我们手动再次启动&#xff0c;有很多的软件我们不想手动重启&#xff0c;例如Redis、Mysql、MQ等&#xff0c;那我们怎么配置软件跟着服务器也一起启动呢&#xff0c;今天就给大家带来软…...

Vue(3)

一.生命周期及其四个阶段 Vue生命周期&#xff1a;一个Vue实例从创建到销毁的整个过程 生命周期四个阶段&#xff1a;①创建②挂载③更新④销毁 <body><div id"app"><h3>{{ title }}</h3><div><button click"count--"&…...

11vue3实战-----封装缓存工具

11vue3实战-----封装缓存工具 1.背景2.pinia的持久化思路3.以localStorage为例解决问题4.封装缓存工具 1.背景 在上一章节&#xff0c;实现登录功能时候&#xff0c;当账号密码正确&#xff0c;身份验证成功之后&#xff0c;把用户信息保存起来&#xff0c;是用的pinia。然而p…...

第16章 Single Thread Execution设计模式(Java高并发编程详解:多线程与系统设计)

简单来说&#xff0c; Single Thread Execution就是采用排他式的操作保证在同一时刻只能有一个线程访问共享资源。 1.机场过安检 1.1非线程安全 先模拟一个非线程安全的安检口类&#xff0c;旅客(线程)分别手持登机牌和身份证接受工作人员的检查&#xff0c;示例代码如所示。…...

MySQL 8.0.41 终端修改root密码

1.在 MySQL 命令行中&#xff0c;运行以下命令修改密码 ALTER USER rootlocalhost IDENTIFIED BY new_password; 其中&#xff0c;new_password替换为你想要设置的新密码 2.退出 MySQL终端&#xff0c;重新打开&#xff0c;使用新密码进入&#xff0c;修改成功...

微信小程序案例2——天气微信小程序(学会绑定数据)

文章目录 一、项目步骤1 创建一个weather项目2 进入index.wxml、index.js、index.wxss文件,清空所有内容,进入App.json,修改导航栏标题为“中国天气网”。3进入index.wxml,进行当天天气情况的界面布局,包括温度、最低温、最高温、天气情况、城市、星期、风行情况,代码如下…...

android的Compose 简介

Jetpack Compose 简介 Jetpack Compose 是 Android 官方推出的声明式 UI 工具包&#xff0c;用于替代传统 XML 布局&#xff0c;简化界面开发流程。它基于 Kotlin 语言&#xff0c;通过函数式编程实现高效、灵活的 UI 构建&#xff0c;支持实时预览和更直观的状态管理。 优势…...

缓存实战:Redis 与本地缓存

引言 在现代互联网应用中&#xff0c;缓存是提升系统性能和用户体验的关键技术之一。通过将频繁访问的数据存储在快速访问的存储介质中&#xff0c;可以显著减少对数据库的直接访问压力&#xff0c;从而提高系统的响应速度和吞吐量。 本文将从实战的角度出发&#xff0c;详细…...

apisix的real-ip插件使用说明

k8s集群入口一般都需要过负载均衡&#xff0c;然后再到apisix。 这时候如果后台业务需要获取客户端ip&#xff0c;可能拿到的是lb或者网关的内网ip。 这里一般要获取真实ip需要做几个处理。 1. 负载均衡上&#xff0c;一般支持配置获取真实ip参数&#xff0c;需要配置上。然…...

音视频协议

1. 多媒体信息 1.1 多媒体信息的两个主要特点&#xff1a; 信息量很大 标准语音&#xff1a;64Kbits(8KHz采样&#xff0c;8位编码)高质量音频&#xff1a;3Mbps(100KHz采样&#xff0c;12位编码) 在传输多媒体数据时&#xff0c;对时延和时延抖动均有较高要求 1.2 处理时延…...

第一财经对话东土科技 | 探索工业科技新边界

当前以ChatGPT、Sora等为代表的生成式人工智能快速发展&#xff0c;越来越多面向垂直场景的行业大模型涌现出来&#xff0c;并成为推动制造业智能化改造与数字化转型、加快推进新型工业化&#xff0c;进而培育发展新质生产力的新引擎。 在垂类场景的应用落地&#xff0c;是AI发…...

Maven 与企业项目的集成

1. Maven 在企业级项目中的作用 Maven 是 Java 生态中最流行的构建和依赖管理工具&#xff0c;广泛用于企业级项目的构建、依赖管理、测试、打包、部署和 CI/CD 集成。对于大型企业项目&#xff0c;Maven 提供了一整套标准化的构建流程&#xff0c;并支持 多模块&#xff08;M…...

激活函数篇 01 —— 激活函数在神经网络的作用

欢迎来到我的主页&#xff1a;【Echo-Nie】 本篇文章收录于专栏【机器学习】 以下是激活函数系列的相关的所有内容: 激活函数篇 01 —— 一文搞懂激活函数在神经网络中的作用 逻辑回归&#xff1a;Sigmoid函数在分类问题中的应用 1 激活函数的作用 1.1 引入非线性 激活函数…...

22.2、Apache安全分析与增强

目录 Apache Web安全分析与增强 - Apache Web概述Apache Web安全分析与增强 - Apache Web安全威胁Apache Web安全机制Apache Web安全增强 Apache Web安全分析与增强 - Apache Web概述 阿帕奇是一个用于搭建WEB服务器的应用程序&#xff0c;它是开源的&#xff0c;它的配置文件…...

Day.23

leetcode 413.等差数列划分 问题&#xff1a;如果一个数列 至少有三个元素 &#xff0c;并且任意两个相邻元素之差相同&#xff0c;则称该数列为等差数列。给你一个整数数组 nums &#xff0c;返回数组 nums 中所有为等差数组的 子数组 个数。 子数组 是数组中的一个连续序列…...

CentOS虚机在线扩容系统盘数据盘

最近在制作Openstack下的镜像&#xff0c;用户需要CentOS6以及CentOS7的虚机镜像&#xff0c;遇到了些关于系统盘以及数据盘在线扩容的问题&#xff0c;故此整理一下。 ​ 传统我们想对磁盘在线热扩容&#xff0c;必然会想到LVM逻辑卷。如果没有LVM逻辑卷的情况下&#xff0c;…...

动手写ORM框架 - GeeORM第一天 database/sql 基础

文章目录 1 初识 SQLite2 database/sql 标准库3 实现一个简单的 log 库4 核心结构 Session本文是7天用Go从零实现ORM框架GeeORM的第一篇。介绍了 SQLite 的基础操作(连接数据库,创建表、增删记录等)。使用 Go 语言标准库 database/sql 连接并操作 SQLite 数据库,并简单封装…...

绘制中国平安股价的交互式 K 线图

在本文中,探索如何使用 Python 的强大库进行股市数据分析与可视化。我们将以中国平安(股票代码:sh601318)为例,展示如何获取其股票数据,并绘制一张交互式 K 线图。 K 线图是股市分析中不可或缺的工具,它能够直观地显示股票的波动情况,包括开盘价、收盘价、最高价和最低…...

[渗透测试]热门搜索引擎推荐— — shodan篇

[渗透测试]热门搜索引擎推荐— — shodan篇 免责声明&#xff1a;本文仅用于分享渗透测试工具&#xff0c;大家使用时&#xff0c;一定需要遵守相关法律法规。 除了shodan&#xff0c;还有很多其他热门的&#xff0c;比如&#xff1a;fofa、奇安信的鹰图、钟馗之眼等&#xff0…...

JavaScript 在 VSCode 中的优势与应用

JavaScript 在 VSCode 中的优势与应用 引言 随着前端技术的发展,JavaScript 已经成为了网页开发中最流行的编程语言之一。Visual Studio Code(简称 VSCode)作为一款轻量级、可扩展的代码编辑器,因其强大的功能和良好的用户体验,深受广大开发者的喜爱。本文将探讨 JavaSc…...