当前位置：首页 > news >正文

hugging face inference API返回内容太短的问题

news 2026/5/22 5:09:18

hugging face的inference api返回的内容默认很短，可以通过参数max_new_tokens进行设置：

Detailed parameters

When sending your request, you should send a JSON encoded payload. Here are all the options

All parameters
inputs (required):	a string to be generated from
parameters	dict containing the following keys:
top_k	(Default: `None`). Integer to define the top tokens considered within the `sample` operation to create new text.
top_p	(Default: `None`). Float to define the tokens that are within the `sample` operation of text generation. Add tokens in the sample for more probable to least probable until the sum of the probabilities is greater than `top_p`.
temperature	(Default: `1.0`). Float (0.0-100.0). The temperature of the sampling operation. 1 means regular sampling, `0` means always take the highest score, `100.0` is getting closer to uniform probability.
repetition_penalty	(Default: `None`). Float (0.0-100.0). The more a token is used within generation the more it is penalized to not be picked in successive generation passes.
max_new_tokens	(Default: `None`). Int (0-250). The amount of new tokens to be generated, this does not include the input length it is a estimate of the size of generated text you want. Each new tokens slows down the request, so look for balance between response times and length of text generated.
max_time	(Default: `None`). Float (0-120.0). The amount of time in seconds that the query should take maximum. Network can cause some overhead so it will be a soft limit. Use that in combination with `max_new_tokens` for best results.
return_full_text	(Default: `True`). Bool. If set to False, the return results will not contain the original query making it easier for prompting.
num_return_sequences	(Default: `1`). Integer. The number of proposition you want to be returned.
do_sample	(Optional: `True`). Bool. Whether or not to use sampling, use greedy decoding otherwise.
options	a dict containing the following keys:
use_cache	(Default: `true`). Boolean. There is a cache layer on the inference API to speedup requests we have already seen. Most models can use those results as is as models are deterministic (meaning the results will be the same anyway). However if you use a non deterministic model, you can set this parameter to prevent the caching mechanism from being used resulting in a real new query.
wait_for_model	(Default: `false`) Boolean. If the model is not ready, wait for it instead of receiving 503. It limits the number of requests required to get your inference done. It is advised to only set this flag to true after receiving a 503 error as it will limit hanging in your application to known places.

python示例：

import requestsAPI_URL = "https://api-inference.huggingface.co/models/xxxxxxxxx"
headers = {"Authorization": "Bearer xxxxxxxxxxx"}def query(payload):response = requests.post(API_URL, headers=headers, json=payload)return response.json()output = query({"inputs": "please write a LRU cache in C++ ","parameters": {"max_new_tokens": 250},
})print(output)

hugging face inference API返回内容太短的问题

hugging face的inference api返回的内容默认很短，可以通过参数max_new_tokens进行设置： Detailed parameters When sending your request, you should send a JSON encoded payload. Here are all the options All parametersinputs (required):a str…...

编程日记 2023/9/2 18:57:50

react中redux的详细使用以及持久化处理

一.redux使用 1.安装 npm i redux 例一： 2.创建redux文件夹，store.js文件 store.js文件 import {legacy_createStore as createStore,combineReducers}from "redux" // 每一块状态内容对应一个reducer文件 import {CollApsedReducer} fro…...

编程日记 2023/9/2 18:56:49

论文笔记: 循环神经网络进行速度模型反演 (未完)

摘要: 分享对论文的理解, 原文见 Gabriel Fabien-Ouellet and Rahul Sarkar, Seismic velocity estimation: A deep recurrent neural-network approach. Geophysics (2020) U21–U29. 作者应该是领域专家, 对地球科学的理解胜于深度学习. 为方便讨论, 等式编号保持与原文一致.…...

编程日记 2023/9/2 18:55:47

多维时序 | Matlab实现BiLSTM-Adaboost和BiLSTM多变量时间序列预测对比

多维时序 | Matlab实现BiLSTM-Adaboost和BiLSTM多变量时间序列预测对比目录多维时序 | Matlab实现BiLSTM-Adaboost和BiLSTM多变量时间序列预测对比预测效果基本介绍模型描述程序设计参考资料预测效果基本介绍多维时序 | Matlab实现BiLSTM-Adaboost和BiLSTM多变量时间序列预…...

编程日记 2023/9/2 18:54:46

excel绘制直方图

Excel 2016直方图使用指南 excel绘制各种曲线十分方便，可以通过代码将计算的数据输出到excel里面，然后通过excel的插入标签，绘制各种需要的曲线。对于直方图，横坐标是分布区间，纵坐标是这个区间内数值的频数&#x…...

编程日记 2023/9/2 18:53:45

react-grid-layout 实现原理介绍

简介 React-grid-layout 是一个基于 React 的网格布局库，它可以帮助我们轻松地在网格中管理和排列组件。它提供了一个直观的 API，可以通过配置网格的大小、列数和组件的位置来实现复杂的布局，还支持对网格中组件的拖拽和重新排列。实现诉…...

编程日记 2023/9/2 18:52:43

集合框架-（Collection/Map）

1.单列集合 1.1基础概要集合中存储的是对象的地址信息，想要输出对象的信息，需要在具体的类中重写toString（）方法 Collection代表单列集合，每个元素数据只包含一个值 List集合：添加的元素可以是有序、可…...

编程日记 2023/9/2 18:51:40

什么是单文件组件？

单文件组件形式非单文件组件可以理解为是通过 html 文件来使用 Vue。 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8" /><meta http-equiv"X-UA-Compatible" content"IEedge" /><…...

编程日记 2023/9/2 18:50:39

国际站阿里云服务器多久会重启一次系统？？

阿里云服务器是一种高性能、高可靠的云计算服务，但在长时间运行过程中，系统可能会出现一些问题，需要重启来恢复正常运行。那么，阿里云服务器多久重启一次系统呢？本文将对这个问题进行解答。阿里云服务器重启频率阿里…...

编程日记 2023/9/2 18:49:37

低成本32位单片机电动工具无感方波控制方案

RAMSUN介绍基于灵动32位微处理器MM32SPIN0230的BLDC电动工具无感方波控制方案，包括MM32SPIN0230芯片资源。以下是电动工具无感方波控制方案的简述： MM32SPIN0230电动工具专用板芯片介绍 MM32SPIN0230系列是灵动微MindSPIN旗下高性能的单电机控制产品…...

编程日记 2023/9/2 18:48:36

安防视频监控/视频集中存储/云存储平台EasyCVR平台无法播放HLS协议该如何解决？

视频云存储/安防监控EasyCVR视频汇聚平台基于云边端智能协同，支持海量视频的轻量化接入与汇聚、转码与处理、全网智能分发、视频集中存储等。音视频流媒体视频平台EasyCVR拓展性强，视频能力丰富，具体可实现视频监控直播、视频轮播、视频录像、…...

编程日记 2023/9/2 18:47:35

MySQL如何查找某个字段值相同的数据

当我们想要查找MySQL中某个字段值相同的数据，但我们又不知道这个数据的值是什么的时候该如何操作呢？ 在我的数据表中有单词表以及对应的详细信息表，如果两张表是以单词作为逻辑上的外键时，查询单词详细信息操作就可以根据word值进…...

编程日记 2023/9/2 18:46:33

8.react18并发模式与startTransition(搜索高亮思路)

React 18 之前,渲染是一个单一的,不间断的,同步的事务,一旦渲染开始,就不能被中断 React 18引入并发模式,它允许你将标记更新作为一个transitions,这会告诉React他们可以被中断执行.这样可以将紧急任务先更新,不紧急任务后更新. 将任务给紧急任务先执行, 优先级低的任务后执行…...

编程日记 2023/9/2 18:45:32

前端Vue自定义得分构成水平柱形图组件可用于系统专业门类得分评估分析

引入Vue自定义得分构成水平柱形图组件：cc-horBarChart 随着技术的发展，传统的开发方式使得系统的复杂度越来越高，一个小小的改动或小功能的增加可能会导致整体逻辑的修改，造成牵一发而动全身的情况。为了解决这个问题&#xff0c…...

编程日记 2023/9/2 18:44:28

Linux获取纳秒级别时间

在 Linux 系统中可以使用 gettimeofday 函数来获取时间，这个函数能够以毫秒的精度来获取时间 struct timeval tv;gettimeofday(&tv, NULL);time_t cur_time tv.tv_sec;long cur_time_ms tv.tv_usec/1000;printf(“cur_time %d \n”, cur_time);printf(“cur…...

编程日记 2023/9/2 18:43:28

CSS中你不得不知道的盒子模型

目录 1、CSS的盒子模型1.1 css盒子模型有哪些：1.2 css盒子模型的区别1.3 通过css如何转换css盒子模型 1、CSS的盒子模型 1.1 css盒子模型有哪些： 标准盒子模型、怪异盒子模型（IE盒子模型） 1.2 css盒子模型的区别标准盒子模型&a…...

编程日记 2023/9/2 18:42:26

知识储备--基础算法篇-数组

1.学习 2.数组 2.1第53题-最大子数组和给你一个整数数组 nums ，请你找出一个具有最大和的连续子数组（子数组最少包含一个元素），返回其最大和。子数组是数组中的一个连续部分。心得：一直在纠结这个连续的事情&…...

编程日记 2023/9/2 18:41:25

zookeeper 理论合集

目录系统背景集群结构多个节点之间的角色节点的状态为什么引入 Observer 存储结构 ZNode 节点结构 ZNode 创建类型内存数据存储数据持久化 zookeeper 的容量大小数据同步消息广播崩溃恢复如何保证顺序一致性核心流程 Leader 选举流程脑裂问题 …...

编程日记 2023/9/2 18:40:24

【pyinstaller 怎么打包python，打包后程序闪退不打日志找不到自建模块等问题的踩坑解决】

程序打包踩坑解决的所有问题问题1 多个目录怎么打包不管你包含多个层目录，引用多么复杂，只需要打包主程序所在文件即可，pyinstaller会自动寻找依赖包，如果报错自建模块找不到，参照问题3 pyinstaller main.py问题2…...

编程日记 2023/9/2 18:39:22

【Docker】网络

文章目录 Docker 网络基础Docker网络管理Docker网络架构CNMLibnetwork驱动常见的网络类型 Docker 网络管理命令docker network createdocker network inspectdocker network connectdocker network disconnectdocker network prunedocker network rmdocker network ls docker …...

编程日记 2023/9/2 18:38:21

如何快速掌握Prism-Samples-Wpf交互性编程：InvokeCommandAction事件驱动开发终极指南

如何快速掌握Prism-Samples-Wpf交互性编程：InvokeCommandAction事件驱动开发终极指南【免费下载链接】Prism-Samples-Wpf Samples that demonstrate how to use various Prism features with WPF 项目地址: https://gitcode.com/gh_mirrors/pr/Prism-Samples-Wpf…...

编程新知 2026/5/22 4:31:26

python健身服务管理系统_健身房教练预约系统qeif6f6f

目录同行可拿货,招校园代理 ,本人源头供货商项目概述核心功能技术实现项目特点应用场景项目技术支持源码获取详细视频演示 ：同行可合作点击我获取源码->获取博主联系方式->进我个人主页-->同行可拿货,招校园代理 ,本人源头供货商项目概述 Python健身服务…...

编程新知 2026/5/22 4:25:25

终极GTA5安全增强菜单：YimMenu完整使用指南

终极GTA5安全增强菜单：YimMenu完整使用指南【免费下载链接】YimMenu YimMenu, a GTA V menu protecting against a wide ranges of the public crashes and improving the overall experience. 项目地址: https://gitcode.com/GitHub_Trending/yi/YimMenu Y…...

编程新知 2026/5/22 4:12:57

RAG架构全解析：从基础到高级，打造你的企业级知识库问答系统！

本文详细介绍了RAG（Retrieval-Augmented Generation）架构的多种变体，从基础的Naive RAG和Standard RAG开始，逐步深入到Advanced RAG、Hybrid Search RAG、Rerank型RAG、文档增强型RAG、Agentic RAG、Router RAG、GraphRAG、RAPTOR…...

编程新知 2026/5/22 2:06:33

RK3588 Android系统签名实战：为APK获取系统权限完整指南

1. 项目概述与核心价值在嵌入式Android开发领域，尤其是基于瑞芯微（Rockchip）平台如RK3588进行产品研发时，我们常常会遇到一个核心需求：如何让一个普通的第三方APK应用，获得系统级（System&#x…...

编程新知 2026/5/22 1:55:21

0 基础跨行斩获月薪 10k 实力远不及破局魄力

人生如同奔涌的比特流，暗礁与漩涡总在不经意间出现。当挑战如恶意攻击般袭来，切莫因一时受阻而缴械投降。那些在代码与协议中鏖战的日夜终将铸就铠甲，正如防火墙抵御入侵守护核心，只要目标坚定持续精进，终将在攻防…...

编程新知 2026/5/22 0:03:26

摩尔线程MUSA生态到底解决了什么，没解决什么？——一个开发者的迁移权衡手记

摩尔线程MUSA生态到底解决了什么，没解决什么？——一个开发者的迁移权衡手记先说结论MUSA对CUDA的100%兼容更多是API层面的，解决的是代码能不能跑的问题，但实际性能调优和热点算子库的成熟度才是决定“跑得快不快”的关键。进入SG…...

编程新知 2026/5/21 23:32:48

经手100万+终端后，聊聊校园门锁Sub-1G和Cat.1怎么选

做校园联网门锁项目的人大概都遇到过这个纠结：组网方案到底选Sub-1G还是4G Cat.1？我们团队（KEENZY中科易安）经手了100万在线终端的运行数据，可以明确地说——两种方案没有绝对的优劣，只有场景是否匹配。选错…...

编程新知 2026/5/21 21:40:13

AudioSwitch：一键管理Windows音频设备，告别繁琐系统设置

AudioSwitch：一键管理Windows音频设备，告别繁琐系统设置【免费下载链接】AudioSwitch Switch between default audio input or output change volume 项目地址: https://gitcode.com/gh_mirrors/au/AudioSwitch 音频设备切换是Windows用户经常遇…...

编程新知 2026/5/21 21:35:58

如何确认Excel的识别范围

1.打开想要看的excel sheet2.ALTF11 打开工具VBA3.CTRLG呼出及时窗口4.输入?ActiveSheet.UsedRange.Address...

编程新知 2026/5/21 21:00:53

相关文章：