当前位置: 首页 > article >正文

CANN/asc-devkit Ascend C矢量压缩API

asc_squeeze【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit产品支持情况产品是否支持Ascend 950PR/Ascend 950DT√功能说明将src中被mask选择的有效元素依次复制到dst有效元素在dst上连续排列。dst中剩余位置元素置为0。asc_squeeze_v2接口搭配asc_storeunalign_postupdate接口使用时会将有效数据大小保存至AR寄存器搬出时使用该值作为存储偏移量。AR寄存器中的数值可以通过asc_get_ar_spr接口获取。函数原型__simd_callee__ inline void asc_squeeze(vector_int8_t dst, vector_int8_t src, vector_bool mask) __simd_callee__ inline void asc_squeeze(vector_uint8_t dst, vector_uint8_t src, vector_bool mask) __simd_callee__ inline void asc_squeeze(vector_hifloat8_t dst, vector_hifloat8_t src, vector_bool mask) __simd_callee__ inline void asc_squeeze(vector_fp8_e5m2_t dst, vector_fp8_e5m2_t src, vector_bool mask) __simd_callee__ inline void asc_squeeze(vector_fp8_e4m3fn_t dst, vector_fp8_e4m3fn_t src, vector_bool mask) __simd_callee__ inline void asc_squeeze(vector_fp8_e8m0_t dst, vector_fp8_e8m0_t src, vector_bool mask) __simd_callee__ inline void asc_squeeze(vector_int16_t dst, vector_int16_t src, vector_bool mask) __simd_callee__ inline void asc_squeeze(vector_uint16_t dst, vector_uint16_t src, vector_bool mask) __simd_callee__ inline void asc_squeeze(vector_half dst, vector_half src, vector_bool mask) __simd_callee__ inline void asc_squeeze(vector_bfloat16_t dst, vector_bfloat16_t src, vector_bool mask) __simd_callee__ inline void asc_squeeze(vector_int32_t dst, vector_int32_t src, vector_bool mask) __simd_callee__ inline void asc_squeeze(vector_uint32_t dst, vector_uint32_t src, vector_bool mask) __simd_callee__ inline void asc_squeeze(vector_float dst, vector_float src, vector_bool mask) __simd_callee__ inline void asc_squeeze_v2(vector_int8_t dst, vector_int8_t src, vector_bool mask) __simd_callee__ inline void asc_squeeze_v2(vector_uint8_t dst, vector_uint8_t src, vector_bool mask) __simd_callee__ inline void asc_squeeze_v2(vector_hifloat8_t dst, vector_hifloat8_t src, vector_bool mask) __simd_callee__ inline void asc_squeeze_v2(vector_fp8_e5m2_t dst, vector_fp8_e5m2_t src, vector_bool mask) __simd_callee__ inline void asc_squeeze_v2(vector_fp8_e4m3fn_t dst, vector_fp8_e4m3fn_t src, vector_bool mask) __simd_callee__ inline void asc_squeeze_v2(vector_fp8_e8m0_t dst, vector_fp8_e8m0_t src, vector_bool mask) __simd_callee__ inline void asc_squeeze_v2(vector_int16_t dst, vector_int16_t src, vector_bool mask) __simd_callee__ inline void asc_squeeze_v2(vector_uint16_t dst, vector_uint16_t src, vector_bool mask) __simd_callee__ inline void asc_squeeze_v2(vector_half dst, vector_half src, vector_bool mask) __simd_callee__ inline void asc_squeeze_v2(vector_bfloat16_t dst, vector_bfloat16_t src, vector_bool mask) __simd_callee__ inline void asc_squeeze_v2(vector_int32_t dst, vector_int32_t src, vector_bool mask) __simd_callee__ inline void asc_squeeze_v2(vector_uint32_t dst, vector_uint32_t src, vector_bool mask) __simd_callee__ inline void asc_squeeze_v2(vector_float dst, vector_float src, vector_bool mask)参数说明参数名输入/输出描述dst输出目的操作数矢量数据寄存器。src输入源操作数矢量数据寄存器。mask输入源操作数掩码掩码寄存器用于指示在计算过程中哪些元素参与计算。对应位置为1时参与计算为0时不参与计算。mask未筛选的元素在输出中置零。矢量数据寄存器和掩码寄存器的详细说明请参见reg数据类型定义.md。返回值说明无流水类型PIPE_V约束说明无调用示例vector_int8_t src; vector_bool mask asc_create_mask_b8(PAT_ALL); asc_loadalign(src, src_addr); // src_addr是外部输入的UB内存空间地址。 vector_int8_t dst; asc_squeeze(dst, src, mask);vector_int8_t src; vector_bool mask asc_create_mask_b8(PAT_ALL); asc_loadalign(src, src_addr); // src_addr是外部输入的UB内存空间地址。 vector_int8_t dst; asc_squeeze_v2(dst, src, mask);【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

相关文章:

CANN/asc-devkit Ascend C矢量压缩API

asc_squeeze 【免费下载链接】asc-devkit 本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。 项目地址: https://gitcode.co…...

KaTrain围棋AI:如何用数据可视化与智能分析重塑围棋学习体验

KaTrain围棋AI:如何用数据可视化与智能分析重塑围棋学习体验 【免费下载链接】katrain Improve your Baduk skills by training with KataGo! 项目地址: https://gitcode.com/gh_mirrors/ka/katrain 围棋作为一项拥有数千年历史的智力运动,其学习…...

Linux调度器演进:从O(1)到CFS再到EEVDF

Linux 进程调度演化史:从 O(n) 到 CFS 再到 EEVDF,30 年调度器的三次跃迁 进程调度是操作系统的脉搏。这篇文章不堆概念,带你从 Linux 0.01 走到内核 6.6,看懂调度器为什么这样设计,以及每次重构到底解决了什么问题。 …...

DownKyi跨平台版终极指南:B站视频下载与音视频分离完整教程

DownKyi跨平台版终极指南:B站视频下载与音视频分离完整教程 【免费下载链接】downkyicore 哔哩下载姬(跨平台版)downkyi,哔哩哔哩网站视频下载工具,支持批量下载,支持8K、HDR、杜比视界,提供工具箱(音视频提…...

image.nvim高级功能:虚拟填充、窗口重叠处理完全解析

image.nvim高级功能:虚拟填充、窗口重叠处理完全解析 【免费下载链接】image.nvim 🖼️ Bringing images to Neovim. 项目地址: https://gitcode.com/gh_mirrors/im/image.nvim image.nvim是一款专为Neovim打造的图片显示插件,它突破了…...

微信小程序二维码生成实战指南:weapp-qrcode高效解决方案

微信小程序二维码生成实战指南:weapp-qrcode高效解决方案 【免费下载链接】weapp-qrcode 微信小程序快速生成二维码,支持回调函数返回二维码临时文件 项目地址: https://gitcode.com/gh_mirrors/weap/weapp-qrcode 在微信小程序开发中&#xff0c…...

Aimmy终极模型选择指南:5个秘诀帮你为不同游戏找到最佳ONNX模型

Aimmy终极模型选择指南:5个秘诀帮你为不同游戏找到最佳ONNX模型 【免费下载链接】Aimmy Universal Second Eye for Gamers with Impairments (Universal AI Aim Aligner (AI Aimbot) - ONNX/YOLOv8 - C#) 项目地址: https://gitcode.com/gh_mirrors/ai/Aimmy …...

macOS用户必看:vscode-icons安装与使用完整手册

macOS用户必看:vscode-icons安装与使用完整手册 【免费下载链接】vscode-icons Custom Visual Studio Code Icons 项目地址: https://gitcode.com/gh_mirrors/vsc/vscode-icons 想要为你的Visual Studio Code换上个性化图标吗?vscode-icons项目提…...

开源数字微流控实验室平台:用电场操控微观世界的革命性技术

开源数字微流控实验室平台:用电场操控微观世界的革命性技术 【免费下载链接】OpenDrop Open Source Digital Microfluidics Bio Lab 项目地址: https://gitcode.com/gh_mirrors/ope/OpenDrop 想象一下,在生物实验室中,研究员需要精确操…...

Pocket Sync:Analogue Pocket玩家的终极游戏管理解决方案

Pocket Sync:Analogue Pocket玩家的终极游戏管理解决方案 【免费下载链接】pocket-sync A GUI tool (Mac, Windows, Linux) for doing stuff with the Analogue Pocket 项目地址: https://gitcode.com/gh_mirrors/po/pocket-sync 想象一下,你刚刚…...

OpenHTMLtoPDF终极指南:三步实现专业PDF文档生成

OpenHTMLtoPDF终极指南:三步实现专业PDF文档生成 【免费下载链接】openhtmltopdf An HTML to PDF library for the JVM. Based on Flying Saucer and Apache PDF-BOX 2. With SVG image support. Now also with accessible PDF support (WCAG, Section 508, PDF/UA)…...

CANN/asc-devkit MakeNDLayout函数

MakeNDLayout 【免费下载链接】asc-devkit 本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。 项目地址: https://gitcode.c…...

UxPlay应用场景:从家庭娱乐到企业演示的全面解决方案

UxPlay应用场景:从家庭娱乐到企业演示的全面解决方案 【免费下载链接】UxPlay AirPlay Unix mirroring server 项目地址: https://gitcode.com/gh_mirrors/uxp/UxPlay UxPlay是一款功能强大的AirPlay Unix镜像服务器,它让Linux、macOS和Unix系统能…...

Lemur性能优化:10个提升证书管理平台响应速度的技巧

Lemur性能优化:10个提升证书管理平台响应速度的技巧 【免费下载链接】lemur Repository for the Lemur Certificate Manager 项目地址: https://gitcode.com/gh_mirrors/le/lemur Lemur作为一款开源证书管理平台,能够帮助用户轻松管理SSL/TLS证书…...

3步搞定歌词管理难题:LDDC歌词下载工具的完整实战指南

3步搞定歌词管理难题:LDDC歌词下载工具的完整实战指南 【免费下载链接】LDDC 简单易用的精准歌词(逐字歌词/卡拉OK歌词)下载匹配工具|A simple and user-friendly tool for downloading and matching precise lyrics (word-by-word lyrics/Karaoke lyrics) 项目地…...

Vue-antd样式系统深度解析:从主题定制到组件样式覆盖的完整指南

Vue-antd样式系统深度解析:从主题定制到组件样式覆盖的完整指南 【免费下载链接】vue-antd Vue UI Component & Ant.Design 项目地址: https://gitcode.com/gh_mirrors/vu/vue-antd Vue-antd作为Ant Design的Vue实现,提供了一个强大而灵活的样…...

Sixpack Redis数据存储策略:高效管理A/B测试数据的10个技巧

Sixpack Redis数据存储策略:高效管理A/B测试数据的10个技巧 【免费下载链接】sixpack Sixpack is a language-agnostic a/b-testing framework 项目地址: https://gitcode.com/gh_mirrors/si/sixpack Sixpack是一个语言无关的A/B测试框架,它通过R…...

CANN/pypto张量创建指南

Tensor的创建 【免费下载链接】pypto PyPTO(发音: pai p-t-o):Parallel Tensor/Tile Operation编程范式。 项目地址: https://gitcode.com/cann/pypto Tensor是PyPTO中的基本数据结构,用于表示将在计算图中使用并在NPU上执…...

Closures实战指南:简化UITableView和UICollectionView数据绑定的终极教程 [特殊字符]

Closures实战指南:简化UITableView和UICollectionView数据绑定的终极教程 🚀 【免费下载链接】Closures Swifty closures for UIKit and Foundation 项目地址: https://gitcode.com/gh_mirrors/cl/Closures Closures是一个强大的iOS框架&#xff…...

yt-fts高级配置技巧:数据库路径、Chroma设置与性能优化

yt-fts高级配置技巧:数据库路径、Chroma设置与性能优化 【免费下载链接】yt-fts YouTube Full Text Search - Search all of YouTube from the command line 项目地址: https://gitcode.com/gh_mirrors/yt/yt-fts yt-fts是一款强大的YouTube全文搜索工具&…...

FLUX.1-dev FP8量化模型:让中低端显卡畅享专业级AI图像生成的终极方案

FLUX.1-dev FP8量化模型:让中低端显卡畅享专业级AI图像生成的终极方案 【免费下载链接】flux1-dev 项目地址: https://ai.gitcode.com/hf_mirrors/Comfy-Org/flux1-dev 在AI图像生成技术快速发展的今天,硬件限制成为许多开发者和创作者面临的主要…...

Legacy Update完整指南:让老旧Windows系统重获安全更新的5步教程

Legacy Update完整指南:让老旧Windows系统重获安全更新的5步教程 【免费下载链接】LegacyUpdate Get back online, activate, and install updates on your legacy Windows PC 项目地址: https://gitcode.com/gh_mirrors/le/LegacyUpdate 还在为Windows XP、…...

终极LDDC歌词工具指南:如何快速获取完美同步的逐字歌词

终极LDDC歌词工具指南:如何快速获取完美同步的逐字歌词 【免费下载链接】LDDC 简单易用的精准歌词(逐字歌词/卡拉OK歌词)下载匹配工具|A simple and user-friendly tool for downloading and matching precise lyrics (word-by-word lyrics/Karaoke lyrics) 项目地…...

揭秘硬件安全:ChipWhisperer如何成为嵌入式设备的安全守护神?

揭秘硬件安全:ChipWhisperer如何成为嵌入式设备的安全守护神? 【免费下载链接】chipwhisperer ChipWhisperer - the complete open-source toolchain for side-channel power analysis and glitching attacks 项目地址: https://gitcode.com/gh_mirror…...

FARM问答系统调优终极指南:置信度校准与答案排序策略详解

FARM问答系统调优终极指南:置信度校准与答案排序策略详解 【免费下载链接】FARM :house_with_garden: Fast & easy transfer learning for NLP. Harvesting language models for the industry. Focus on Question Answering. 项目地址: https://gitcode.com/g…...

Mainframer错误排查指南:常见问题及解决方法大全

Mainframer错误排查指南:常见问题及解决方法大全 【免费下载链接】mainframer Tool for remote builds. Sync project to remote machine, execute command, sync back. 项目地址: https://gitcode.com/gh_mirrors/ma/mainframer Mainframer是一款高效的远程…...

Tonzhon音乐:纯净无干扰的现代音乐播放平台终极指南

Tonzhon音乐:纯净无干扰的现代音乐播放平台终极指南 【免费下载链接】tonzhon-music 铜钟 Tonzhon (tonzhon.whamon.com): 干净纯粹的音乐平台 (铜钟已不再使用 tonzhon.com,现在的 tonzhon.com 不是正版的铜钟) 项目地址: https://gitcode.com/GitHub…...

终极指南:如何用Continue实现AI驱动的代码检查与PR自动化审查

终极指南:如何用Continue实现AI驱动的代码检查与PR自动化审查 【免费下载链接】continue ⏩ Source-controlled AI checks, enforceable in CI. Powered by the open-source Continue CLI 项目地址: https://gitcode.com/GitHub_Trending/co/continue Contin…...

智能交易系统:如何用AI重塑你的投资决策流程?

智能交易系统:如何用AI重塑你的投资决策流程? 【免费下载链接】TradingAgents-CN 基于多智能体LLM的中文金融交易框架 - TradingAgents中文增强版 项目地址: https://gitcode.com/GitHub_Trending/tr/TradingAgents-CN 在量化投资的世界里&#x…...

铜钟音乐平台完整指南:三步打造纯净无干扰的听歌体验

铜钟音乐平台完整指南:三步打造纯净无干扰的听歌体验 【免费下载链接】tonzhon-music 铜钟 Tonzhon (tonzhon.whamon.com): 干净纯粹的音乐平台 (铜钟已不再使用 tonzhon.com,现在的 tonzhon.com 不是正版的铜钟) 项目地址: https://gitcode.com/GitHu…...