当前位置: 首页 > article >正文

GitHub爆火!基于Gemini的开源PPT生成神器,每页都是AI原创设计

这是一个或许对你有用的社群 一对一交流/面试小册/简历优化/求职解惑欢迎加入「芋道快速开发平台」知识星球。下面是星球提供的部分资料《项目实战视频》从书中学往事上“练”《互联网高频面试题》面朝简历学习春暖花开《架构 x 系统设计》摧枯拉朽掌控面试高频场景题《精进 Java 学习指南》系统学习互联网主流技术栈《必读 Java 源码专栏》知其然知其所以然这是一个或许对你有用的开源项目国产Star破10w的开源项目前端包括管理后台、微信小程序后端支持单体、微服务架构RBAC权限、数据权限、SaaS多租户、商城、支付、工作流、大屏报表、ERP、CRM、AI大模型、IoT物联网等功能多模块https://gitee.com/zhijiantianya/ruoyi-vue-pro微服务https://gitee.com/zhijiantianya/yudao-cloud视频教程https://doc.iocoder.cn【国内首批】支持 JDK17/21SpringBoot3、JDK8/11Spring Boot2双版本做 PPT 这件事真的很花时间banana-slides 是什么主要功能和 notebooklm 比一比技术架构怎么部署还在开发中的功能小结上周我在 GitHub 上看到一个项目叫 banana-slides短短几个月收获了大量 Star。我去翻了一下发现它解决的其实是一个很常见的问题做 PPT 太麻烦。这篇文章就来聊聊这个项目说说它的思路、功能和上手方式。做 PPT 这件事真的很花时间不管是做汇报、写方案还是交学校作业PPT 都是逃不开的东西。内容想好了但排版要花大量时间。字体、对齐、颜色、图文布局每一步都要手动调整。现在有不少 AI 生成 PPT 的工具确实能省事一些但用下来总有几个问题让人不太满意模板是固定的风格没法怎么调。生成完了也不太好改多轮修改很麻烦。出来的 PPT 大多看着差不多没什么个性。图片质量也参差不齐有时候和内容根本对不上。简单说这类工具做出来的东西快是快但很难又快又好看。bana-slides 的作者也有同样的感受于是他决定自己做一个。基于 Spring Boot MyBatis Plus Vue Element 实现的后台管理系统 用户小程序支持 RBAC 动态权限、多租户、数据权限、工作流、三方登录、支付、短信、商城等功能项目地址https://github.com/YunaiV/ruoyi-vue-pro视频教程https://doc.iocoder.cn/video/banana-slides 是什么bana-slides完整名字 banana-slides是一个基于 GoogleGemini nano banana pro模型的 PPT 生成应用。它完全开源代码放在 GitHub 上支持自部署。作者在 README 里解释了为什么要做这个工具。他试过用 Gemini nano banana pro也就是项目名字里的 来直接生成 PPT 页面发现效果出乎意料地好图文布局自然、风格统一、文字精确。于是他就以此为核心搭了这套 PPT 生成系统。和其他 AI PPT 工具最不一样的地方在于这个项目把图片生成能力直接用在了每一张幻灯片上而不是先生成内容再套模板。每一页都是一张图风格天然统一。基于 Spring Cloud Alibaba Gateway Nacos RocketMQ Vue Element 实现的后台管理系统 用户小程序支持 RBAC 动态权限、多租户、数据权限、工作流、三方登录、支付、短信、商城等功能项目地址https://github.com/YunaiV/yudao-cloud视频教程https://doc.iocoder.cn/video/主要功能三种起步方式你可以用三种方式来开始做 PPT1.一句话说个主题AI 自动出大纲和每页内容2.大纲先写大纲再逐步填充页面内容3.页面描述直接写每页要放什么控制粒度更细三种方式都支持自然语言修改。比如你想改某页可以直接说把第三页换成案例分析AI 会根据你的指令重新生成。素材上传与智能解析你可以上传文件系统会自动读取内容。支持 PDF、Word.docx、Markdown、纯文本这几种格式。上传后系统会提取文件里的关键信息、图片链接和图表说明作为生成 PPT 的参考材料。另外你也可以上传一张参考图片告诉系统你想要什么风格。比如上传一个你喜欢的 PPT 截图AI 就会按照这个风格来出页面。口头修改指定区域这是这个项目比较有意思的地方。生成好页面之后如果你对某个区域不满意可以框选那个部分然后直接用文字描述要怎么改。比如这里换成饼图或者文字改大一点。整个修改流程不需要点复杂的菜单直接说话就行。作者把这种交互方式叫做Vibe 式编辑。导出为 PPTX 和 PDF生成好之后可以直接导出为标准的 PPTX 文件或 PDF 文件。默认是 16:9 的比例不需要再手动调整尺寸。值得一提的是项目还在做一个可自由编辑的 PPTX 导出功能目前是 Beta 阶段。这个功能会把生成的每张幻灯片图片里的文字和布局还原成可以在 PowerPoint 里直接编辑的格式字体大小、颜色、加粗等样式也会尽量保留。和 notebooklm 比一比Google 的 notebooklm 也有幻灯片生成功能下面是两个工具的简单对比功能notebooklmbanana-slides页数上限15 页无限制二次编辑提示词修改框选编辑 口头编辑素材添加生成后不能再加生成后可以继续加导出格式PDF、不可编辑的 PPTXPDF、可编辑或图片版 PPTX水印免费版有水印无水印元素可以自由增减两者定位不完全一样notebooklm 更侧重于知识整理banana-slides 则专门为 PPT 生成设计。如果你只是需要从一个长文档快速生成几页幻灯片notebooklm 够用。但如果你要做有风格感的 PPT想要更多控制权banana-slides 更合适。技术架构项目分前端和后端两部分。前端用 React 18 TypeScript 写的构建工具是 Vite样式用 Tailwind CSS状态管理用 Zustand。整体来说是比较标准的现代前端技术栈。后端是 Python FlaskAI 调用走的是 Google Gemini APIPPT 文件处理用 python-pptx图片处理用 Pillow。数据存在 SQLite 里页面生成是并发执行的用了 ThreadPoolExecutor 来加速。代码仓库结构比较清晰前端在frontend/目录后端在backend/目录各自独立。怎么部署有三种部署方式按照难度从低到高排列方式一一键部署最简单项目支持通过雨云平台一键部署不需要自己装 Docker 或配置服务器。新用户有 15 天免费试用。进去之后直接创建应用跟着引导操作就行。方式二Docker Compose如果你有服务器用 Docker 部署是最推荐的方式。官方提供了预构建镜像直接拉下来就能用docker compose -f docker-compose.prod.yml up -d主要步骤是克隆仓库、创建.env文件填写 API Key然后执行上面的命令。前端跑在 3000 端口后端在 5000 端口。配置 API Key 推荐用 AIHubMix 这个平台项目本身是以 Gemini 接口格式为标准的用这个平台可以减少一些迁移成本。需要注意Gemini nano banana pro 模型的 API 调用费用比较高在正式大量使用之前最好先估算一下成本。方式三源码部署如果你想改代码或者做二次开发可以从源码部署。环境要求是 Python 3.10 以上、Node.js 16 以上还有 uv 这个 Python 包管理器。后端启动命令cd backend uv run alembic upgrade head uv run python app.py前端另起一个终端进入frontend/目录安装依赖后启动即可。还在开发中的功能看了一下项目的开发计划还有几个功能在做更完整的可编辑 PPTX 导出支持多层次抠图网络搜索能力生成 PPT 时可以联网查资料Agent 模式在线播放功能页面切换动画目前版本已经有不少可用的功能并且更新频率不低。仓库的 Star 增长曲线也比较稳。小结bana-slides 这个项目的核心思路是直接用图片生成模型来做每一张幻灯片不套模板风格自然统一。这个方向和传统 AI PPT 工具差别还挺大的。当然也有一些限制要提一下Gemini nano banana pro 模型的 API 费用不低免费额度用完就需要付费了。另外可编辑 PPTX 导出功能现在还在迭代效果不完全稳定。如果你愿意自己折腾一下这个工具是值得试试的。代码是开源的部署方式也挺多文档也有中英文版本。GitHub 地址https://github.com/Anionex/banana-slides在线 Demohttps://bananaslides.online/欢迎加入我的知识星球全面提升技术能力。 加入方式“长按”或“扫描”下方二维码噢星球的内容包括项目实战、面试招聘、源码解析、学习路线。文章有帮助的话在看转发吧。 谢谢支持哟 (*^__^*

相关文章:

GitHub爆火!基于Gemini的开源PPT生成神器,每页都是AI原创设计

👉 这是一个或许对你有用的社群🐱 一对一交流/面试小册/简历优化/求职解惑,欢迎加入「芋道快速开发平台」知识星球。下面是星球提供的部分资料: 《项目实战(视频)》:从书中学,往事上…...

CANoe测试报告配置避坑指南:Test Module与vTESTstudio两种模式下的关键差异与最佳实践

CANoe测试报告配置避坑指南:Test Module与vTESTstudio两种模式下的关键差异与最佳实践 在汽车电子测试领域,CANoe作为Vector公司的旗舰产品,其测试报告配置的灵活性和准确性直接影响着测试效率与结果分析。面对Test Module(传统CA…...

数学建模小白看过来:避开AHP的3个大坑,让你的论文评价部分更靠谱

数学建模竞赛中AHP的三大陷阱与实战优化策略 数学建模竞赛的论文评审中,评价体系构建往往是决定作品高度的关键环节。许多参赛团队在初次接触层次分析法(AHP)时,容易被其看似简单的操作流程所吸引,却忽视了方法背后的数学严谨性和适用边界。本…...

GK6323V100C芯片盒子通刷指南:除了咪咕MGV3200,你的CM311-5s等型号也能焕发新生(附固件对比)

GK6323V100C芯片盒子全型号通刷实战手册:解锁隐藏潜能与固件优选策略 当你的客厅电视柜里堆满了各种运营商淘汰的机顶盒——CM311-5s、MGV3201、CM321-5这些看似不同的设备,其实都藏着相同的"心脏":GK6323V100C芯片。这颗被广泛采用…...

3步永久备份你的QQ空间记忆:GetQzonehistory让你轻松掌握青春时光

3步永久备份你的QQ空间记忆:GetQzonehistory让你轻松掌握青春时光 【免费下载链接】GetQzonehistory 获取QQ空间发布的历史说说 项目地址: https://gitcode.com/GitHub_Trending/ge/GetQzonehistory 还记得那些年你在QQ空间写下的青春絮语吗?那些…...

FPGA流水线CPU调试实录:我是如何定位并解决那个令人头疼的数据冲突问题的

FPGA流水线CPU调试实战:从波形异常到数据冲突的深度解析 1. 问题现象:当R5寄存器结果不符合预期时 那天晚上,实验室的示波器屏幕上跳动的波形让我陷入了沉思。按照MIPS五段流水线的设计理论,我的FPGA模型机应该已经能够正确执行简…...

10个免费Illustrator脚本:终极设计效率提升指南

10个免费Illustrator脚本:终极设计效率提升指南 【免费下载链接】illustrator-scripts Adobe Illustrator scripts 项目地址: https://gitcode.com/gh_mirrors/il/illustrator-scripts 你是否曾在Adobe Illustrator中重复执行相同的操作,浪费宝贵…...

告别‘ExcelWriter’保存困惑:从‘save’缺失到上下文管理器的优雅实践

1. 为什么你的ExcelWriter总是保存失败? 第一次用pandas导出Excel时,我也犯过同样的错误。记得那天加班到凌晨,好不容易跑完数据分析脚本,最后一步保存Excel时突然报错:"OpenpyxlWriter object has no attribute …...

告别手动配置!用Docker Compose一键部署ShardingSphere-Proxy 5.1.1

告别手动配置!用Docker Compose一键部署ShardingSphere-Proxy 5.1.1 在分布式数据库中间件的部署实践中,ShardingSphere-Proxy作为透明化的数据库代理层,正被越来越多的企业采用。然而传统部署方式往往需要经历繁琐的配置流程:手动…...

从《新概念英语3》第31课学到的:如何用Python写个‘怪人识别器’?

用Python构建"怪人识别器":从《新概念英语3》到NLP实践 当技术遇上语言学习,总能碰撞出意想不到的火花。Dickie这个拒绝打伞的富豪、用便士支付皮草大衣的怪人,在《新概念英语3》第31课中活灵活现。我们能否将这些特质转化为代码&a…...

如何高效使用炉石传说自动化脚本:从入门到精通

如何高效使用炉石传说自动化脚本:从入门到精通 【免费下载链接】Hearthstone-Script Hearthstone script(炉石传说脚本) 项目地址: https://gitcode.com/gh_mirrors/he/Hearthstone-Script 炉石传说脚本(Hearthstone-Scrip…...

如何在Windows、Linux和macOS上配置Ryujinx模拟器:3个关键技巧提升游戏性能

如何在Windows、Linux和macOS上配置Ryujinx模拟器:3个关键技巧提升游戏性能 【免费下载链接】Ryujinx 用 C# 编写的实验性 Nintendo Switch 模拟器 项目地址: https://gitcode.com/GitHub_Trending/ry/Ryujinx 想要在电脑上流畅运行Switch游戏?Ry…...

宿舍网络自由攻略:利用旧手机/树莓派搭建24小时校园网认证服务器,全设备免登录上网

宿舍网络共享方案:用闲置设备打造智能认证网关 每次回到宿舍都要重复输入校园网账号密码的日子该结束了。想象一下,当你推开宿舍门,手机、平板、笔记本自动连上Wi-Fi就能直接上网,不用再忍受繁琐的认证流程。这种便利并非遥不可及…...

别再硬刚GLIBC了!在Ubuntu 16.04/18.04上安装GitLab的终极避坑指南

在老旧Ubuntu系统上安全部署GitLab的工程实践 当你在Ubuntu 16.04或18.04上尝试安装最新版GitLab时,终端突然抛出那个令人窒息的错误——libc.so.6: version GLIBC_2.25 not found。这一刻,大多数运维人员的第一反应都是:"升级GLIBC不就…...

Java动态调试工具实战:基于JVMTI与字节码增强的线上问题排查

1. 项目概述与核心价值如果你是一名Java开发者,尤其是在处理线上问题或者进行性能调优时,肯定遇到过这样的场景:一个服务在测试环境跑得好好的,一到线上就出现性能瓶颈或者偶发的逻辑错误。传统的调试方法,比如加日志、…...

别再当‘炼丹师’了!用Alibi Explain给你的机器学习模型做个‘X光’检查(Python实战)

告别"黑箱焦虑":用Alibi Explain为机器学习模型构建透明诊断系统(Python实战) 当你在医院做CT检查时,医生能够清晰指出病灶位置;但当你的机器学习模型做出错误预测时,你是否只能对着"黑箱&q…...

B站M4S转MP4终极指南:三分钟学会视频备份完整方案

B站M4S转MP4终极指南:三分钟学会视频备份完整方案 【免费下载链接】m4s-converter 一个跨平台小工具,将bilibili缓存的m4s格式音视频文件合并成mp4 项目地址: https://gitcode.com/gh_mirrors/m4/m4s-converter 你是否曾因B站视频突然下架而措手不…...

Spyder 6.0:重新定义Python科学计算开发体验的技术架构演进

Spyder 6.0:重新定义Python科学计算开发体验的技术架构演进 【免费下载链接】spyder Official repository for Spyder - The Scientific Python Development Environment 项目地址: https://gitcode.com/gh_mirrors/sp/spyder 作为科学Python开发领域的标志性…...

别再只用SIFT了!手把手教你用Colmap的RootSIFT和自定义特征提升三维重建精度

别再只用SIFT了!手把手教你用Colmap的RootSIFT和自定义特征提升三维重建精度 当你在处理无人机航拍数据时,是否遇到过特征匹配不稳定导致的三维模型断裂?当你在进行文物数字化时,是否被光照变化带来的特征漂移所困扰?这…...

3分钟极速上手:通达信缠论量化插件完整使用指南

3分钟极速上手:通达信缠论量化插件完整使用指南 【免费下载链接】Indicator 通达信缠论可视化分析插件 项目地址: https://gitcode.com/gh_mirrors/ind/Indicator 在技术分析领域,缠论以其严谨的逻辑体系备受交易者推崇,但手工分析耗时…...

Vue无限滚动终极实战:3大高效加载策略深度解析

Vue无限滚动终极实战:3大高效加载策略深度解析 【免费下载链接】vue-infinite-loading An infinite scroll plugin for Vue.js. 项目地址: https://gitcode.com/gh_mirrors/vu/vue-infinite-loading Vue无限滚动插件vue-infinite-loading是处理大数据列表和优…...

Winhance中文版:让Windows系统优化变得简单高效的免费工具

Winhance中文版:让Windows系统优化变得简单高效的免费工具 【免费下载链接】Winhance-zh_CN A Chinese version of Winhance. C# application designed to optimize and customize your Windows experience. 项目地址: https://gitcode.com/gh_mirrors/wi/Winhanc…...

终极指南:如何免费重置Navicat Premium的14天试用期

终极指南:如何免费重置Navicat Premium的14天试用期 【免费下载链接】navicat_reset_mac navicat mac版无限重置试用期脚本 Navicat Mac Version Unlimited Trial Reset Script 项目地址: https://gitcode.com/gh_mirrors/na/navicat_reset_mac 还在为Navica…...

Botty暗黑2重制版自动化工具:终极解放双手指南

Botty暗黑2重制版自动化工具:终极解放双手指南 【免费下载链接】botty D2R Pixel Bot 项目地址: https://gitcode.com/gh_mirrors/bo/botty 还在为暗黑2重制版中重复的刷怪、捡装备而烦恼吗?Botty这款开源自动化工具绝对是你的救星!它…...

STM32CubeIDE玩转标准库:像用Keil一样开发F103C8T6,附详细配置清单与避坑指南

STM32CubeIDE玩转标准库:像用Keil一样开发F103C8T6,附详细配置清单与避坑指南 对于习惯了Keil标准库开发流程的工程师来说,切换到ST官方推荐的CubeIDE环境往往会面临诸多不适应。本文将带你突破工具链限制,在CubeIDE中完美复现Kei…...

AI Agent如何通过声波协议实现高效通信:GibberLink项目深度解析

1. 项目概述:当AI开始用“声音”说悄悄话 去年二月,一个关于两个AI智能体在对话中“切换语言”的演示视频在技术圈里小火了一把。视频里,两个扮演“客户”和“酒店前台”的AI对话机器人,在聊了几句确认对方也是AI后,突…...

GCC编译参数`-Werror`和`-Wimplicit-fallthrough`详解:如何平衡代码质量与开发效率?

GCC编译参数-Werror与-Wimplicit-fallthrough实战指南:工程化配置与团队协作策略 在C/C项目的持续集成流水线中,开发团队经常面临这样的困境:某个看似无害的代码修改触发了-Wimplicit-fallthrough警告,而由于-Werror的严格设置&am…...

保姆级教程:在Ubuntu 22.04上从源码编译OpenWrt 23.05(附8个常见报错解决方案)

Ubuntu 22.04源码编译OpenWrt 23.05全流程指南与深度排错手册 在开源路由系统的世界里,OpenWrt以其高度定制化和强大的扩展能力成为技术爱好者的首选。本文将带你完整走过在Ubuntu 22.04 LTS环境下从源码编译OpenWrt 23.05的全过程,不仅提供标准操作流程…...

从零到一:基于STM32硬件SPI驱动M95系列EEPROM的实战指南

1. 硬件SPI与EEPROM基础概念 第一次接触STM32的硬件SPI驱动EEPROM时,我也被各种专业术语搞得头晕眼花。简单来说,SPI就像两个人在用摩斯密码交流——主设备(STM32)通过四根线(MOSI、MISO、SCK、NSS)与从设备…...

TV Bro:专为智能电视优化的开源浏览器,让大屏上网更简单

TV Bro:专为智能电视优化的开源浏览器,让大屏上网更简单 【免费下载链接】tv-bro Simple web browser for android optimized to use with TV remote 项目地址: https://gitcode.com/gh_mirrors/tv/tv-bro 在智能电视上浏览网页一直是个挑战——传…...