当前位置: 首页 > article >正文

AI大模型入门指南:泛化、通用、涌现三大特征解析,小白也能学会收藏!

本文深入浅出地介绍了AI大模型的主要特征包括泛化性、通用性和涌现性并以ChatGPT为例阐述了其如何通过巨量参数和深度网络结构展现强大的自然语言理解和生成能力。文章还详细分类并介绍了云侧大模型如通用大模型和行业大模型和端侧大模型如手机大模型和PC大模型并列举了我国AI大模型的典型案例如科大讯飞的讯飞星火认知大模型、百度文心一言大模型、阿里巴巴通义千问大模型等展示了它们在不同领域的应用和优势。对于想要了解和学习AI大模型的小白或程序员来说本文提供了一个全面且实用的入门指南值得收藏1、AI 大模型主要特征AI 大模型具有泛化性(知识迁移到新领域)、通用性(不局限于特定领域)以及涌现性(产生预料之外的新能力)特征。以 ChatGPT 为代表的 AI 大模型因其具有巨量参数和深度网络结构,能学习并理解更多的特征和模式,从而在处理复杂任务时展现强大的自然语言理解、意图识别、推理、内容生成等能力,同时具有通用问题求解能力,被视作通往通用人工智能的重要路径。AI 大模型的三大特征泛化性、通用性、涌现性2、 AI 大模型主要类型按照部署方式划分AI 大模型主要分为云侧大模型和端侧大模型两类。云侧大模型由于部署在云端其拥有更大的参数规模、更多的算力资源以及海量的数据存储需求等特点端侧大模型通常部署在手机、PC 等终端上具有参数规模小、本地化运行、隐私保护强等特点。具体而言云侧大模型分为通用大模型和行业大模型端侧大模型主要有手机大模型、PC 大模型。从云侧大模型来看通用大模型具有适用性广泛的特征其训练数据涵盖多个领域能够处理各种类型的任务普适性较强。行业大模型具有专业性强的特点针对特定行业如金融、医疗、政务等的需求进行模型训练因而对特定领域具有更深的业务理解和场景应用能力。从端侧大模型来看手机和 PC 大模型由于直接部署在设备终端让用户体验到更加个性化和便捷的智能体验。当前我国 AI 大模型产业呈现蓬勃发展的态势。伴随多家科技厂商推出的AI 大模型落地商用各类通用、行业以及端侧大模型已在多个领域取得了显著的成果如在金融、医疗、政务等领域AI 大模型已成为提升服务质量和效率的重要手段。我国具有代表性的通用 AI 大模型主要包含科大讯飞的讯飞星火认知大模型、百度公司的文心一言大模型、阿里巴巴的通义千问大模型等行业AI 大模型主要涵盖蜜度的文修大模型、容联云的赤兔大模型、用友的 YonGPT大模型同时具有云侧和端侧大模型的端云结合 AI 大模型主要有 vivo 的蓝心大模型端侧 AI 大模型主要以蔚来的 NOMI GPT 大模型为代表。中国 AI 大模型分类及典型案例3、 中国 AI 通用大模型典型案例案例一科大讯飞—讯飞星火认知大模型1大模型简介讯飞星火认知大模型是科大讯飞推出的新一代认知大模型可实现基于自然对话方式的用户需求理解与任务执行。讯飞星火从赋能万物互联时代的人机交互、赋能知识学习与内容创作、提升数智化生产力三个方面展现其应用能力。讯飞星火认知大模型具备七大核心能力文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力和多模态能力。2大模型优势2024 年 1 月讯飞星火认知大模型 V3.5 发布七大核心能力全面提升。据科大讯飞宣称数学、语言理解超 GPT-4 Turbo在代码能力方面已经达到GPT-4Turbo 的 96%。另外星火大模型在多模态理解方面达到 GPT-4V 的 91%其中语音的多模态能力已经超过 GPT-4。讯飞星火认知大模型 V3.5 七大能力讯飞星火认知大模型 V3.5 从三个角度展示了模型能力的提升赋能万物互联时代人机交互、赋能知识学习与内容创作、提升数智化生产力。人机交互方面讯飞星火 V3.5 在语义理解、指令跟随和多轮对话中展现优异能力在情绪感知和拟人合成方面也有出色表现知识学习与内容创作方面要素抽取、问题生成等底层能力的进步能够帮助知识学习和内容创作领域产生更丰富更有用的智能体。讯飞星火大模型能够结合外部知识进行合理拓展做到“旁征博引”数智化生产力方面逻辑推理能力和时空推理能力并重数学则是大模型的基础能力而代码能力用于生成各种工具链接虚拟和现实世界最后多模态能力也是机器人、工业、家庭等场景中必备的能力。讯飞星火 V3.5 在这些关键技术领域取得显著进步。3大模型应用讯飞星火七大能力的提升实现了各类应用场景性能升级。语言理解方面情感分析可以提取文本情感色彩更好了解内容观点和态度。文本摘要总结简洁准确的摘要快速理解文章的核心观点文本生成方面科大讯飞推出可以一键快速自动生成文档和 PPT 的办公产品——讯飞智文主要功能有文档一键生成、AI撰写助手、多语种文档生成、AI 自动配图、多种模板选择、演讲备注等知识问答方面讯飞星火对生活常识问答、医学知识问答、政策问答等任务“信手拈来”逻辑推理方面思维推理可以通过分析问题的前提条件和假设来推理出答案或解决方案给出新的想法和见解。科学推理则使用已有的数据和信息进行推断、预测和验证等科学研究中的基本任务数学能力方面讯飞星火可以解决方程求解、立体几何、微积分、概率统计等数学问题代码能力方面讯飞星火能根据注释、函数名智能生成代码支持逐行代码注释还可以精准定位代码语法、逻辑错误甚至可以智能生成单元测试数据多模态能力方面讯飞星火可根据用户上传图片返回准确的图片描述或完成针对图片素材的问答还可以凭借用户描述生成期望的音频和视频。案例二百度公司—文心一言大模型1大模型简介文心一言是百度研发的人工智能大语言模型产品具备跨模态、跨语言的深度语义理解与生成能力在文学创作、文案创作、搜索问答、多模态生成、数理逻辑推算等众多领域都能为用户提供高质量服务。文心一言拥有四大基础能力理解能力、生成能力、逻辑能力、记忆能力。2大模型优势2023 年 10 月发布的“文心大模型 4.0”相比上一代文心大模型四大能力显著升级其中逻辑提升幅度是理解的 3 倍记忆提升幅度是理解的 2 倍。理解能力方面文心一言能听懂潜台词、复杂句式、专业术语、前后乱序、模糊意图等复杂提示词也能胜任代码理解与调试任务生成能力方面文心一言能快速生成风格多样的文本、代码、图片、图表、视频比如进行文案创作、制定生活计划、编写高质量代码逻辑能力方面文心一言能帮用户解决复杂的逻辑难题、困难的数学计算、重要的职业/生活决策、代码纠错、常识推理、逻辑校验、立体几何、辩论灵感等记忆能力方面经过多轮对话后文心一言依然能记住对话的重点轻松胜任复杂问题、沉浸体验角色对话。文心大模型 4.0 的能力提升源自相关举措1在万卡算力上基于飞桨平台通过集群基础设施和调度系统、飞桨框架的软硬协同优化支持了大模型的稳定高效训练。2通过建设多维数据体系形成了从数据挖掘、分析、合成、标注到评估闭环充分提高数据的利用效率大幅提升模型效果。3基于有监督精调、偏好学习、强化学习等技术进行多阶段对齐保证了模型能够更好地与人类的判断和选择对齐。4利用可再生训练技术通过增量式的参数调优有效节省了训练资源和时间加快了模型迭代速度。文心大模型 4.0 典型特征3大模型应用文心大模型在文学创作、文案创作、搜索问答、多模态生成、数理逻辑推算等方面已有应用面向用户开放。文学创作方面文心一言可以清晰地表达观点、传递情感因此可以应用于小说、散文、诗歌等文学作品的创作中文案创作方面在商业领域文心一言可以撰写商业计划、市场分析报告等商业文案提供有力的文字支持。文心一言可以激发创意思维为广告行业提供新的灵感和想法可以帮助广告人员快速构思出吸引人的广告文案和宣传语搜索问答方面基于文心一言的聊天机器人可以与用户进行自然语言交互理解用户的意图和需求并提供相应的回答和建议。这种应用可以广泛应用于生活服务、教育辅导、客服等领域多模态生成方面文心大模型支持图像生成和处理可以根据用户需求生成图像或者对已有图像进行处理编辑。文心大模型还支持语音合成、语音识别和音频分类。文心大模型还能对视频数据进行处理或将文本转化为动态图像序列完成视频分类、目标检测等任务数理逻辑推算方面文心大模型可以解决复杂的数学问题也可以成为代码编写助手比如百度基于文心大模型研制了智能代码助手 Comate提供智能推荐、智能生成、智能问答等多种功能支持多种编程语言和 IDE。案例三阿里巴巴—通义千问大模型1大模型简介通义千问是阿里云研发的预训练语言模型基于先进的自然语言处理技术NLP, 执行理解、生成和解释人类语言、图片和文档等任务。通义千问能在创意文案、办公助理、学习助手、趣味生活等方面为使用者提供丰富的交互体验。通义千问具备中英文理解、数学推理、代码理解等能力。2大模型优势2023 年 10 月千亿级参数大模型通义千问 2.0 发布,相比 1.0 版本其在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。中英文理解能力是大语言模型理解和表达的基础能力英语任务中通义千问 2.0 的 MMLU伯克利大学、哥伦比亚大学等联合发布基准得分是 82.5。中文任务中通义千问 2.0 在模型训练中学习了更多中文语料在 C-EVAL上海交大和清华联合研发的中文大语言模型测试集基准上获得最高分数学推理方面在推理基准测试 GSM8KOpenAI 发布的小学数学测试集中通义千问排名第二展示了强大的计算和逻辑推理能力代码理解方面HumanEvalOpenAI发布测试衡量大模型理解和执行代码片段的能力通义千问排名第三这一能力是大模型在编程辅助、自动代码修复等场景的基础。3大模型应用通义千问目前主要应用于四个方向创意文案、办公助理、学习助手、趣味生活。创意文案应用包括“撰写营销文案”输入产品介绍获得量身定制的金牌营销文案。“文章润色”能对用户提交的文章进行深度分析挖掘其中表达不足之处提供词汇句式变化建议。“直播带货剧本生成”基于丰富的商品信息和用户需求为电商主播提供生动有趣且具有营销力的脚本内容办公助理应用于“SWOT 分析”为用户提供全面、深入且精准的战略决策支持从多元视角理解并评估内外部环境对特定项目的影响。“PPT 框架生成”智能地为用户构建专业且逻辑清晰的 PPT 结构学习助手应用包含了“题目加工厂”根据提供的专业以及学科领域进行高质量试题生成大大节省了教师、家长以及教育机构在出题上的时间和精力。“学习计划站”可为用户提供个性化、系统化的学习路径规划定制高效且科学的学习日程安排趣味生活应用有“会放飞的菜谱”输入菜名逐步指导提供美食烹饪秘诀。“AI 健身教练”为用户制定专属健身计划。“写歌词”根据用户提示的歌名写出生动歌词。案例四容联云—赤兔大模型1大模型简介赤兔大模型是容联云开发的面向企业应用的垂直行业多层次大语言模型赋能企业搭建专属智能客服和数智化营销完成从“降本增效”到“价值创造”的进化。丰富的智能应用为赤兔大模型能力保驾护航包含会话洞察、业务话术、问答知识库、知识运用、数据分析、智能对话框架、流程管理。2大模型优势赤兔大模型三个核心点分别是智能性、可控性和投产比。智能性方面是客户最关心的首先能力是否足够丰富能否解决以前不能解决的问题以及相关能力到底能做多好。智能性方面包括检索增强、会话分析、逻辑推理、数据分析。检索增强是指在海量文档中快速定位到信息经过整理给客户提供答案。会话分析能让模型在对话中发现多维度信息包括情绪、立场、各种细节的意见并且根据不同业务快速切换业务场景。逻辑推理体现在推荐话术的原因投诉、预警的原因这种因果分析能力。数据分析体现在对数据更细致且自动化的分析减少技术人员和业务人员的数据层面上的操作可控性方面赤兔大模型在道德、伦理、安全、风格、偏好上对齐对话或话术生成时满足基本安全需求。另外让模型知道应该处理的知识范畴、知识边界从而避免自由对话潜在的安全风险和资源消耗投产比方面大模型强大能力来源于大规模而大规模需要大投入合理的投产比是客户采取方案的底层逻辑。所以明确是否所有场景都需要大模型AI 底座上没有摒弃小模型大小模型相配合完成对上层能力的输出。机制上合理调动分配比如有的环节大模型靠后完成线下或离线的工作有的环节大模型调动指挥小模型完成。3大模型应用基于赤兔大模型容联云发布了生成式应用“容犀 Copilot”。容犀 Copilot具备三大核心能力大模型话术、智能知识库、会话洞察。大模型话术容犀Copilot 后台一键快速对海量历史会话数据进行核对筛选挑选出更佳话术并生成金牌话术兼顾质与量的同时挖掘出客户高频关注的问题从问题中洞悉业务痛点智能知识库可以帮助企业从零开始、低成本地快速构建话术库包括理解文档知识、知识快搜、智能问答等大幅提升构建效率会话洞察高效便捷洞察每一通会话沟通情况分析客户诉求精准诊断问题并优化。回归实际业务本身容犀 Copilot 深入金融行业细分场景打造场景化客服助手譬如分期挽留助手、荐卡挽留助手、投诉安抚助手等实时辅助快速洞察客户需求推荐更佳应答话术诊断客户情绪变化提醒措辞及注意事项。容犀 Copilot 产品应用场景案例五蜜度—文修大模型1大模型简介文修大模型是蜜度推出的一款聚焦于智能校对领域的大语言模型基于蜜度在校对领域的知识和经验积累为政务单位、新闻媒体、企业单位、学校机构、出版机构等专业用户提供更贴合使用场景的校对服务。文修大模型具备校对能力强、速度快、匹配度高三大特点更好地解决垂直行业的问题。2大模型优势数字化时代内容创作与传播速度惊人信息准确无误地传达给公众尤为重要蜜度文修大模型通过优秀的校对能力、高效的处理速度和高度的匹配度应对变局。校对能力方面文修大模型以拼写错误、语义错误、语法错误为基础以内容差错、常识校对差错、内容风险识别三大类校对类型27 类细分类型为校对标准有效满足出版行业、新闻行业的“三审三校”的校对规范和实际业务需求提供诸如广告法检测、常识校对等更为全面的校对服务校对速度方面文修大模型几秒钟就能校对完一篇千字文章几分钟即可校对一本 10 万字书稿。其快速校对的背后是实实在在的“学习能力”文修大模型能迅速将人们短时间内难以学习消化的内容转变成自身的校对能力完成快速输出匹配度方面蜜度服务政府部门、媒体单位十余年数十款智能应用产品及解决方案覆盖政务部门、出版单位多个办公环节及场景拥有成熟的流程服务在洞察用户需求和使用场景方面拥有深厚的经验。3大模型应用文修大模型满足政务单位、新闻媒体、企业单位、学校机构、出版机构的多行业场景应用需求。政务单位领域赋能各级政务部门校对流程智能化提供文字材料的内容错敏校对、修改提示和文本润色等服务全力保障内容的准确性及严谨性支持内网环境下校对满足更高保密需求新闻媒体领域文修大模型深入新闻媒体工作的各个环节对多模态内容进行多类错敏校对帮助快速定位错误并高亮显示让内容更加规范严谨有效维护官方账号的公信力同时提供文本润色服务提高出稿速度保障新闻时效性企业单位领域全流程切入企业办公场景从内容纠错、提升文本质量等多方位出发优化宣发内容提高文案吸引力助力营销效果显著提升学校机构领域针对学校机构的宣传材料、新媒体稿件、科研报告、学术论文等内容进行全面校审有效降低文字错误率保障学术严谨性。通过 AI 润色功能助力文章、报告、材料的起草、优化工作有助于进一步提升学校传播力、影响力出版机构领域提供专业、便捷、高效的内容筛查及文字质量把关服务协助各出版机构高效处理多语言文本降低内容差错概率保障内容的规范性、准确性。案例六用友—YonGPT 大模型1大模型简介YonGPT 是用友基于数字和智能技术服务企业和公共组织数智化的企业服务大模型。YonGPT 在企业服务领域的应用主要集中在 4 个方向智能化的业务运营、自然化的人机交互、智慧化的知识生成、语义化的应用生成。2大模型优势用友人工智能研发团队基于大规模的商业应用数据结合企业应用场景和领域经验标记了大量的企业服务语料数据形成丰富的企业服务大模型训练素材并将业务知识与领域经验融入企业服务大模型确保了 YonGPT 的专业性、实用性及领先性。同时 YonGPT 通过上下文记忆、知识库表索引、Prompt 工程、Agent执行、通用工具集等扩充大模型的存储记忆、适配应用和调度执行能力形成体系化的企业服务大模型。YonGPT 还优化了企业服务大模型的训练效率和成本集成了丰富的开发工具和优化算法通过自有的数据管理、大模型精调、大模型评估优化、大模型推理和插件服务等功能为大模型的构建和服务提供稳定且有效的支撑。3大模型应用用友企业服务大模型 YonGPT 围绕四个方向推进模型训练和产品效果优化提供深入到客户业务前端的全价值链、全场景的泛在智能和群体智能应用。在智能化业务运营方面YonGPT 通过强大的数据分析和预测能力深入洞察企业运营、识别潜在的业务风险和机会并提供智能化的解决方案从而提高经营决策水平和业务运营效率在自然化人机交互方面YonGPT 通过强大的自然语言处理技术和理解能力使能企业应用和服务与用户进行自然而流畅的对话交流以“人”为本的方式实现不同应用的调用、连接、组装更自然、高效地完成工作在智慧化知识生成方面YonGPT 通过从海量数据和信息中提取、整合知识生成新的、有价值的知识内容涵盖了行业解决方案、专业领域知识分享助力企业和用户全面利用自身知识的储备和积累促进知识的传播和应用在语义化应用生成方面YonGPT 通过对用户需求、企业业务和数据特征的理解可以自动生成具有语义化能力的应用程序全方位提升企业个性化应用服务的创建效率。此外 YonGPT 在智能化场景服务中实现四个服务企业收入/利税经营智能分析可以实时掌控经营状况、快速洞察问题所在、精准预测企业效益、有效预见应对变化智能生单融合了丰富的供应链经验通过“交互革新式”订单生成助手实现快速智能生单提高企业效能智能招聘帮助企业快速精准识别定位目标人才从海量简历池中发现人才通过 AI 互动优化应聘体验实现选人、用人的精准决策智能大搜提供“沉浸式”搜索新体验加速企业知识的价值化服务并洞察用户需求、实现搜推一体让知识赋能业务和组织。案例七 “写易”智能创作引擎1大模型简介“写易”智能创作引擎是人民网推出的垂类写作大模型依托自主研发的主流价值观大模型针对写作场景训练而成。“写易”智能创作引擎适合党政党媒、央企国企、学校医院等有日常阅读需求和写作需求的群体提供专业权威、系统整体、持续更新的数智服务从而更好地启发创作者的写作灵感。“写易”智能创作引擎产品架构2大模型优势“写易”智能创作引擎深入挖掘用户需求构建了“随查”“随写”“随审”的交互体验, 具有创作高效、安全准确、内容丰富的特点。其主要功能有高效的智能创作引擎“写易”智能创作引擎依托于超过 25 万条的权威主流语料库创新性地实现了基于检索增强的辅助生成能力。可通过标题自动生成优质核心内容同时结合标题与观点等上下文信息为用户生成相关性更强、准确性更高的文章素材从而显著提升写作效率专业的涉政内容审校1.原文引用检测检测文本是否引用了重要讲话、重要政策文件分析引用的规范性同时给出原文的出处等溯源信息。2.规范表述审校对领导人重要讲话、党和国家重大政策重要文件等文本进行规范性检测。3.人物信息审校对文本中出现的人物姓名及职务信息等进行勘误检测。4.关键信息审核检测文本中有标志性、代表性的重大事件、重要人物、重要敏感信息等内容。5.基础纠错对文本中的错别字检测、标点符号错误检测包括中文、英文拼写、成对标点、特殊数字与符号等错误内容丰富的写作素材知识库依托人民网和人民日报配备强大的资料库系统化整理信息按照时间、内容、形式、图文音频等多维度进行分类汇总。及时同步《人民日报》每日的精选文章实时提炼更新当日最优标题、最美佳句、最优词语等内容为用户提供新鲜的写作素材。3大模型应用“写易”智能创作引擎服务于以国资央企、党政机关、事业单位、党媒党网、地方融媒体、教育系统、医疗系统等为重点的全行业客户满足客户在不同场景中的定制化高效写作需求。“写易”智能创作引擎可结合客户数据库进行定制具体而言人民网以行业客户数据库语料为核心《人民日报》内容为辅助为客户定制化训练“写易”智能创作语言大模型帮助提高写作能力、积累写作素材、规范写作格式。在写作过程中还可以为标题撰写、修辞使用、引用诗文和网言网语等提供丰富素材帮助创作者启发灵感、提供思路从而自动、高效地生成符合客户写作场景的高质量文章素材为客户提供全维、全时、全域的智能化服务助力工作总效率大幅提升。案例八vivo—蓝心大模型1大模型简介蓝心大模型是行业首个在手机端运行的开源自研大模型也是更适合中文用户的中文开源大模型其包含十亿、百亿、千亿三个参数量级共 5 款自研大模型10 亿、70 亿、700 亿、1300 亿和 1750 亿。随着参数提升蓝心大模型逐渐具备文本总结、语言理解、文本创作、知识问答、角色扮演、复杂逻辑推理、复杂任务编排等能力。基于蓝心大模型能力vivo 开发出蓝心小 V 和蓝心千询两款手机端产品。vivo 蓝心大模型矩阵2大模型优势1矩阵化优势vivo 大模型矩阵具有不同参数量级、多种部署方式可应用于不同使用场景在满足用户手机体验的同时优化大模型推理性能以及端侧部署时占用的手机内存、功耗。10 亿参数的蓝心大模型1B是面向端侧场景打造的专业文本大模型具备本地化的文本总结、图片风格化能力适用于需要快速本地化摘要、生图的场景70 亿参数的蓝心大模型7B是面向手机打造的端云两用模型有良好的上下文关联能力和任务拆解能力在语言理解、文本创作等场景下表现优秀。蓝心大模型 7B 也是手机行业首家开源的大模型实现 AI 普惠700亿参数的蓝心大模型70B是 vivo 面向云端服务的主力模型在角色扮演、知识问答等场景下表现优异既有智能涌现也能兼顾成本和性能。面向复杂任务vivo 也推出了两款千亿参数模型1300 亿和 1750 亿大模型 凭借更丰富的知识量提供更加专业的智能体验。2端侧优势蓝心大模型 1B 和蓝心大模型 7B 可在手机端运行展现了出词快、内存低、全天候、真安全的强大端侧运行优势。出词快vivo 对手机端上的 1B 模型优化测试出字速度极限可达 60 字每秒远超人眼约 10-20 字每秒的阅读需求内存低vivo 优化模型在手机端的内存占用问题, 蓝心大模型 1B 和蓝心大模型 7B分别只需占用 1.3G 和 3.8G 手机内存。全天候将蓝心大模型置于终端设备上可以减少数据延迟并能够满足例如出差飞机、高铁等无网弱网场景下的大模型使用需求使得一些应用可以全天候正常运行。真安全vivo 实现端侧内容安全过滤模型优化输入语料和大模型生成内容的合规性问题端侧大模型有助于在本地处理数据形成闭环减少了敏感信息通过网络传输的风险为大模型应用场景落地移动终端提供安全基石。3算法优势蓝心大模型具备三大算法优势强大的基础能力、精准的指令跟随以及正确的价值取向。首先强大的基础能力是大模型的根基。在预训练阶段vivo 利用最前沿的 Transformer 架构改良注意力机制、位置编码等关键模块采用混合精度训练以及梯度缩放策略缩短训练周期。其次精准的指令跟随是大模型与用户交互的核心。vivo 对于微调采用“target only loss”方法并通过聚类分析对指令进行适应性处理以更好地确保模型的均衡性。第三正确的价值取向是大模型的灵魂。在强化学习阶段 vivo 建立了 300 余名专业人员组成的审核团队制定了 200 余项的安全审查机制对模型的输出进行筛查和标注。同时vivo 采用离线采样策略和双重奖励模型等策略在安全性上有明显提升。3大模型应用1蓝心小 V蓝心小 V 是 OriginOS 4 上搭载的一款全局智能辅助功能支持超能语义搜索、超能问答、超能写作、超能创图、超能智慧交互。超能语义搜索使用自然语言即可搜索手机中的照片、文档、日程等信息超能问答根据用户上传的文档快速提供文档总结也可根据文档内容快速问答还可以是知识百科开放式问答超能写作基于用户的要求结合 AI 能力给用户生成文本如润色、扩写、总结、格式文本等超能创图1、文生图和图生图基于用户文字描述或上传图片生成目标图片。2、AI 路人消除路人隐身上传包含路人的图片通过对话消除路人生成更为纯净的图片超能智慧交互1、智能识屏服务功能一键识别屏幕上的文本、网页链接提取有效信息2、超直觉化的交互方式交互更多元语音、文字、点击、拖拽、悬浮形式互动更轻松。2蓝心千询vivo 基于蓝心大模型打造的全天侯 AI 私人小帮手——蓝心千询覆盖 AI对话和 AI 灵感两大核心应用场景。蓝心千询是手机行业首个大模型公开版免费APP。AI 对话模块蓝心千询支持“超能问答”以及“超能创图”两大功能用户可以通过 AI 对话进行文本问答、开放问答或是基于文档的问答以高效获取信息、知识。另外无论写诗、AI 作画、创作歌词、撰写标题/活动方案蓝心千询皆可胜任。AI 灵感模块蓝心千询能够提供社交媒体文案创作、PPT 大纲生成、中英文本互译等功能还设置有穿搭建议等有趣的灵感工具。灵感广场设置有不同场景下的灵感技能卡片覆盖工作、学习生活中的创作场景。蓝心千询将基于卡片语境快速生成对应文案为用户的工作、学习、生活提供广泛灵感支持。最后对于正在迷茫择业、想转行提升或是刚入门的程序员、编程小白来说有一个问题几乎人人都在问未来10年什么领域的职业发展潜力最大答案只有一个人工智能尤其是大模型方向当下人工智能行业正处于爆发式增长期其中大模型相关岗位更是供不应求薪资待遇直接拉满——字节跳动作为AI领域的头部玩家给硕士毕业的优质AI人才含大模型相关方向开出的月基础工资高达5万—6万元即便是非“人才计划”的普通应聘者月基础工资也能稳定在4万元左右。再看阿里、腾讯两大互联网大厂非“人才计划”的AI相关岗位应聘者月基础工资也约有3万元远超其他行业同资历岗位的薪资水平对于程序员、小白来说无疑是绝佳的转型和提升赛道。对于想入局大模型、抢占未来10年行业红利的程序员和小白来说现在正是最好的学习时机行业缺口大、大厂需求旺、薪资天花板高只要找准学习方向稳步提升技能就能轻松摆脱“低薪困境”抓住AI时代的职业机遇。如果你还不知道从何开始我自己整理一套全网最全最细的大模型零基础教程我也是一路自学走过来的很清楚小白前期学习的痛楚你要是没有方向还没有好的资源根本学不到东西下面是我整理的大模型学习资源希望能帮到你。扫码免费领取全部内容最后1、大模型学习路线2、从0到进阶大模型学习视频教程从入门到进阶这里都有跟着老师学习事半功倍。3、 入门必看大模型学习书籍文档.pdf书面上的技术书籍确实太多了这些是我精选出来的还有很多不在图里4、AI大模型最新行业报告2026最新行业报告针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。5、面试试题/经验【大厂 AI 岗位面经分享107 道】【AI 大模型面试真题102 道】【LLMs 面试真题97 道】6、大模型项目实战配套源码适用人群四阶段学习规划共90天可落地执行第一阶段10天初阶应用该阶段让大家对大模型 AI有一个最前沿的认识对大模型 AI 的理解超过 95% 的人可以在相关讨论时发表高级、不跟风、又接地气的见解别人只会和 AI 聊天而你能调教 AI并能用代码将大模型和业务衔接。大模型 AI 能干什么大模型是怎样获得「智能」的用好 AI 的核心心法大模型应用业务架构大模型应用技术架构代码示例向 GPT-3.5 灌入新知识提示工程的意义和核心思想Prompt 典型构成指令调优方法论思维链和思维树Prompt 攻击和防范…第二阶段30天高阶应用该阶段我们正式进入大模型 AI 进阶实战学习学会构造私有知识库扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架抓住最新的技术进展适合 Python 和 JavaScript 程序员。为什么要做 RAG搭建一个简单的 ChatPDF检索的基础概念什么是向量表示Embeddings向量数据库与向量检索基于向量检索的 RAG搭建 RAG 系统的扩展知识混合检索与 RAG-Fusion 简介向量模型本地部署…第三阶段30天模型训练恭喜你如果学到这里你基本可以找到一份大模型 AI相关的工作自己也能训练 GPT 了通过微调训练自己的垂直大模型能独立训练开源多模态大模型掌握更多技术方案。到此为止大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗为什么要做 RAG什么是模型什么是模型训练求解器 损失函数简介小实验2手写一个简单的神经网络并训练它什么是训练/预训练/微调/轻量化微调Transformer结构简介轻量化微调实验数据集的构建…第四阶段20天商业闭环对全球大模型从性能、吞吐量、成本等方面有一定的认知可以在云端和本地等多种环境下部署大模型找到适合自己的项目/创业方向做一名被 AI 武装的产品经理。硬件选型带你了解全球大模型使用国产大模型服务搭建 OpenAI 代理热身基于阿里云 PAI 部署 Stable Diffusion在本地计算机运行大模型大模型的私有化部署基于 vLLM 部署大模型案例如何优雅地在阿里云私有部署开源大模型部署一套开源 LLM 项目内容安全互联网信息服务算法备案…扫码免费领取全部内容3、这些资料真的有用吗这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

相关文章:

AI大模型入门指南:泛化、通用、涌现三大特征解析,小白也能学会收藏!

本文深入浅出地介绍了AI大模型的主要特征,包括泛化性、通用性和涌现性,并以ChatGPT为例,阐述了其如何通过巨量参数和深度网络结构展现强大的自然语言理解和生成能力。文章还详细分类并介绍了云侧大模型(如通用大模型和行业大模型&…...

基于Python的流浪动物救助平台毕业设计

博主介绍:✌ 专注于Java,python,✌关注✌私信我✌具体的问题,我会尽力帮助你。一、研究目的本研究旨在构建一个基于Python的流浪动物救助平台,以实现流浪动物的有效救助与管理工作。具体研究目的如下: 首先,通过构建流…...

SIM800L新手避坑指南:从电源不稳到中文短信发送,我的踩坑实录

SIM800L实战避坑手册:从电源设计到中文短信的完整解决方案 第一次拿到SIM800L模块时,我天真地以为这不过是个"高级版蓝牙模块"。直到电源指示灯开始疯狂闪烁、串口不断吐出乱码、中文短信变成问号时,我才意识到自己掉进了技术深坑。…...

Wan2.2-I2V-A14B企业应用:品牌广告片AI辅助生成+人工精修工作流

Wan2.2-I2V-A14B企业应用:品牌广告片AI辅助生成人工精修工作流 1. 企业级视频创作新范式 在品牌营销领域,高质量视频内容的需求正呈指数级增长。传统视频制作流程面临三大痛点:创意实现周期长、专业团队成本高、批量生产难度大。Wan2.2-I2V…...

Llama-3.2V-11B-cot应用落地:农业病虫害图谱跨季节推理验证系统

Llama-3.2V-11B-cot应用落地:农业病虫害图谱跨季节推理验证系统 1. 项目背景与价值 农业病虫害防治一直是农业生产中的重大挑战。传统方法依赖人工观察和经验判断,存在效率低、准确性不足等问题。Llama-3.2V-11B-cot多模态大模型为解决这一难题提供了创…...

5分钟搞定!Fun-ASR-MLT-Nano-2512多语言语音识别一键部署指南

5分钟搞定!Fun-ASR-MLT-Nano-2512多语言语音识别一键部署指南 1. 快速了解Fun-ASR-MLT-Nano-2512 Fun-ASR-MLT-Nano-2512是阿里通义实验室推出的轻量级多语言语音识别模型,特别适合需要本地化部署的场景。这个800M参数的模型虽然小巧,但功能…...

OpenClaw效率对比:GLM-4.7-Flash与云端API实测数据

OpenClaw效率对比:GLM-4.7-Flash与云端API实测数据 1. 测试背景与动机 上周在优化个人自动化工作流时,我遇到了一个实际选择难题:应该用本地部署的GLM-4.7-Flash模型,还是继续使用云端API服务?这个问题看似简单&…...

从0到1:Java+AI入门实战,看完直接上手项目

文章目录前言环境准备:别急着装Python,先把JDK升到21第一滴血:让Java程序说出"人话"进阶玩法:给AI装上"记忆"和"工具"让AI记住你们聊过啥让AI能查数据库、调接口实战项目:搭建私有知识库…...

JSON·学习笔记

“误报。我的安全阀一切正常。” “我们继续,今天我想解释一下什么是JSON。” “是啊,这个词我听过很多次了,什么意思?” “随着网络的发展,带有 JavaScript 的 HTML 页面开始主动与服务器通信并从服务器下载数据。为…...

MBPFan技术解析:MacBook在Linux环境下的智能散热控制机制

MBPFan技术解析:MacBook在Linux环境下的智能散热控制机制 【免费下载链接】mbpfan 项目地址: https://gitcode.com/gh_mirrors/mb/mbpfan 在Linux系统上使用MacBook的用户经常面临散热管理的技术挑战,系统原生的温度控制策略往往无法充分发挥苹果…...

OpenRGB:如何用一个免费开源软件统一管理所有RGB灯光设备?

OpenRGB:如何用一个免费开源软件统一管理所有RGB灯光设备? 【免费下载链接】OpenRGB Open source RGB lighting control that doesnt depend on manufacturer software. Supports Windows, Linux, MacOS. Mirror of https://gitlab.com/CalcProgrammer1/…...

别再让AI芯片‘睡大觉’了:手把手教你用华为昇腾+CANN搞定异构算力调度

华为昇腾CANN实战:破解AI芯片利用率困局的5个关键策略 推开实验室玻璃门,迎面是十几台Atlas 800服务器闪烁的指示灯,而工程师小王正对着监控大屏上30%的平均利用率皱眉——这场景在采用国产AI芯片的团队中太常见了。当我们谈论异构算力调度时…...

开源工具赋能PS4玩家:GoldHEN Cheats Manager的全方位游戏体验优化方案

开源工具赋能PS4玩家:GoldHEN Cheats Manager的全方位游戏体验优化方案 【免费下载链接】GoldHEN_Cheat_Manager GoldHEN Cheats Manager 项目地址: https://gitcode.com/gh_mirrors/go/GoldHEN_Cheat_Manager GoldHEN Cheats Manager是一款专为PlayStation …...

Pixel Fashion Atelier基础教程:硬核8-Bit界面操作逻辑与非对称布局解析

Pixel Fashion Atelier基础教程:硬核8-Bit界面操作逻辑与非对称布局解析 1. 像素时装锻造坊简介 Pixel Fashion Atelier是一款基于Stable Diffusion与Anything-v5的图像生成工具,它彻底改变了传统AI工具的界面设计理念。这款工具将复古日系RPG的"…...

HDMI设备开发必看:EDID/E-EDID数据结构全解析(附实战代码)

HDMI设备开发实战:EDID/E-EDID二进制解析与工程实现 当你的HDMI设备无法正确识别显示器分辨率时,屏幕闪烁或黑屏的瞬间是否让你抓狂?作为连接数字世界的桥梁,EDID(Extended Display Identification Data)就…...

feishu2md:飞书文档转Markdown的技术实现与架构解析

feishu2md:飞书文档转Markdown的技术实现与架构解析 【免费下载链接】feishu2md 一键命令下载飞书文档为 Markdown 项目地址: https://gitcode.com/gh_mirrors/fe/feishu2md 飞书文档转Markdown工具feishu2md为技术团队提供了文档格式转换的标准化解决方案。…...

YOLOv7剪枝实战:5种高效剪枝方法对比与代码实现

YOLOv7剪枝实战:5种高效剪枝方法对比与代码实现 在目标检测领域,YOLOv7以其卓越的速度-精度平衡成为工业界宠儿。但当我们将模型部署到边缘设备或需要高吞吐量的生产环境时,原始模型的计算量和参数量往往成为瓶颈。这时,模型剪枝技…...

3个关键步骤:Smiley Sans字体技术优化指南

3个关键步骤:Smiley Sans字体技术优化指南 【免费下载链接】smiley-sans 得意黑 Smiley Sans:一款在人文观感和几何特征中寻找平衡的中文黑体 项目地址: https://gitcode.com/gh_mirrors/smi/smiley-sans 在当今数字化时代,网页性能直…...

别再手动敲代码了!用Tesseract-OCR在Linux上批量处理图片转文字(附Python脚本)

从图片到结构化数据:基于Tesseract-OCR的Linux批量文本提取实战 在数字化办公和自动化流程中,我们经常需要处理大量图片中的文字信息——可能是扫描的合同文档、会议白板照片或是PDF中的非可编辑页面。传统的手动录入不仅效率低下,还容易出错…...

ARM嵌入式开发:寄存器操作与函数指针实战

## 1. 嵌入式开发中的寄存器操作技巧### 1.1 寄存器地址访问方法 在ARM架构嵌入式开发中,直接操作硬件寄存器是底层开发的核心技能。通过C语言访问特定内存地址的标准做法是使用指针类型转换:c #define GSTATUS1 (*(volatile unsigned int *)0x560000B0)…...

coze-loop新手指南:无需配置,开箱即用的代码优化工具

coze-loop新手指南:无需配置,开箱即用的代码优化工具 1. 为什么你需要一个代码优化助手 想象一下这样的场景:你刚刚写完一段功能代码,运行起来没问题,但总觉得哪里不够完美。可能是执行速度不够快,或者代…...

告别DWA!用TEB局部规划器让你的ROS机器人学会‘倒车入库’(附多机编队避障实测对比)

告别DWA!用TEB局部规划器解锁机器人高阶机动能力 在机器人自主导航领域,传统动态窗口方法(DWA)长期占据主导地位,直到开发者们遇到那些需要倒车、急转弯或狭窄空间多机协作的真实场景。想象一下仓储机器人需要在货架间完成"倒车入库&quo…...

RWKV7-1.5B-g1a参数详解:为何默认top_p=0.3更适合中文生成?语言分布实证

RWKV7-1.5B-g1a参数详解:为何默认top_p0.3更适合中文生成?语言分布实证 1. 模型概述 rwkv7-1.5B-g1a是基于RWKV-7架构的多语言文本生成模型,特别适合中文场景下的基础问答、文案续写和简短总结任务。作为1.5B参数量的轻量级模型&#xff0c…...

如何快速掌握终端数字雨效果:完整跨平台配置指南

如何快速掌握终端数字雨效果:完整跨平台配置指南 【免费下载链接】cmatrix Terminal based "The Matrix" like implementation 项目地址: https://gitcode.com/gh_mirrors/cm/cmatrix 想在终端中重现《黑客帝国》电影里的经典数字雨场景吗&#xf…...

FanControl终极指南:如何在Windows上实现专业级风扇控制与噪音优化[特殊字符]

FanControl终极指南:如何在Windows上实现专业级风扇控制与噪音优化🔥 【免费下载链接】FanControl.Releases This is the release repository for Fan Control, a highly customizable fan controlling software for Windows. 项目地址: https://gitco…...

大语言模型推理能力突破

大语言模型原生推理能力增强课题 目录 大语言模型原生推理能力增强课题 当前LLM深层符号推理的核心瓶颈(结合场景实例) 1. 幻觉频发:符号推理的事实一致性崩塌 2. 自我纠错能力弱:缺乏闭环的校验与修正机制 3. 推理链条易断裂:长程逻辑依赖的一致性丢失 全链路原生推理能…...

Opencascade避坑指南:Select()函数7个常见使用误区与调试技巧

Opencascade避坑指南:Select()函数7个常见使用误区与调试技巧 在三维建模和CAD开发领域,Opencascade作为一款强大的开源几何内核,其交互功能一直是开发者关注的焦点。而AIS_InteractiveContext中的Select()函数,作为对象选取的核心…...

Pixel Dimension Fissioner 与3D渲染结合:生成像素风格贴图与法线贴图

Pixel Dimension Fissioner 与3D渲染结合:生成像素风格贴图与法线贴图 1. 效果亮点预览 Pixel Dimension Fissioner在3D图形管线中展现出令人惊喜的适配性。这个工具最吸引人的地方在于,它能将传统像素艺术与现代3D渲染技术无缝结合,创造出…...

资源捕获高效解决方案:猫抓浏览器扩展让媒体提取更简单

资源捕获高效解决方案:猫抓浏览器扩展让媒体提取更简单 【免费下载链接】cat-catch 猫抓 chrome资源嗅探扩展 项目地址: https://gitcode.com/GitHub_Trending/ca/cat-catch 在当今数字时代,我们每天都在网页上浏览大量的媒体内容,从精…...

3步搞定黑苹果配置:OpCore-Simplify让EFI构建效率提升80%的智能方案

3步搞定黑苹果配置:OpCore-Simplify让EFI构建效率提升80%的智能方案 【免费下载链接】OpCore-Simplify A tool designed to simplify the creation of OpenCore EFI 项目地址: https://gitcode.com/GitHub_Trending/op/OpCore-Simplify 你是否经历过这些痛苦…...