当前位置: 首页 > news >正文

清华系“仓颉”来袭:图形起源:用AI颠覆字体设计,推动大模型商业化落地

大模型如何落地?又该如何实现商业化?这一议题已成为今年科技领域的焦点话题。

在一个鲜为人知的字体设计赛道上,清华创业公司“图形起源”悄然实现了商业变现:他们帮助字体公司将成本降低了80%,生产速度提升了10倍以上。Canva可画平台上最受欢迎的前100套中文字体,大部分都是通过他们的算法生成的。

图片

图片

这个市场虽然规模较小,但需求却十分迫切。设计公司和字体公司长期以来深受版权费用的困扰。而图形起源凭借其在图形学和AI方面的技术优势,提供了人工无法匹敌的效率与精度。

接下来,让我们来看看他们是如何通过AI造字,发现并实现商业化的。

靠AI造字赚钱,提速10倍以上

首先,什么是字体生产?在传统的字体生产流程中,设计师通常需要手写完成整套字体的制作(最多近3万个字)。初稿完成后,还需逐字校对,这个过程往往需要数月,带来不小的成本开销。此外,由于依赖人工操作,字体的质量和风格一致性也难以保证。

正是在与客户交流时,图形起源团队发现了这一行业痛点,经过数月的研发,打造了一条全新的AI字体生产线。

但这不是简单套用大模型就能解决的。字体设计最大的挑战在于,它是一种矢量图形,能够在放大时保持清晰度。而现有的AI图像生成通常是位图,受像素限制。如何让AI生成矢量图,并理解字体的锚点和矢量曲线的含义,是其中的技术难点。

创始人史海天分享了他们的解决思路,整个流程分为四个阶段:

首先,使用传统的扩散模型生成位图;
接着,利用超分辨率模型将位图分辨率提升到最高;
然后,通过一种独特的算法,让AI理解“优质矢量设计”的标准,并基于这一标准优化模型,将位图转化为矢量图;
最后,训练一个专门用于检查错别字和字形结构的模型。

此外,他们还计划开发笔画拆分模型,进一步提升精度。

基于这些技术,他们实现了超越人类的效率和质量。例如,通过AI超分技术和AI矢量化处理,字体的细节在各种尺寸下都保持清晰,设计师可以在海报等大幅面场景中自如应用。

图片

客户只需制作前199个字,AI便能在两天内生成数万个字,并且不局限于简体,还包括繁体字、生僻字、以及日文、韩文、拉丁字母等多种语言文字。

在准确度方面,简单字形(笔画少于15)单次生成的错误率低于1%,复杂字形(笔画多于15)错误率也不到5%,远高于人工审校的水平。

目前,他们还打造了一个SaaS平台,整个交付过程可以在线完成,客户可以随时查看进度,甚至自己完成字体的生产过程,无需图形起源的人工干预。

据透露,目前他们已经生成了346套字体,累计4680244个字。

来自图形起源

图形起源成立于2020年底,由清华大学车辆学院毕业生史海天在硕士休学期间创办。在此之前,他们主要研发3D创作引擎,并完成了三轮融资,获得了五源资本和真格基金等机构的支持。彼时,他们的愿景是打造一个大众化的3D内容创作工具及社交平台。

如今,大模型技术的突破为他们带来了全新的机遇。通过大量资金和时间的投入,图形起源最终成功训练了两个大模型——一个用于识别,另一个用于生成,其目标是让AI生成的字体与人工设计难以区分。

字体行业的一个优势在于,数据相对齐全。例如,AI可以从一套字形中学习一半字,进而生成剩余的部分。如今,他们已经达到了商用交付的水平,每周可完成超过40套字体的交付,效率提升了数百倍。

当前的主营业务

图形起源的业务主要集中在两个方面:

图片

中文字库扩展:客户提供参考字体文件后,图形起源的AI会进行学习,生成风格统一的字形,整个过程在SaaS平台上进行。平台还支持人工校对、二次学习、批量生成等功能,以进一步降低错字率。

图片

跨语种风格迁移:他们的AI能够根据任意语种的字体生成其他语种的字形。目前支持中日韩、拉丁字母、希腊字母等,且已在小米应用商店销售。藏文、阿拉伯文等小语种也在测试中。

尽管大厂们在生产力领域激烈竞争,但在具体的细分场景下,创业公司往往可以找到更为灵活的切入点。图形起源在字体和排版等强需求领域的成功就是一个例子。

大模型应用的关键在于能否解决实际问题,而图形起源已经用他们的创新回答了这一命题。

相关文章:

清华系“仓颉”来袭:图形起源:用AI颠覆字体设计,推动大模型商业化落地

大模型如何落地?又该如何实现商业化?这一议题已成为今年科技领域的焦点话题。 在一个鲜为人知的字体设计赛道上,清华创业公司“图形起源”悄然实现了商业变现:他们帮助字体公司将成本降低了80%,生产速度提升了10倍以上…...

分布式一致性协议的深度解析:Paxos与Raft

分布式系统的复杂性源于节点失效、网络分区、消息丢失等诸多不确定性。在这种背景下,分布式一致性问题应运而生,成为解决这些问题的核心。本文将从理论到实践,深入探讨两种经典的一致性协议:Paxos与Raft。文章适合有一定分布式系统…...

ai写作,五款软件助你快速写作!

在这个信息爆炸的时代,内容创作成为了连接用户、传递价值的桥梁。然而,面对日益增长的创作需求,如何在保证质量的同时提升效率,成为了每位创作者面临的难题。幸运的是,随着人工智能技术的飞速发展,AI写作软…...

解决JavaScript 数学运算精度丢失的问题

JavaScript 中执行浮点数运算时可能会遇到精度丢失的问题。这通常是因为浮点数的表示遵循IEEE 754标准,而这种表示法只能精确地表示有限的数字。对于大多数程序员来说,这不是一个问题,因为它允许计算机处理超出精度范围之外的数字。然而&…...

mysql学习教程,从入门到精通,SQL窗口函数(38)

1、SQL窗口函数 SQL窗口函数(Window Functions)是一种强大的数据分析工具,它们允许你在结果集的行上执行计算,而不需要将这些行分组到单独的输出行中。窗口函数通常与OVER()子句一起使用,该子句定义了窗口或分区&…...

gbase8s数据库实现黑白名单的几种方案

1、借用操作系统的黑白名单 2、使用数据库 TRUSTED CONTEXT 机制 CREATE TRUSTED CONTEXT tcx1USER rootATTRIBUTES (ADDRESS 172.16.39.162)ATTRIBUTES (ADDRESS 172.16.39.163)ENABLEWITH USE FOR wangyx WITHOUT AUTHENTICATION; 如上创建 可信任上下文对象 tcx1 在 jdb…...

Qt-窗口布局按钮输入类

1. 窗口布局 Qt 提供了很多摆放控件的辅助工具(又称布局管理器或者布局控件),它们可以完成两件事: 自动调整控件的位置,包括控件之间的间距、对齐等; 当用户调整窗口大小时,位于布局管理器内的…...

Apache DolphinScheduler社区9月进展记录

各位热爱 Apache DolphinScheduler 的小伙伴们,社区 9 月月报更新啦!这里将记录 Apache DolphinScheduler 社区每月的重要更新,欢迎关注! 月度 Merge Star 感谢以下小伙伴上个月为 Apache DolphinScheduler 做的精彩贡献&#x…...

在docker中安装并运行mysql8.0.31

第一步:命令行拉取mysql镜像 docker pull mysql:8.0.31查看是否拉取成功 docker images mysql:latest第二步:运行mysql镜像,启动mysql实例 docker run -p 3307:3307 -e MYSQL_ROOT_PASSWORD"123456" -d mysql:8.0.313307:3307前…...

C++ | Leetcode C++题解之第458题可怜的小猪

题目&#xff1a; 题解&#xff1a; class Solution { public:int poorPigs(int buckets, int minutesToDie, int minutesToTest) {if (buckets 1) {return 0;}vector<vector<int>> combinations(buckets 1,vector<int>(buckets 1));combinations[0][0] …...

【万字长文】Word2Vec计算详解(三)分层Softmax与负采样

【万字长文】Word2Vec计算详解&#xff08;三&#xff09;分层Softmax与负采样 写在前面 第三部分介绍Word2Vec模型的两种优化方案。 【万字长文】Word2Vec计算详解&#xff08;一&#xff09;CBOW模型 markdown行 9000 【万字长文】Word2Vec计算详解&#xff08;二&#xff0…...

【分布式微服务云原生】探索Dubbo:接口定义语言的多样性与选择

目录 探索Dubbo&#xff1a;接口定义语言的多样性与选择引言Dubbo的接口定义语言&#xff08;IDL&#xff09;1. Java接口2. XML配置3. 注解4. Protobuf IDL 流程图&#xff1a;Dubbo服务定义流程表格&#xff1a;Dubbo IDL方式比较结论呼吁行动Excel表格&#xff1a;Dubbo IDL…...

SAP将假脱机(Spool requests)内容转换为PDF文档[RSTXPDFT4]

将假脱机(Spool requests)内容转换为PDF文档[RSTXPDFT4] 有时需要将Spool中的内容导出成PDF文件&#xff0c;sap提供了一个标准程序RSTXPDFT4可以实现此功能。 1, Tcode:SP01, 进入spool requests list 2, SE38 运行程序RSTXPDFT4 输入spool reqeust号码18680&#xff0c;然后…...

DNS能加速游戏吗?

在游戏玩家追求极致游戏体验的今天&#xff0c;任何可能提升游戏性能的因素都备受关注&#xff0c;DNS&#xff08;域名系统&#xff09;便是其中一个被探讨的对象。那么&#xff0c;DNS能加速游戏吗&#xff1f; 首先&#xff0c;我们需要了解DNS的基本功能。DNS就像是互联网…...

Raspberry Pi3B+之C/C++开发环境搭建

Raspberry Pi3B之C/C开发环境搭建 1. 源由2. 环境搭建2.1 搭建C语言开发环境2.2 工程目录结构2.3 Makefile2.4 Demo (main.c) 3. 测试工程3.1 编译3.2 运行 4. 总结5. 参考资料 1. 源由 为了配合《Ardupilot开源飞控之FollowMe验证平台搭建》&#xff0c;以及VINS-Fusion对于图…...

[笔记] 仿射变换性质的代数证明

Title: [笔记] 仿射变换性质的代数证明 文章目录 I. 仿射变换的代数表示II. 仿射变换的性质III. 同素性的代数证明1. 点变换为点2. 直线变换为直线 IV. 结合性的代数证明1. 直线上一点映射为直线上一点2. 直线外一点映射为直线外一点 V. 保持单比的代数证明VI. 平行性的代数证明…...

遥感影像-语义分割数据集:sar水体数据集详细介绍及训练样本处理流程

原始数据集详情 简介&#xff1a;该数据集由WHU-OPT-SAR数据集整理而来&#xff0c;覆盖面积51448.56公里&#xff0c;分辨率为5米。据我们所知&#xff0c;WHU-OPT-SAR是第一个也是最大的土地利用分类数据集&#xff0c;它融合了高分辨率光学和SAR图像&#xff0c;并进行了充…...

极狐GitLab 发布安全补丁版本 17.4.1、17.3.4、17.2.8

GitLab 是一个全球知名的一体化 DevOps 平台&#xff0c;很多人都通过私有化部署 GitLab 来进行源代码托管。极狐GitLab 是 GitLab 在中国的发行版&#xff0c;专门为中国程序员服务。可以一键式部署极狐GitLab。 学习极狐GitLab 的相关资料&#xff1a; 极狐GitLab 官网极狐…...

汽车管理系统中使用函数

目录 setupUisetEnabledcurrentText()setTextsetFocus()query.exec(...)addWidgetconnect setupUi setupUi() 是 ui 对象的一个成员函数&#xff0c;它的作用是根据 .ui 文件中的设计&#xff0c;将设计好的组件&#xff08;如按钮、文本框、布局等&#xff09;添加到当前的窗…...

大数据分析入门概述

大数据分析入门概述 本文旨在为有意向学习数据分析、数据开发等大数据方向的初学者提供一个学习指南&#xff0c;当然如果你希望通过视频课程的方式快速入门&#xff0c;B站UP主戴戴戴师兄的课程质量很高&#xff0c;并且适合初学者快速入门。本文的目的旨在为想要了解大数据但…...

新手避坑指南:你的FPGA按键消抖仿真为什么和板子对不上?

FPGA按键消抖实战&#xff1a;从仿真完美到真实失效的深度排查手册 刚接触FPGA开发的工程师常会遇到一个诡异现象&#xff1a;按键消抖模块在ModelSim里跑得风生水起&#xff0c;波形干净漂亮&#xff0c;可一旦下载到开发板就各种失灵——要么按键没反应&#xff0c;要么按一次…...

EPM900编程器HEX文件烧录指南与技巧

1. EPM900编程器与HEX文件烧录概述 EPM900是Keil公司推出的一款LPC系列微控制器仿真编程器&#xff0c;主要用于NXP LPC系列ARM芯片的调试与程序烧录。在实际工程开发中&#xff0c;我们经常需要将编译生成的HEX文件直接烧录到目标芯片中&#xff0c;而EPM900恰好支持这一功能。…...

SystemC随机验证环境构建:从约束生成到覆盖率驱动的自动化测试

1. 项目概述&#xff1a;从确定性仿真到随机验证的跨越在芯片设计和验证领域&#xff0c;SystemC 早已不是陌生的名字。它作为 C 的类库扩展&#xff0c;为系统级建模和硬件/软件协同验证提供了强大的框架。然而&#xff0c;很多刚接触 SystemC 验证的朋友&#xff0c;往往止步…...

STM32F030 HAL库驱动W25Q16实战:从数据手册到SPI读写代码(附避坑指南)

STM32F030 HAL库驱动W25Q16实战&#xff1a;从数据手册到SPI读写代码&#xff08;附避坑指南&#xff09; 1. 理解W25Q16存储芯片的核心特性 W25Q16作为一款16Mbit容量的SPI Flash存储器&#xff0c;在嵌入式系统中扮演着重要角色。这款芯片采用标准的SPI接口&#xff0c;支持单…...

Ecco架构:突破LLM推理内存墙的熵编码优化方案

1. Ecco架构&#xff1a;突破LLM推理的内存墙在A100 GPU上运行LLaMA-70B模型时&#xff0c;仅权重参数就占用140GB显存&#xff0c;而HBM带宽仅有2TB/s——这就是典型的"内存墙"问题。传统解决方案如量化会损失精度&#xff0c;而单纯增加硬件成本又面临边际效益递减…...

告别WPF默认丑界面:用MahApps.Metro快速打造现代化桌面应用(Visual Studio 2022实战)

用MahApps.Metro重塑WPF应用&#xff1a;从传统到现代的视觉革命 当用户第一次打开一个默认样式的WPF应用时&#xff0c;那种扑面而来的Windows XP时代感往往让人失望。作为开发者&#xff0c;我们花费大量时间在功能实现上&#xff0c;却常常因为UI的陈旧感而让整个应用显得廉…...

告别龟速!实测PyTorch在Mac M1 GPU(MPS)上跑ResNet比CPU快了多少?

Mac M1 GPU加速实战&#xff1a;PyTorch MPS性能对比与优化指南 当苹果推出M1芯片时&#xff0c;整个科技圈都为它的能效比惊叹。但作为机器学习从业者&#xff0c;我们更关心的是&#xff1a;这块集成GPU到底能为我们的模型训练带来多少实际加速&#xff1f;本文将带你深入实测…...

别再只问ChatGPT答案了!试试这个Prompt技巧,让大模型把解题思路‘说’给你听

解锁大模型思维密码&#xff1a;用Prompt技巧让AI展示完整推理路径 当你向ChatGPT抛出一个复杂问题时&#xff0c;是否曾对那个突然出现的最终答案感到困惑&#xff1f;就像看到魔术师从空帽子中变出兔子&#xff0c;却不知道机关在哪里。现代大型语言模型确实能给出惊人准确的…...

Redis 持久化机制:RDB、AOF 与混合持久化

Redis 持久化机制&#xff1a;RDB、AOF 与混合持久化 面试热度&#xff1a;⭐⭐⭐⭐⭐ 前置知识&#xff1a;Redis 基本数据结构、Linux 进程 fork 概念 &#x1f4d1; 目录&#xff08;点击跳转&#xff09; 1. 为什么 Redis 需要持久化2. RDB 持久化 2.1 基本原理2.2 RDB 的…...

STR71X中断服务程序定位与Keil MDK配置详解

1. STR71X中断服务程序定位问题解析在基于ARM7架构的STR71X系列微控制器开发过程中&#xff0c;中断服务程序(ISR)的定位是一个关键但容易被忽视的技术细节。STR71X采用增强型中断控制器(EIC)&#xff0c;其硬件设计要求所有中断服务例程必须位于同一个64KB内存段内。这个限制源…...