当前位置: 首页 > news >正文

清华系“仓颉”来袭:图形起源:用AI颠覆字体设计,推动大模型商业化落地

大模型如何落地?又该如何实现商业化?这一议题已成为今年科技领域的焦点话题。

在一个鲜为人知的字体设计赛道上,清华创业公司“图形起源”悄然实现了商业变现:他们帮助字体公司将成本降低了80%,生产速度提升了10倍以上。Canva可画平台上最受欢迎的前100套中文字体,大部分都是通过他们的算法生成的。

图片

图片

这个市场虽然规模较小,但需求却十分迫切。设计公司和字体公司长期以来深受版权费用的困扰。而图形起源凭借其在图形学和AI方面的技术优势,提供了人工无法匹敌的效率与精度。

接下来,让我们来看看他们是如何通过AI造字,发现并实现商业化的。

靠AI造字赚钱,提速10倍以上

首先,什么是字体生产?在传统的字体生产流程中,设计师通常需要手写完成整套字体的制作(最多近3万个字)。初稿完成后,还需逐字校对,这个过程往往需要数月,带来不小的成本开销。此外,由于依赖人工操作,字体的质量和风格一致性也难以保证。

正是在与客户交流时,图形起源团队发现了这一行业痛点,经过数月的研发,打造了一条全新的AI字体生产线。

但这不是简单套用大模型就能解决的。字体设计最大的挑战在于,它是一种矢量图形,能够在放大时保持清晰度。而现有的AI图像生成通常是位图,受像素限制。如何让AI生成矢量图,并理解字体的锚点和矢量曲线的含义,是其中的技术难点。

创始人史海天分享了他们的解决思路,整个流程分为四个阶段:

首先,使用传统的扩散模型生成位图;
接着,利用超分辨率模型将位图分辨率提升到最高;
然后,通过一种独特的算法,让AI理解“优质矢量设计”的标准,并基于这一标准优化模型,将位图转化为矢量图;
最后,训练一个专门用于检查错别字和字形结构的模型。

此外,他们还计划开发笔画拆分模型,进一步提升精度。

基于这些技术,他们实现了超越人类的效率和质量。例如,通过AI超分技术和AI矢量化处理,字体的细节在各种尺寸下都保持清晰,设计师可以在海报等大幅面场景中自如应用。

图片

客户只需制作前199个字,AI便能在两天内生成数万个字,并且不局限于简体,还包括繁体字、生僻字、以及日文、韩文、拉丁字母等多种语言文字。

在准确度方面,简单字形(笔画少于15)单次生成的错误率低于1%,复杂字形(笔画多于15)错误率也不到5%,远高于人工审校的水平。

目前,他们还打造了一个SaaS平台,整个交付过程可以在线完成,客户可以随时查看进度,甚至自己完成字体的生产过程,无需图形起源的人工干预。

据透露,目前他们已经生成了346套字体,累计4680244个字。

来自图形起源

图形起源成立于2020年底,由清华大学车辆学院毕业生史海天在硕士休学期间创办。在此之前,他们主要研发3D创作引擎,并完成了三轮融资,获得了五源资本和真格基金等机构的支持。彼时,他们的愿景是打造一个大众化的3D内容创作工具及社交平台。

如今,大模型技术的突破为他们带来了全新的机遇。通过大量资金和时间的投入,图形起源最终成功训练了两个大模型——一个用于识别,另一个用于生成,其目标是让AI生成的字体与人工设计难以区分。

字体行业的一个优势在于,数据相对齐全。例如,AI可以从一套字形中学习一半字,进而生成剩余的部分。如今,他们已经达到了商用交付的水平,每周可完成超过40套字体的交付,效率提升了数百倍。

当前的主营业务

图形起源的业务主要集中在两个方面:

图片

中文字库扩展:客户提供参考字体文件后,图形起源的AI会进行学习,生成风格统一的字形,整个过程在SaaS平台上进行。平台还支持人工校对、二次学习、批量生成等功能,以进一步降低错字率。

图片

跨语种风格迁移:他们的AI能够根据任意语种的字体生成其他语种的字形。目前支持中日韩、拉丁字母、希腊字母等,且已在小米应用商店销售。藏文、阿拉伯文等小语种也在测试中。

尽管大厂们在生产力领域激烈竞争,但在具体的细分场景下,创业公司往往可以找到更为灵活的切入点。图形起源在字体和排版等强需求领域的成功就是一个例子。

大模型应用的关键在于能否解决实际问题,而图形起源已经用他们的创新回答了这一命题。

相关文章:

清华系“仓颉”来袭:图形起源:用AI颠覆字体设计,推动大模型商业化落地

大模型如何落地?又该如何实现商业化?这一议题已成为今年科技领域的焦点话题。 在一个鲜为人知的字体设计赛道上,清华创业公司“图形起源”悄然实现了商业变现:他们帮助字体公司将成本降低了80%,生产速度提升了10倍以上…...

分布式一致性协议的深度解析:Paxos与Raft

分布式系统的复杂性源于节点失效、网络分区、消息丢失等诸多不确定性。在这种背景下,分布式一致性问题应运而生,成为解决这些问题的核心。本文将从理论到实践,深入探讨两种经典的一致性协议:Paxos与Raft。文章适合有一定分布式系统…...

ai写作,五款软件助你快速写作!

在这个信息爆炸的时代,内容创作成为了连接用户、传递价值的桥梁。然而,面对日益增长的创作需求,如何在保证质量的同时提升效率,成为了每位创作者面临的难题。幸运的是,随着人工智能技术的飞速发展,AI写作软…...

解决JavaScript 数学运算精度丢失的问题

JavaScript 中执行浮点数运算时可能会遇到精度丢失的问题。这通常是因为浮点数的表示遵循IEEE 754标准,而这种表示法只能精确地表示有限的数字。对于大多数程序员来说,这不是一个问题,因为它允许计算机处理超出精度范围之外的数字。然而&…...

mysql学习教程,从入门到精通,SQL窗口函数(38)

1、SQL窗口函数 SQL窗口函数(Window Functions)是一种强大的数据分析工具,它们允许你在结果集的行上执行计算,而不需要将这些行分组到单独的输出行中。窗口函数通常与OVER()子句一起使用,该子句定义了窗口或分区&…...

gbase8s数据库实现黑白名单的几种方案

1、借用操作系统的黑白名单 2、使用数据库 TRUSTED CONTEXT 机制 CREATE TRUSTED CONTEXT tcx1USER rootATTRIBUTES (ADDRESS 172.16.39.162)ATTRIBUTES (ADDRESS 172.16.39.163)ENABLEWITH USE FOR wangyx WITHOUT AUTHENTICATION; 如上创建 可信任上下文对象 tcx1 在 jdb…...

Qt-窗口布局按钮输入类

1. 窗口布局 Qt 提供了很多摆放控件的辅助工具(又称布局管理器或者布局控件),它们可以完成两件事: 自动调整控件的位置,包括控件之间的间距、对齐等; 当用户调整窗口大小时,位于布局管理器内的…...

Apache DolphinScheduler社区9月进展记录

各位热爱 Apache DolphinScheduler 的小伙伴们,社区 9 月月报更新啦!这里将记录 Apache DolphinScheduler 社区每月的重要更新,欢迎关注! 月度 Merge Star 感谢以下小伙伴上个月为 Apache DolphinScheduler 做的精彩贡献&#x…...

在docker中安装并运行mysql8.0.31

第一步:命令行拉取mysql镜像 docker pull mysql:8.0.31查看是否拉取成功 docker images mysql:latest第二步:运行mysql镜像,启动mysql实例 docker run -p 3307:3307 -e MYSQL_ROOT_PASSWORD"123456" -d mysql:8.0.313307:3307前…...

C++ | Leetcode C++题解之第458题可怜的小猪

题目&#xff1a; 题解&#xff1a; class Solution { public:int poorPigs(int buckets, int minutesToDie, int minutesToTest) {if (buckets 1) {return 0;}vector<vector<int>> combinations(buckets 1,vector<int>(buckets 1));combinations[0][0] …...

【万字长文】Word2Vec计算详解(三)分层Softmax与负采样

【万字长文】Word2Vec计算详解&#xff08;三&#xff09;分层Softmax与负采样 写在前面 第三部分介绍Word2Vec模型的两种优化方案。 【万字长文】Word2Vec计算详解&#xff08;一&#xff09;CBOW模型 markdown行 9000 【万字长文】Word2Vec计算详解&#xff08;二&#xff0…...

【分布式微服务云原生】探索Dubbo:接口定义语言的多样性与选择

目录 探索Dubbo&#xff1a;接口定义语言的多样性与选择引言Dubbo的接口定义语言&#xff08;IDL&#xff09;1. Java接口2. XML配置3. 注解4. Protobuf IDL 流程图&#xff1a;Dubbo服务定义流程表格&#xff1a;Dubbo IDL方式比较结论呼吁行动Excel表格&#xff1a;Dubbo IDL…...

SAP将假脱机(Spool requests)内容转换为PDF文档[RSTXPDFT4]

将假脱机(Spool requests)内容转换为PDF文档[RSTXPDFT4] 有时需要将Spool中的内容导出成PDF文件&#xff0c;sap提供了一个标准程序RSTXPDFT4可以实现此功能。 1, Tcode:SP01, 进入spool requests list 2, SE38 运行程序RSTXPDFT4 输入spool reqeust号码18680&#xff0c;然后…...

DNS能加速游戏吗?

在游戏玩家追求极致游戏体验的今天&#xff0c;任何可能提升游戏性能的因素都备受关注&#xff0c;DNS&#xff08;域名系统&#xff09;便是其中一个被探讨的对象。那么&#xff0c;DNS能加速游戏吗&#xff1f; 首先&#xff0c;我们需要了解DNS的基本功能。DNS就像是互联网…...

Raspberry Pi3B+之C/C++开发环境搭建

Raspberry Pi3B之C/C开发环境搭建 1. 源由2. 环境搭建2.1 搭建C语言开发环境2.2 工程目录结构2.3 Makefile2.4 Demo (main.c) 3. 测试工程3.1 编译3.2 运行 4. 总结5. 参考资料 1. 源由 为了配合《Ardupilot开源飞控之FollowMe验证平台搭建》&#xff0c;以及VINS-Fusion对于图…...

[笔记] 仿射变换性质的代数证明

Title: [笔记] 仿射变换性质的代数证明 文章目录 I. 仿射变换的代数表示II. 仿射变换的性质III. 同素性的代数证明1. 点变换为点2. 直线变换为直线 IV. 结合性的代数证明1. 直线上一点映射为直线上一点2. 直线外一点映射为直线外一点 V. 保持单比的代数证明VI. 平行性的代数证明…...

遥感影像-语义分割数据集:sar水体数据集详细介绍及训练样本处理流程

原始数据集详情 简介&#xff1a;该数据集由WHU-OPT-SAR数据集整理而来&#xff0c;覆盖面积51448.56公里&#xff0c;分辨率为5米。据我们所知&#xff0c;WHU-OPT-SAR是第一个也是最大的土地利用分类数据集&#xff0c;它融合了高分辨率光学和SAR图像&#xff0c;并进行了充…...

极狐GitLab 发布安全补丁版本 17.4.1、17.3.4、17.2.8

GitLab 是一个全球知名的一体化 DevOps 平台&#xff0c;很多人都通过私有化部署 GitLab 来进行源代码托管。极狐GitLab 是 GitLab 在中国的发行版&#xff0c;专门为中国程序员服务。可以一键式部署极狐GitLab。 学习极狐GitLab 的相关资料&#xff1a; 极狐GitLab 官网极狐…...

汽车管理系统中使用函数

目录 setupUisetEnabledcurrentText()setTextsetFocus()query.exec(...)addWidgetconnect setupUi setupUi() 是 ui 对象的一个成员函数&#xff0c;它的作用是根据 .ui 文件中的设计&#xff0c;将设计好的组件&#xff08;如按钮、文本框、布局等&#xff09;添加到当前的窗…...

大数据分析入门概述

大数据分析入门概述 本文旨在为有意向学习数据分析、数据开发等大数据方向的初学者提供一个学习指南&#xff0c;当然如果你希望通过视频课程的方式快速入门&#xff0c;B站UP主戴戴戴师兄的课程质量很高&#xff0c;并且适合初学者快速入门。本文的目的旨在为想要了解大数据但…...

提示工程、微调和 RAG

自众多大型语言模型&#xff08;LLM&#xff09;和高级对话模型发布以来&#xff0c;人们已经运用了各种技术来从这些 AI 系统中提取所需的输出。其中一些方法会改变模型的行为来更好地贴近我们的期望&#xff0c;而另一些方法则侧重于增强我们查询 LLM 的方式&#xff0c;以提…...

自动化测试中如何高效进行元素定位!

前言 在自动化测试中&#xff0c;元素定位是一项非常重要的工作。良好的元素定位可以帮助测试人员处理大量的测试用例&#xff0c;加快测试进度&#xff0c;降低工作负担。但是在实际的测试工作中&#xff0c;我们常常遇到各种各样的定位问题&#xff0c;比如元素定位失败、元…...

UE5数字人制作平台使用及3D模型生成

第10章 数字人制作平台使用及3D模型生成 在数字娱乐、虚拟现实&#xff08;VR&#xff09;、增强现实&#xff08;AR&#xff09;等领域&#xff0c;高质量的3D模型是数字内容创作的核心。本章将引导你了解如何使用UE5&#xff08;Unreal Engine 5&#xff09;虚幻引擎这一强大…...

Linux进程被占用如何杀死进程

文章目录 前言一、根据名称进行查找程序所占用的端口号二、杀死进程总结 前言 由于Linux中&#xff0c;校园网登录的时候容易出现端口被占用&#xff0c;如何快速查找程序所占用的端口号。 提示&#xff1a;以下是本篇文章正文内容&#xff0c;下面案例可供参考 一、根据名称…...

详解Xilinx JESD204B PHY层端口信号含义及动态切换线速率(JESD204B五)

点击进入高速收发器系列文章导航界面 Xilinx官方提供了两个用于开发JESD204B的IP&#xff0c;其中一个完成PHY层设计&#xff0c;另一个完成传输层的逻辑&#xff0c;两个IP必须一起使用才能正常工作。 7系列FPGA只能使用最多12通道的JESD204B协议&#xff0c;线速率为1.0至12.…...

Java面试——场景题

1.如何分批处理数据&#xff1f; 1.使用LIMIT和OFFSET子句&#xff1a; 这是最常用的分批查询方法。例如&#xff0c;你可以使用以下SQL语句来分批查询数据&#xff1a; SELECT * FROM your_table LIMIT 1000 OFFSET 0; 分批查询到的数据在后端进行处理&#xff0c;达到分批…...

xss-labs靶场第一关测试报告

目录 一、测试环境 1、系统环境 2、使用工具/软件 二、测试目的 三、操作过程 1、注入点寻找 2、使用hackbar进行payload测试 3、绕过结果 四、源代码分析 五、结论 一、测试环境 1、系统环境 渗透机&#xff1a;本机(127.0.0.1) 靶 机&#xff1a;本机(127.0.0.…...

微软PowerBI认证!数据分析师入门级证书备考攻略来啦

#微软PowerBI认证&#xff01;数据分析师入门级证书&#xff01; &#x1f603;Power BI是一种强大的数据可视化和分析工具&#xff0c;学习Power BI&#xff0c;能提高数据的分析能力&#xff0c;将数据转化为有意义的见解&#xff0c;并支持数据驱动的决策制定。 ㅤ ✨微软P…...

上海AI Lab视频生成大模型书生.筑梦环境搭建推理测试

引子 最近视频生成大模型层出不穷&#xff0c;上海AI Lab推出新一代视频生成大模型 “书生・筑梦 2.0”(Vchitect 2.0)。根据官方介绍&#xff0c;书生・筑梦 2.0 是集文生视频、图生视频、插帧超分、训练系统一体化的视频生成大模型。OK&#xff0c;那就让我们开始吧。 一、模…...

3D看车如何实现?有哪些功能特点和优势?

3D看车是一种创新的汽车展示方式&#xff0c;它利用三维建模和虚拟现实技术&#xff0c;将汽车以更真实、更立体的形式呈现在消费者面前。 一、3D看车的实现方式 1、三维建模&#xff1a; 通过三维建模技术&#xff0c;按照1:1的比例还原汽车外观&#xff0c;包括车身线条、细…...