刚刚开源!SVG 向量图形生成模型

boyanx2个月前技术教程15

StarVector 这个开源项目有点意思,3 天前开源的:可以把图像和文本生成高质量的可缩放编辑 SVG 图形。

由 ServiceNow Research、Mila 等机构联合开发,并已被 CVPR 2025 会议收录。

1 项目简介

这个 SVG 向量图形生成模型,简单来说可以做下面的事情:

① 你输入一个星星的图标,它就能画出来一个可编辑的 SVG 星星图形。

② 你上传一个 logo 或者表情的图片,它也能转换成可以编辑的 SVG 文件。

StarVector 通过重新定义矢量化任务为代码生成问题,而非传统的图像处理流程,实现了对 SVG 语法的全面支持。

它能够处理包括路径(Path)、圆形、多边形、文本元素等复杂 SVG 元素,生成紧凑且语义丰富的代码。


2 技术架构

StarVector 基于多模态视觉-语言模型(Vision-Language Model),结合了图像编码器与大型语言模型(LLM)的优势:

① 视觉处理:采用 Vision Transformer(ViT)将图像分割为补丁网格,提取视觉嵌入并映射到 LLM 的隐藏空间

② 文本与代码生成:通过 LLM 适配器将视觉或文本输入转换为 SVG 代码序列,支持动态生成结构化图形

③ 统一框架:模型可同时处理图像和文本输入,通过互斥操作(⊕)或序列连接(‖)实现多模态融合

3 核心优势

① 复杂元素处理:传统算法难以生成的文本标签、渐变填充等 SVG 特性,StarVector 能智能识别并生成(如线性渐变代码示例)

② 数据驱动训练:基于大规模数据集 SVG-Stack(含 200 万+ SVG 样本)训练,覆盖图标、标志、技术图表等多种风格

③ 性能领先:在 SVG-Bench 评估中,其生成的 SVG 代码在准确性和渲染质量上显著优于现有方法

开源地址:
https://github.com/joanrod/star-vector

项目介绍:
https://starvector.github.io/

标签: svg 生成

相关文章

DeepSeek怎么生成流程图?用这2个绘图软件一键绘制!

DeepSeek从小范围内流行到爆火出圈,用了不到半个月时间,其热度从目前公开的数据可见一斑,一个月内迅速斩获1.25亿用户,日活也随之突破3000万,超越此前表现亮眼的AI工具豆包。DeepSeek...

AI一键生成思维导图/流程图/PPT!有这神器,办公再也不发愁!

DeepSeek大火,对普通人而言,除了像之前和AI各种侃大山聊天,其实DeepSeek推理模式的使用场景非常广泛,可在我们的工作、学习、生活方方面面发挥作用,助我们达成各种目标。诚然DeepSeek...

文章和PPT配图有救了!SVG绘图专家智能体大揭秘

阿里妹导读 本文分享如何使用 DeepSeek-V3-0324 和 Claude 3.5 或...

详细教你微信公众号正文页SVG交互开发

现在很多公众号都直接在正文页通过SVG交互动画增加文章的阅读交互体验,而不再跳转H5。结合这一需求,本期分享的内容是如何开发交互式SVG,并嵌入微信公众号正文页。设计师和前端开发同学都可以来学习下。学...

Net.Codecrete.QrCodeGenerator:NET平台上的QR码生成利器

大家好,我是深山踏红叶,今天要介绍一个二维码生成的免费库 Net.Codecrete.QrCodeGenerator 用于生成二维码。非常简洁、易用,且可以生成符合二维码标准的二维码图像。前言Net....

Deepseek生成图片的几个方法,示例模板附上

针对DeepSeek生成图片场景设计的原创提示语模板及示例,结合了多步引导、参数化要求和第三方工具协同策略,可适配不同设计需求:一、SVG代码生成法(适用技术型用户)提示语结构:请将下方文本内容转化为...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。