刚刚开源!SVG 向量图形生成模型

boyanx8个月前技术教程52

StarVector 这个开源项目有点意思,3 天前开源的:可以把图像和文本生成高质量的可缩放编辑 SVG 图形。

由 ServiceNow Research、Mila 等机构联合开发,并已被 CVPR 2025 会议收录。

1 项目简介

这个 SVG 向量图形生成模型,简单来说可以做下面的事情:

① 你输入一个星星的图标,它就能画出来一个可编辑的 SVG 星星图形。

② 你上传一个 logo 或者表情的图片,它也能转换成可以编辑的 SVG 文件。

StarVector 通过重新定义矢量化任务为代码生成问题,而非传统的图像处理流程,实现了对 SVG 语法的全面支持。

它能够处理包括路径(Path)、圆形、多边形、文本元素等复杂 SVG 元素,生成紧凑且语义丰富的代码。


2 技术架构

StarVector 基于多模态视觉-语言模型(Vision-Language Model),结合了图像编码器与大型语言模型(LLM)的优势:

① 视觉处理:采用 Vision Transformer(ViT)将图像分割为补丁网格,提取视觉嵌入并映射到 LLM 的隐藏空间

② 文本与代码生成:通过 LLM 适配器将视觉或文本输入转换为 SVG 代码序列,支持动态生成结构化图形

③ 统一框架:模型可同时处理图像和文本输入,通过互斥操作(⊕)或序列连接(‖)实现多模态融合

3 核心优势

① 复杂元素处理:传统算法难以生成的文本标签、渐变填充等 SVG 特性,StarVector 能智能识别并生成(如线性渐变代码示例)

② 数据驱动训练:基于大规模数据集 SVG-Stack(含 200 万+ SVG 样本)训练,覆盖图标、标志、技术图表等多种风格

③ 性能领先:在 SVG-Bench 评估中,其生成的 SVG 代码在准确性和渲染质量上显著优于现有方法

开源地址:
https://github.com/joanrod/star-vector

项目介绍:
https://starvector.github.io/

标签: svg 生成

相关文章

绝了!一键用AI生成高颜值动态PPT(附详细步骤+Prompt)

大家好,我是一名酷爱研究AI的产品经理,最近我有个新发现:那些花了你3天做出来的PPT,现在用AI可以1小时搞定!而且颜值还高! 为什么AI做PPT比传统方式效率高10倍?我用一张图就能告诉你: AI...

详细教你微信公众号正文页SVG交互开发

现在很多公众号都直接在正文页通过SVG交互动画增加文章的阅读交互体验,而不再跳转H5。结合这一需求,本期分享的内容是如何开发交互式SVG,并嵌入微信公众号正文页。设计师和前端开发同学都可以来学习下。学...

轻松玩转自定义头像 – 用Multiface打造你的专属形象

从社交媒体平台到专业网络,用户对展示自己个性的方式有着更高的需求。为了满足这种需求,我们开发了一个简单但功能强大的工具——Multiface,它能够为每个用户提供独一无二的自动生成头像。Multifa...

3秒SVG变3D!Vecto3D:免费在线神器,设计师/小白都能用

Vecto3D 是一款免费开源工具,可将简单 SVG(如 Logo)快速转换为可定制 3D 模型,支持调整几何、材质及场景参数,并导出为 GLB、STL 等格式,适用于设计、游戏开发和 3D 打印。...

借助云服务快速生成背景图片

大家在做平面设计、编辑文档、设计网页等时经常会用到背景图片,但网上下载的背景图片有时不能满足实际需求,自己动手制作需要较高的美术功底,相关的制作软件也有一定的上手门槛。其实不用这么麻烦,借助一些云服务...

DeepSeek怎么生成流程图?用这2个绘图软件一键绘制!

DeepSeek从小范围内流行到爆火出圈,用了不到半个月时间,其热度从目前公开的数据可见一斑,一个月内迅速斩获1.25亿用户,日活也随之突破3000万,超越此前表现亮眼的AI工具豆包。DeepSeek...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。