开源人声分离音频标注工具—基于Python
前言
之前一篇介绍过音频标注开源工具包,大家反馈不错,今天介绍一个更易用专用性的人声分离音频标注开源工具,工具地址在文末。
工具简介
此工具是基于wavesurfer.js与Flask开发。提供Web界面进行人声分离音频标注,wavesurfer.js为此工具提供了简洁清爽的界面。
工具实现了一个核心功能,将音频分割成任意长度,并标注各段音频的标签,以便进行人声分离的训练数据标注或测试。
功能与使用
工具提供了几个标时的实用功能:
- 以不同颜色呈现不同标签的音频段
- Shift+鼠标左键,分割生成新的一段待标注音频
- 单击音频段,弹出标注元数据界面,编辑后保存
- 单击Play按钮,从指定位置开始播放声音
- 单击Export按钮,导出标数据
- 提供mini-map呈现整个音频的波形图,方便查看全局的波形能量
软件地址
https://github.com/smart-audio/audio_diarization_annotation