开源人声分离音频标注工具—基于Python

boyanx5个月前技术教程18

前言

之前一篇介绍过音频标注开源工具包,大家反馈不错,今天介绍一个更易用专用性的人声分离音频标注开源工具,工具地址在文末。

工具简介

此工具是基于wavesurfer.js与Flask开发。提供Web界面进行人声分离音频标注,wavesurfer.js为此工具提供了简洁清爽的界面。

工具实现了一个核心功能,将音频分割成任意长度,并标注各段音频的标签,以便进行人声分离的训练数据标注或测试。

功能与使用

工具提供了几个标时的实用功能:

  • 以不同颜色呈现不同标签的音频段
  • Shift+鼠标左键,分割生成新的一段待标注音频
  • 单击音频段,弹出标注元数据界面,编辑后保存
  • 单击Play按钮,从指定位置开始播放声音
  • 单击Export按钮,导出标数据
  • 提供mini-map呈现整个音频的波形图,方便查看全局的波形能量

软件地址

https://github.com/smart-audio/audio_diarization_annotation

标签: audio.js

相关文章

Reaper有声后期学习笔记5:SWS扩展及音频综合响度

sws扩展官网地址:https://www.reaper.fm/ RP官网可下载此模块安装SWS 是 REAPER 的扩展模块,Rp默认是没有这个模块的,需要自己到Rp官方下载安装。安装后可以实现轨道...

用腾讯优图AI视觉模组做一个驾驶疲劳监测仪

道路千万条,安全第一条,相信每个人都是牢记于心的,“喝酒不开车,开车不喝酒”其实不难,难的是防范始料未及的事件,疲倦就是众多始料未及事件中,杀伤力稳居前排的,前一秒心里还在想坚持坚持,下一秒可能就失去...

聊天音频泄露至第三方,Clubhouse安全性存疑

澎湃新闻记者 承天蒙 综合报道近期大热的邀请制音频聊天室软件Clubhouse可能被第三方窃听。上周末发生的一起攻击,让Clubhouse的安全问题引发了更多网络专家的担忧。据彭博社2月21日报道,C...

免费的网页版全功能合成器 Droid Resonator,还支持 MIDI 等多项功能

Droid Resonator 是一个基于浏览器的、免费的网页版合成器,使用 HTML/JS/CSS 和 Tone.js 构建。它具有6声部的和声功能(可演奏和弦) ,每个声部有3个压控振荡器(VCO...

Howler.js,一款神奇的 JavaScript 开源网络音频工具库

o Github Star: 23.4k[1]o 官网[2]Howler.js 是什么?Howler.js 是一款基于 JavaScript 支持现代网络的音频库,默认使用 Web Audio API...

一文看懂苹果全球开发者大会 五大系统全面升级

来源:环球网【环球网智能报道 记者 张阳】北京时间6月23日凌晨1点,苹果全球开发者大会(WWDC 2020)如期举行,还是那个熟悉的乔布斯剧院,依旧是高水准的视频展示,但是这届WWDC,却是苹果历史...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。