拖入任意 MP3 或 WAV,几秒内得到干净的 MIDI —— 用神经网络音高模型提取旋律、和弦与节奏。
基于 basic-pitch(Spotify Research 开源模型)。
真实数据,不是营销话术。
.mid 是通用格式 —— 下面这些是我们每次发版都会测试的 DAW。
把 .mid 拖到任意 MIDI 轨道
已测试 v11+
File → Open 或拖入工程
已测试 v10.7+
拖到 Channel rack
已测试 v21+
Import → MIDI File
已测试 v12+
把 .mid 拖到任意轨道
已测试 v5+
Insert → Media File
已测试 v6+
拖入 MP3、WAV、FLAC、AIFF、OGG 或 M4A。免费版每个文件最长 10 分钟。
神经网络音高模型识别音符、起音和力度。对各种乐器和人声都稳定。
微调音符、量化、选调,导出为 .mid 或 MusicXML —— 可用于任何 DAW。
MIDI 是演奏格式 —— 记录音符、时间和力度,但不记录视觉记谱。MusicXML 是记谱格式,描述如何渲染乐谱(连音线、滑音、调号等)。AIFlowMusic 两种都导出:DAW 用 MIDI,MuseScore、Sibelius、Finale 等记谱软件用 MusicXML。
Basic-pitch(Spotify Research,2022)开源,在 Vercel Fluid Compute 上效率高,一个模型同时处理单声部和多声部。Onsets-and-Frames 只能处理钢琴。MT3 在某些乐器上更准但慢 10 倍,还要 GPU。做免费即时转换工具,basic-pitch 是最合适的折中。
可以 —— basic-pitch 支持多声部,所以和弦会作为同时的 note-on 事件出现在输出 MIDI 中。你可以拆成单独音符,也可以在 DAW 里当和弦块处理。要更准的和弦识别,建议用分轨而不是完整混音。
从 Finder 或资源管理器把 .mid 拖到 Ableton 的 Session view,会自动新建一个保留所有音符的 MIDI 轨道。挂一个乐器插件(Operator、Wavetable 或任意 VST)就能播放。
File → Open 选择 .mid。Logic 会按 MIDI channel 建好工程,每条作为一条轨道。也可以直接把 .mid 拖到现有工程的 tracks 区域。
在 Vercel Node.js runtime 上转换速度约为实时的 8 倍 —— 10 分钟的文件大约 75 秒。超过 5 分钟的文件会显示进度。Creator 和 Producer 套餐使用优先级 worker。
可以,两个软件都直接支持 .mid。要更好的记谱效果(正确的调号和符干分组),建议用 MusicXML 导出。
上传的音频在内存中处理,24 小时内删除。生成的 .mid 保留在你账号下,可以重新下载。免费版处理但不保存;Creator 和 Producer 套餐保留输出 30 天。