0. 首先感谢@孔秋强 大佬提供的转录技术背景~

1. git clone https://github.com/bytedance/GiantMIDI-Piano.git 克隆项目到本地

2. 新建works文件夹,并建立midis、mp3s_piano_solo两个文件夹,同时将以下csv文件放进该文件夹

文件下载:full_music_pieces_youtube_similarity_pianosoloprob

GiantMIDI-Piano使用指南(win10)

最终结果如图↑

3. 下载EmEdtior编辑csv文件:https://zh-cn.emeditor.com/text-editor-features/history/emeditor-free/

GiantMIDI-Piano使用指南(win10)GiantMIDI-Piano使用指南(win10)

 

 

 

 

 

 

 

 

首先通过「调出csv工具栏→制表符」的方式格式化读取这个文件

GiantMIDI-Piano使用指南(win10)

接着按照这个规律添加你要转录的音频文件名,可添加多行,并把相关文件放入mp3s_piano_solo文件夹(记住文件名一一对应,改完别忘了保存文件)

4. win10部署wget:https://blog.csdn.net/qq_31163325/article/details/84344774

5. win10部署ffmpeg:https://www.gyan.dev/ffmpeg/builds/ffmpeg-release-full.7z(记得配置环境变量,使之全局皆可调用ffmpeg)

6. 执行pip install -r requirements.txt安装依赖(这一步可能比较坑,比如pytorch、cuda的安装之类的,建议参考b站相关教程,由于每个人配置不同差异比较大就不展开,实在不行直接cpu运算吧,实测和gpu相比也不会差太久……)

7. 新建这个文件夹:C:\Users\你的管理员名称\piano_transcription_inference_data,将这个文件(提取码「hks0」)放进去

8. (可做可不做)有条件的同学把梯子打开为全局模式

9. 在项目根目录执行以下命令:python audios_to_midis.py transcribe_piano --workspace="./works" --mp3s_dir="./works/mp3s_piano_solo" --midis_dir="./works/midis" --begin_ind=0 --end_index=(你刚才放入的文件数)

10. 等待结果输出至midis文件夹


具体效果展示:https://www.bilibili.com/video/BV1ia411A7ur


人生有無數種可能,人生有無限的精彩,人生沒有盡頭。一個人只要足夠的愛自己,尊重自己內心的聲音,就算是真正的活著。