0. 首先感谢@孔秋强 大佬提供的转录技术背景~
1. git clone https://github.com/bytedance/GiantMIDI-Piano.git 克隆项目到本地
2. 新建works文件夹,并建立midis、mp3s_piano_solo两个文件夹,同时将以下csv文件放进该文件夹
文件下载:full_music_pieces_youtube_similarity_pianosoloprob
最终结果如图↑
3. 下载EmEdtior编辑csv文件:https://zh-cn.emeditor.com/text-editor-features/history/emeditor-free/
首先通过「调出csv工具栏→制表符」的方式格式化读取这个文件
接着按照这个规律添加你要转录的音频文件名,可添加多行,并把相关文件放入mp3s_piano_solo文件夹(记住文件名一一对应,改完别忘了保存文件)
4. win10部署wget:https://blog.csdn.net/qq_31163325/article/details/84344774
5. win10部署ffmpeg:https://www.gyan.dev/ffmpeg/builds/ffmpeg-release-full.7z(记得配置环境变量,使之全局皆可调用ffmpeg)
6. 执行pip install -r requirements.txt安装依赖(这一步可能比较坑,比如pytorch、cuda的安装之类的,建议参考b站相关教程,由于每个人配置不同差异比较大就不展开,实在不行直接cpu运算吧,实测和gpu相比也不会差太久……)
7. 新建这个文件夹:C:\Users\你的管理员名称\piano_transcription_inference_data,将这个文件(提取码「hks0」)放进去
8. (可做可不做)有条件的同学把梯子打开为全局模式
9. 在项目根目录执行以下命令:python audios_to_midis.py transcribe_piano --workspace="./works" --mp3s_dir="./works/mp3s_piano_solo" --midis_dir="./works/midis" --begin_ind=0 --end_index=(你刚才放入的文件数)
10. 等待结果输出至midis文件夹