- 将「给视频打标签」提上日程,承包给ljw完成素材的自定义裁剪,使用智能场景裁剪工具处理一部分素材,待处理完成后集中打标签(保证视频最大分片在5分钟内,每个长视频片段最多提取2段素材,即2*5,自动化工具提取音乐伴奏打标签)
- 实现服务器矩阵直播,完善几个功能:一个是收集抖音&tiktok博主视频素材,一个是搭建个人户外传媒矩阵(探店、打卡、探险等),十一假期往后开始正式执行,在此之前先通过大厂工作把基础打好,以及购置单反为探店做准备
- 人工智能实现生成剧本——《纷世杂言》(基于gpt3,模型调教中,预计明年启动)
- AVG杂志的投稿企划,讲讲有关人工智能创作(拉投资的好方法,同样分配去明年,今年太特殊不宜搞事)
- 或许,可以还原Neu的歌声?(这个可能需要很多工作经验的支持,放在很后面再实现)
目前进度
媒体相关:
素材准备——原生素材收集完毕,等待裁切(部分交由ljw处理)
同和工作日志——大概率又要咕了
下一阶段
批量给视频片段打标签
购置群晖硬件、搭建分布式视频片段搜索系统
批处理音频、打标签
调教微软小冰等相关旁白生成工具
研究旁白与字幕之间的关系并生成「旁白和字幕相对应的空场视频」@晨旭
合并视频片段和空场视频,实现一句一跳至一句N跳之间的shuffle
和zcb等nlp研究人员讨论提取文字感情相关的标签,并和音频做匹配
把音频也合进视频
进阶
(现在讨论前无古人后无来者的高风险挑战项目)
讨论如何给滤镜打情绪标签并大致归类
按照情绪归类给视频不同的片段加风格类似的滤镜