马平认为,“影视AI技术的发展趋势之一就是专业化”。现有AI大模型难以生成高品质的影视作品,无法满足影视产业需求。原因在于其并非针对影视应用设计,用于训练的数据未按照影视制作需求标注。就好比手机像素已经很高,但没有导演会用手机去拍电影,因为影视摄像机需要根据行业需求专门设计,最新问世的谷歌Flow也只是加入了一小部分影视制作功能。
“另一个发展趋势则是通用化。”马平介绍,尽管AI已经被用于不少影视作品的制作之中,但这些AI技术往往针对某个影视作品研发,不具备通用性。换句话说,一部电影中的AI技术很难用于另一部电影。
马平指出,实现专业化和通用化的方式,就是建立我国自主的智能影视制作体系,其根本在于研制具有自主知识产权的影视AI大模型,这个大模型可能由成百上千个小模型构成。例如,智能译制系统,其背后涉及到声音、文本翻译等七八个小模型;而图像生成系统,则需要色彩、光影、运镜等小模型。
数据是AI大模型的基础。马平表示,影视数据的量是足够的,但无论是灯光、运镜,还是转场、表演技巧等都需要影视行业的专业人员去分析、解读和标注。“但影视数据标注的门槛非常高,因为它们涉及到了艺术创新,不是程式化的数据。”他说。
“另一个亟待解决的问题是复合型人才不足。”马平告诉记者,打造智能影视制作体系需要一批既瞭解影视制作,又懂AI技术的复合型人才。这种人才非常稀有,他们正在联合北京邮电大学、中央戏剧学院、中国传媒大学等机构进行培养。
“影视和科技之间的巨大隔阂是影视AI技术发展的最大难点。”赵春燕称,他们曾邀请一些专业的AI模型开发团队帮助园区里的影视后期公司,但后来发现这条路很难走,原因是两个行业间非常难沟通。
马平对此也深有同感。中影研制视频修复模型耗时两个多月,其中一个半月被浪费在反复沟通中,因为算法科学家不理解电影艺术家的要求。后来科学家进入艺术家的摄影棚观察了几天,真正理解了艺术家是如何工作的,很快就完成了开发。
|