媒体融合发展走过十年,以AIGC(人工智能生产内容)为代表的人工智能技术加速迭代演进,媒体融合进入媒体智能化快速发展新时代。在华为、科大讯飞等展区,记者看到,在虚拟的演播室中,它们打造的AI数字人高度复刻真人声音和形象,在进行融媒体内容播报时,发音清晰且充满情感,肢体动作、表情、口型等表现自然。
华为云现场负责人肖淑玲告诉记者,基于华为云盘古基础大模型能力、渲染引擎和实时音视频能力,每个用户可以结合个人数据进行训练,构建自己的数字人个性化大模型。数字人模型生成后,用户通过文字、语音、视频等方式生产驱动向量信息,从而驱动数字人生成高清视频。而科大讯飞的龙雪琴介绍,在这个“演播室”里,用户可以快速定制虚拟人的形象和声音,简单地输入文本或录音,就可一键完成音、视频作品的输出。
本届技术展上,腾讯展出了自研AI通用作曲框架XMusic,用户利用图片、文字、视频乃至哼唱,都可使XMusic生成对应的乐曲。
“7×24小时不间断开播,还能回答粉丝提问……”谦语智能带来的AI数字人直播解决方案,也让人眼前一亮《外围球赛下单》。活跃在各平台上的40多万个人物形象,在不断引导关注、抢购甚至秒杀……若非现场工作人员讲解,记者很难分辨画面里的主播是真人还是AI数字人。