习近平总书记强调:“必须加强科技创新特别是原创性、颠覆性科技创新,加快实现高水平科技自立自强,打好关键核心技术攻坚战,使原创性、颠覆性科技创新成果竞相涌现,培育发展新质生产力的新动能。”

当前,全球科技创新进入空前密集活跃期,人工智能(AI)等新兴技术进入发展快车道,新一轮科技革命和产业变革正在重构全球创新版图。数字化浪潮中,人工智能已成为推动各行各业变革的关键力量;媒体行业作为信息传播的核心领域,全产业链条正经历着技术加速迭代、业务快速更新的变革。2024年2月,OpenAI推出Sora文生视频大模型,实现了分钟级长视频生成,带来人工智能又一次突破,更展现出生成式人工智能技术在内容生产供给侧的无限创造潜力和未来应用可能性。2024年《政府工作报告》首次提出开展“人工智能+”行动,可以预见,随着人工智能技术的快速迭代升级,生成式人工智能将重构媒体制播流程,为媒体生产和传播带来革命性的变化。媒体行业迎来前所未有的发展机遇。

媒体形态发生快速演变

在媒体内容生产科技与创意交融的乐章中,生成式人工智能如同一位新晋指挥家,引领媒体行业步入崭新的“智媒时代”。从ChatGPT到Sora,生成式AI的浪潮不仅重新定义内容创作的边界,更重塑着信息传播的格局,让“扔进一部小说、出来一部大片”这些曾经只存在于科幻想象中的梦想逐步成为现实。

在内容创作层面,生成式AI改变着传统媒体行业依赖人力的全流程内容产出模式,使人机协同成为内容创作的新趋势和变革方向。通过机器学习、自然语言处理等技术,AI不仅能够辅助生产者进行素材搜集、数据分析,还能根据设定的条件和风格,自动生成多样化的分镜脚本、视觉场景设计及特效片段等文本、视音频内容。在这种人机协同模式中,人类以独特的创造力、情感理解和深度洞察力,进行创意构思、价值引导及内容的精细打磨;而AI则以其强大的数据处理和模式识别能力,在大规模内容生成、个性化定制及效率提升方面发挥显著作用,由此有效缩短传统媒体生产中繁复的概念设计过程,不仅能够提升内容产出的速度与质量,也为个性化内容推送、跨平台内容适配等提供无限可能。

在信息传播层面,生成式AI通过深度学习用户行为偏好以及情感反应,形成高度定制化与个性化的信息推送机制。这意味着每名用户都能接收到仿佛为其量身定制的新闻、娱乐、文化、教育等资讯内容,打破过去“一对多”的广播式传播模式,充分满足用户在多样化时空情境中的不同信息需求,构建起一个“千人千面”的高精度信息传播网络,也为媒体机构提供更精准的市场定位和用户留存策略,有助于提高广告收入和内容付费率。此外,AI还能够通过大数据分析和机器学习,预测判断热点话题和趋势,为媒体提供更有针对性的内容策划和报道方向,让图文报道、短视频、直播等多媒介形态内容更加灵活地相互渗透和补充,以跨平台、跨形态的信息流动促进传播渠道的多元化融合。

在互动体验层面,生成式AI则推动媒体发展迈入场景时代,提升媒体内容的互动性和观众参与感。从虚拟主播的实时互动问答,到个性化故事生成的在线阅读体验,再到基于用户反馈即时调整的动态新闻报道,AI技术让媒体不再是单向的信息流,而跃升为一个充满活力的生态平台。更为重要的是,生成式AI可降低数字场景的搭建门槛,在智能媒介对物理世界强大仿真能力的加持下,用户的每一份想象都能被细致入微地转化为真实可感、直观生动的场景体验,从而打破媒介边界,让用户从旁观者、接受者变为参与者和共创者,更好地满足用户沉浸式互动体验需求。

创新推进人工智能媒体应用

中央广播电视总台成立6年来,坚持科技强台,向科技创新要生产力,构建了“5G+4K/8K+AI”新战略格局,与高校、科研机构、国内企业联合在人工智能领域开展卓有成效的探索,积极推进人工智能技术在电视及新媒体制播中的创新应用。

在超高清拍摄制作方面:总台研发了4K伴随HD智能制作系统,有三大特点。一是建设周期短、成本低。在现有的高清演播室,只需将HD摄像机更换为4K摄像机、新建多通道收录系统及智能虚拟切换系统,就能实现4K与HD同步制作和直播超高清节目。二是制作成本低,无需人工参与4K节目制作。三是应用推广快,不需要对节目制作人员进行培训。2019年到2023年,央视4K春晚都是采用4K伴随HD模式在CCTV-4K频道直播的。

在智能语音和智能主播方面:总台研发智能虚拟主播系统,2018年以来推出数字主播撒贝宁、AI记者通通、虚拟主持人小灵等形象,丰富了节目呈现形式。随着虚拟主播相关技术的发展与革新,总台的智能主播逐渐由2D虚拟数字人演变为拥有超自然语言、细腻表情与自然动作的3D超写实数字人,节目的互动性和沉浸感产生质的飞跃。2023年世界VR产业大会上,总台正式推出首个采用光场扫描与多模态运动捕捉智能驱动技术打造的超写实数字人“王勃”,成为构建文化元宇宙媒体内容生态的全新实践,也为下一步的AIGC(人工智能生产内容)多模态数字人技术研究奠定了基础。

针对电视节目字幕制作需要大量人工进行扒词、核对、拍唱词、手动调整时码,存在着重复劳动、内容简单却效率低下等问题,总台在智能语音技术基础上,研发了智能语音文稿唱词系统。该系统通过智能语音转写进行字幕制作,实现对唱词、对白等内容的精准识别并自动转换成节目字幕,在春晚重播等节目的编辑制作中广泛应用,大大提高了节目制作效率。

在智能剪辑方面:基于AI人脸识别、动作识别、物体识别、语音识别技术和自动合成技术,总台研发了短视频智能剪辑系统,并成功应用于2019年国庆大阅兵中受阅队伍、游行方阵通过观礼台时精彩视频的自动剪辑。该系统可同时对多个机位现场视频进行智能分析,实时提取同一队伍或方阵通过观礼台时在不同机位拍摄的有效画面,根据预先训练的编辑剪辑规则,自动生成同一队伍或方阵的精彩视频,并通过语音识别和图像识别与现场声音对齐,自动生成精彩短视频。每个短视频时长为70秒,AI制作仅用时90秒,在队伍和方阵通过观礼台后即完成短视频制作,在央视新闻客户端分发呈现。

总台为适配手机用户打造以个人为中心的沉浸式观影形态,针对手机制作了竖屏版春晚,即以春晚超高清横屏视频为素材,经过AI算法识别处理自动化生成竖屏视频。自2022年起,“竖屏看春晚”获得广大用户的热捧,近3年直播播放量屡创新高,分别为1.3亿、1.9亿和4.2亿。

在视频修复增强方面:针对现存大量影像素材仍以高标清为主,各类珍贵历史影像、重大事件、重要人物、专题纪录片、经典影视作品在超高清电视上观看体验不佳的问题,面向国家重大事件与重点项目的国家影像工程技术需要,2019年总台与上海交通大学签署战略合作,围绕智能修复、画质增强、超分辨率、视频插帧、人脸增强等关键功能,从空间分辨率、时间帧率、色彩和对比度等多个维度进行处理,开展对智能视频增强的核心算法、AI模型库、数据集构建、应用模式开发的统一系统性攻关,研发了基于判别式人工智能技术的AI视频修复增强平台,逐步建立起人机耦合的超高清修复增强制作全流程,提高了修复增强处理质量和效率,大幅提升了视频图像的视觉效果,充分激活了现存大量标清和高清影像素材,有力地支撑了北京冬奥会、建党百年重大活动和总台4K/8K频道节目制作。为进一步提升AI视频修复增强平台的能力,总台已启动基于生成式人工智能的AI修复增强技术研究。

AI视频修复——《红楼梦》修复效果展示。

在内容审核方面:为提升电视安全播出水平,在电视编辑制作和播出等环节,已广泛使用自动技审对所制作的电视节目进行技术审查,排查出视频黑场、静帧、单色画面,以及音频音量超标、噪声等问题,确保节目中的问题在播出前能够得到及时处理。

全媒体时代下越发繁杂的敏感信息类别与呈现方式,以及新的传播环境下舆情的快速发酵影响,都对内容输出的管理与管控提出更高要求。与此同时,近年人工智能对画面内容处理的维度与精准程度逐步提升。依托丰富的标签化维度、快速检索能力、机器学习能力,通过训练AI海量学习敏感词、敏感人物、敏感图片标识等,总台研发内容智能审查系统,实现了基于直播流的超低延时自动审核,在降低人员投入成本、提升审核效率的同时,促进播出画面安全性得到有效提升。

出品首部文生视频系列动画《千秋诗颂》

今年2月23日,总台推出中国首部文生视频AI系列动画片《千秋诗颂》,聚焦国家统编语文教材200多首诗词,依托总台与上海人工智能实验室联合研发的“央视听媒体大模型”,运用生成式人工智能技术将国家统编语文教材中的诗词转化制作为唯美的国风动画,打造出“诗词唱吟中,再现长安三万里”的视听盛宴。节目在总台CCTV-1频道开播后,反响热烈,《咏鹅》《过故人庄》《黄鹤楼送孟浩然之广陵》等6集脍炙人口的唐诗动画片收视率在全国所有上星频道动画片中位居第一,累计触达观众9441.3万。为进一步提升海外传播影响力,总台通过AI译制技术制作了《千秋诗颂》英文版等多语种版本,在德国、意大利、巴西等国家的10余家主流媒体同步播出,触达海外受众近1亿。

3D超写实数字人“王勃”。

《千秋诗颂》热播的背后,是国内首个专注于媒体领域视听内容生产的AI大模型——“央视听媒体大模型”。为推动AIGC在媒体的应用,2023年世界人工智能大会开幕式上,总台联合上海人工智能实验室、中国气象局等多家机构共同发起成立“中国大模型语料数据联盟”,推动产学研各界共同参与数据生态建设,为大模型的发展奠定了坚实的数据基础。同时,以上海人工智能实验室“书生”基础大模型为底座,运用总台高质量的视听数据和专业化的媒体创作知识进行预训练和对齐,2023年7月,总台正式发布了“央视听媒体大模型”,并开始应用于《千秋诗颂》的制作。

为了创建具有中国审美风格的大模型,总台提供大量国产优秀动画片视听数据,通过提取不同朝代的建筑、器物、人物造型等语料,形成具有中国文化特色的训练数据集,搭建起古诗词与人工智能沟通的桥梁,并综合运用可控图像生成、人物动态生成、文生视频等技术成果,实现了《千秋诗颂》从美术设计、动效生成到后期成片各个环节的高效制作。相比传统动画流程,依托大模型后,节目制作成本大幅度降低,制作周期大幅度缩短。

《千秋诗颂》通过现代科技沉浸式地再现诗词中的家国情怀和人间真情,促使更多人尤其是青少年感受中华文明的勃勃生机和独有魅力,在内心根植深厚的文化自信。它的制作播出不仅为AI技术赋能传统文化的传承与创新发展提供了新的范例,更有助于形成符合中国审美的AIGC动画内容资产库,为中国动画创作提供全新的创作模式,为进一步推动中国动画产业高质量发展,提升在国际舞台上的影响力与竞争力提供坚实基础。

近两年来,生成式AI的持续发展,特别是视频生成大模型的快速迭代和技术突破,正逐渐模糊着虚拟世界和现实世界的交融边界;可以预见的是,随着增强型可穿戴设备(硬件)技术的进步,人脑与机器融合的可能性将大幅提升,由此斯蒂芬森在其经典作品《雪崩》中所创造的元宇宙将有机会成为现实……面对这一趋势,媒体生态能否迈向更加开放多元、充满活力的未来?这是我们在智媒时代要用科技发展来解答的一个重要课题。

中央广播电视总台努力扎实推进“思想+艺术+技术”融合创新实践,以变应变,主动探索运用包括人工智能技术在内的新技术、新理念,用科技赋能中华优秀传统文化创造性转化、创新性发展,努力生产更多令人耳目一新、观之折服的精品力作,向世界讲好中国式现代化故事。在媒介变革的洪流中,总台要紧紧抓住科技创新这一关键变量,积极对接媒体融合和国际传播国家重大战略需求,走出一条由人工智能赋能的媒体高质量发展之路。

新闻战线:https://mp.weixin.qq.com/s/CJ-kQHzvVSV1h0xv5TeySA