导读
随着科技的日新月异,AI技术不断演进,从机器学习到神经网络,再到Transformer模型,特别是2022年ChatGPT的惊艳亮相和2023年GPT-4的横空出世,将AI发展推向了新的高度。
2024年2月16日,OpenAI公司发布的最新“文生视频”大模型Sora,更是引发了公众对生成式AI的广泛关注。
该模型为基于transform架构的扩散模型,继承DALL·E3的画质和遵循指令能力,并利用了GPT扩写,具备超长生成时间(60s)、单视频多角度镜头、理解物理世界三大优势。不仅如此,它也能获取现有的静态图像并从中生成视频,还能获取现有视频进行拓展或填充缺失内容。
2月19日,春节假期结束,A股迎来龙年首个交易日,开盘Sora概念股走强,其他相关概念股如多模态模型概念、WEB3.0、ChatGPT、虚拟人、AIGC均有所上涨。
这一切预示着,“万物皆可生成”的创作内容产业革命已经来临,未来的世界将充满无限可能与惊喜。
第三期「GT科技观察」,我们试图围绕以下三个话题展开:
1.聚焦AIGC:内容皆可生成
2.Sora的问世会颠覆哪些行业?背后又有哪些新的产业机遇?
3.机器会取代人类吗?如何有效应对AI带来的焦虑情绪?
聚焦AIGC:内容皆可生成
人工智能按其模型可划分为决策式AI和生成式AI。
决策式AI对人类的决策过程进行模仿,应用领域包括人脸识别、推荐系统、风控系统、其他智能决策系统、机器人、自动驾驶。
生成式AI聚焦在创作新内容上,通过学习数据中的联合概率分布,对已有的数据进行总结归纳,并在此基础上使用深度学习技术等,创作模仿式、缝合式的内容,相当于自动生成全新的内容。
2021年高德纳咨询公司预测,至2023年将有20%的内容被生成式AI创建,至2025年生成式AI产生的数据将占所有数据的10%(2021年不到1%)。
2022年9月,红杉资本官网发布文章《生成式AI:充满创造力的新世界》预测,生成式AI将产生数万亿美元的经济价值。据预测,2025年,国内生成式AI应用规模有望突破2000亿元,国内传媒领域应用空间超1000亿元,占据半壁江山。
生成式AI可生成的内容形式十分多样,包括文本、图片、音频和视频等。
文本生成中,生成式AI通过语言模型、神经网络和深度学习技术,快速创建大量有助于改善客户体验的内容,如新闻资讯、剧本、营销文本、智能客服等;
图片生成中,生成式AI通过计算机视觉来分析图片,生成营销素材、设计方案和艺术作品等;
音频生成中,生成式AI帮助使用者更好地分析、编辑和生成音频文件,从而帮助创作出优秀的音频作品,如克隆真人的语音、文本生成特定语音、作曲编曲等;
视频生成中,可以帮助使用者生成高质量的视频,如检测和删除特定片段、跟踪剪辑、生成特效、合成视频等。大火的AI数字人也是它的“拿手绝活”。
跨模态生成中,生成式AI能够根据文字生成创意图片、根据图片生成视频、根据文字生成视频、根据图片或视频生成文字。
游戏中,生成式AI用于游戏开发,实现自动化的游戏设计,同时能够实现更好的游戏体验,如人工智能NPC等。
Sora的问世会颠覆哪些行业?背后又有哪些新的产业机遇?
Sora问世引发科技圈的热议。特斯拉创始人马斯克发布动态称:“被人工智能增强的人类,将会在未来几年之内创作出最杰出的作品。”
生成式AI八面玲珑,应用场景十分广泛,目前不仅应用于文本、图片、音视频、游戏等数字媒体,还可以应用于制造业、教育、医疗、影视文化等实体行业。学校可以使用AI视频生成技术制作教学视频,医院可以使用AI视频生成技术模拟手术过程,视频游戏、虚拟现实、视频会议等都可能与AI视频生成技术相关…不少新兴科技公司使用人工智能技术进行影视制作,将传统的影视制作方法与人工智能技术强强联合。
中影年年CTO、联合创始人苑鹏飞表示,Sora的推出对影视行业具有深远影响,影视行业的生产流程模式将会被重新定义、改写。
第一,Sora作为AI技术在影视行业广泛应用的代表,或将成为全新的数字内容制作模式,改变影视、广告、动画等视频内容的原有格局,开启影视制作的新篇章,为影视行业带来新的视野和可能性。
第二,由于Sora能够根据输入的文字直接生成视频,剔除了传统视频繁琐的制作流程,极大提升了传统视频的制作时间,有望为相关行业的企业降本增效。
总的来说,Sora作为一款先进的AI工具,对影视行业的发展起到了推动作用,同时也对个人视频创造者带来了一些新机遇。
AI大模型的发展正在不断加速AGI通用人工智能的到来,纵观整个AI产业链,硬件和软件的配合才能更好地实现多种终端应用的价值化落地。Sora模型的推出,也将直接推动AI产业链上游的AI模型生产工具(AI算法框架、AI开发平台、AI开放平台)、AI算力基础(AI芯片、服务器、智算中心、云服务)、AI数据资源(AI基础数据服务、数据治理)的发展;对下游应用而言,积极影响是全方位的。硬件层面,将直接推动AI服务器、光通信、交换机等产业链的发展。
机器会取代人类吗?如何有效应对AI带来的焦虑情绪?
面对人类与机器的问题,每个人都期待未来的计算机能干更多的事情,多到有些人怀疑:30年后,人类自己还有什么可做的事情吗?生成式AI功能强大、应用范围广泛,文字、图片、音视频内容相关的从业者在面对“强大助手”上线时,也会感觉到焦虑,恐被其取代。
机器会取代人类吗?风险资本家马克·安德森斩钉截铁地宣称“软件正在吞噬整个世界”,而其同行安迪·凯斯勒在解释提高生产力的最佳途径是“摆脱人类”时,却显得很高兴。
对此PayPal公司创始人、Facebook首位外部投资者彼得·蒂尔曾表示,计算机是辅助人类的工具,而非替代物。未来几十年,最具价值的产业还是由创业家建立的,他们发展计算机是增强人类的能力,而不是淘汰人类。
科技意味着补充。人类和机器所擅长的工作存在着本质上的差异,人类有意识,擅长在复杂情境下制定计划、做出决策,但不擅长大量数据的处理。计算机则恰恰相反,擅长高效的数据处理,却做不出人类很轻松就能做出的基本判断。人类和机器之间的显著差别意味着,和计算机合作得到的成果远高于与人交易得到的成果。
苑鹏飞认为,现阶段的Sora可以理解为是一个智能化视频创作工具,在影视预演PreViz、影视特效、个人创意短视频、视频素材生成等领域确实起到了高效生产的作用,但在商业项目中,如影视剧、广告、三维动画、短视频等领域,短期内很难做到商业化落地,很难满足策划、导演等对视频内容定制化需求,同时,从Sora生成的视频风格来看,大部分是写实风格,还缺少更多的艺术风格,因此Sora很难满足定制化、风格化、独特化等商业项目需求,生成的视频不可控,必然会有大量的反复调试、修改,不可能取代现有的影视制作流程,应将传统的视频制作流程与AI结合运用,实现高效率、高品质内容生产。
如何有效应对AI带来的焦虑情绪?AI模型应用派创业者傅盛在央视财经光华录中分享到首先要转变思维模式,迎接新技术。不要把AI看成一个补充,而是深入认识到它所带来的底层变革。AI本质上是一个平权工具,不是少数人专享,对于普通人来说,相信它是能给自己带来权益的。第二,认真关注与学习。
Sora模型目前仍然存在缺陷,如难以精确模拟复杂场景,也可能无法理解一些特定的因果和时间联系等。此外,模型还可能混淆一些文本指令中的空间细节,如左右方向等。展望未来,人机结合的解决方案才能弥补这些不足,并推动技术在更多领域取得丰硕成果。
随着Sora模型的发布,AI技术再次站在了科技的前沿,其引领的新浪潮不仅预示着行业的颠覆性变革,更带来了前所未有的产业机遇。然而,每一次技术飞跃都伴随着社会的疑虑和焦虑。面对Sora带来的变革,保持开放的心态,理性的看待AI技术的发展,以智慧和勇气化解焦虑,迎接AI新时代的到来,探索无限可能的未来。
-END-
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有