首页 > 新车测评 > 新车测评 > 音效师狂喜!谷歌推出首个AI视频自动配音工具,一个人干了后期活

音效师狂喜!谷歌推出首个AI视频自动配音工具,一个人干了后期活

发布时间:2024-06-19 22:58:50来源: 15210273549

提供1000+款AI效率工具丨AIEVA.CN丨欢迎访问

AI奇点网-AI工具特刊丨6月19日


谷歌发布新一代AI视频自动配音工具,AI视频开启「有声时代」!

6月17日,谷歌人工智能团队DeepMind发布了一个名为V2A(Video-to-Audio)的AI架构系统,顾名思义即“视频转音频”,能根据画面内容或者手动输入的提示词直接为视频配音。

该模型最大的功能在于,可为任何视频自动创建合适的音轨BGM,在实践中取得了十分有效的进展,可以大大降低视频配音的制作成本。


当前Sora、Pika、可灵以及Runway等视频模型已经能输出逼真的短片,但它们均输出的是默片。

谷歌V2A系统的特点,便是V2A能依靠自身的多模态视觉能力理解视频当中的信息。V2A能看懂画面,知道画面里正在发生什么,应该出现什么声音。

举个例子,比如输入一则主题为「在黑暗中行走」的无声视频,添加“电影、恐怖片、音乐、紧张、混凝土上的脚步声”等文本提示后,AI模型就能根据提示词生成恐怖片风格的背景音效,十分逼真。

 

00:00 / 00:12


脚步声基本吻合人物走动的节奏,随着画面的切换,脚步声也随之消失,毛骨悚然的紧张感拉满。

为了能够贴近Sora热点,谷歌V2A的开发团队使用了不少Sora生成的视频片段作为输入范例。

 

00:00 / 00:08


比如上边这段Sora生成的水母漂荡影像,营造出了负压十足的深海水压感。

下方这则短片也是Sora的样片,经由V2A生成的音乐配乐后的视频颇有西部大片的感觉。

新车测评更多>>

奇瑞也要造皮卡了,三种动力版本,主打野性,25年上市 2025款领克03+正式上市,19.88万起,还看什么GTI 定位潮趣智能GT轿车的海豹06 GT,如何吸引年轻人? 特斯拉Cybertruck不用国产了,长安帮你造了,19.99万起 吉利银河星舰7官图发布,搭最新雷神超级电混技术 奥迪的电动高性能轿车要来了,超800匹马力,还有旅行版 内行人奉劝大家,买手机首选华为,原因太真实 部分三星手机用户反馈安装11月更新后,无法使用安卓Auto功能 华为Nova13销量不错!和荣耀200系列相比哪个更香? 2025款宝马3系实车到店,外观辨识度高,车机系统升级,全系8AT 手握12万,五菱星光S纯电版和银河E5,选谁更划算? 比亚迪海豹06 GT到店,运动属性加持,轴距2820mm,有望近期上市 10万级插混SUV新选择,蓝电E5 PLUS上市,7.8秒可破百,值得买吗? 国产纯电超跑,售价168万,2秒级破百,仰望U9有何硬实力? 解读小鹏MONA M03,配双英伟达芯片+高阶智驾,不到16万,不香? 比亚迪王朝首款中大型旗舰MPV亮相,预售30万起,有颜值又有实力 全新海豹06GT来袭,预售15万起,4.9秒可破百,能成爆款? 块头都不小呀!比亚迪腾势N9、全新“夏”MPV现身目录 苹果推出新款iPad mini 现在即可订购 10月23日在实体店开售 一汽红旗:交付 EH7 荣耀版,助力体育强国 中国车企正在“颠覆”欧洲老牌制造商?小鹏、广汽纷纷“安抚” 第100万辆汽车下线 理想汽车成国内首个“百万辆新势力车企” AION V 打头阵,广汽开始筹谋欧洲市场 广汽集团亮相巴黎车展,全新欧洲市场计划推动全球化战略 AI应用持续深化 打破游戏行业“不可能三角” 一线城市楼市:全面回暖,未来可期 政策大调整!楼市迎来巨变,官方态度明确,购房者需注意! 公认“低价高配”,4款16G+512G旗舰手机推荐,轻松流畅用五年 Counterpoint:2024年Q3全球智能手机市场同比增长2%,摩托罗拉和华为引领市场增长 为小米15全面让路,小米14售价再创历史新低,米粉终于等到了