一、版本概述与重要更新
FFmpeg 8.0 “Huffman” 作为 2025 年 8 月 22 日发布的最新主要版本,是自 2024 年 10 月发布的 7.1 版本以来的一次重大升级。这一版本被开发者称为 “迄今为止最大的版本之一”,包含了大量新功能、性能优化和架构改进(1)。此次更新距离上一版本发布间隔超过 10 个月,积累了众多重要变更。
1.1 主要新功能概览
FFmpeg 8.0 带来了多项重大改进,包括:
-
集成 OpenAI Whisper 音频 AI 模型,可直接在视频处理流程中实现自动语音识别、
-
显著增强 Vulkan 计算支持,为多个编解码器提供硬件加速
-
新增对 APV (Advanced Professional Video) 编解码器的支持
-
增加 VVC (H.266) VA-API 解码支持
-
提供 RealVideo 6.0 解码器支持
-
引入 G.728 音频解码器
-
实现基于 Vulkan 的 AV1 编码和 VP9 解码硬件加速
1.2 开发架构与工具链变更
除功能增强外,FFmpeg 8.0 还进行了底层架构的调整:
-
完全弃用 YASM 汇编器,转而强制使用 NASM
-
升级要求使用 C11 兼容的编译器进行构建
-
弃用 OpenMAX 视频编码器
-
移除了对 OpenSSL 1.1.0 及更早版本的支持
-
不再禁用 x86、ARM 和 AArch64 架构上的 GCC 自动向量化
二、新功能深度解析
2.1 OpenAI Whisper 音频 AI 集成
FFmpeg 8.0 最引人注目的新功能之一是集成了 OpenAI 的 Whisper 音频处理模型,通过新增的whisper滤镜实现。这一功能允许用户在视频处理流程中直接进行自动语音识别,无需依赖外部工具,极大提升了工作流程的集成度和便捷性。
核心功能与应用场景:
-
直接在视频处理流程中实现音频到文字的转换
-
支持多种语言的语音识别和翻译
-
可将识别结果输出为字幕文件或结构化数据
-
适用于创建视频字幕、内容分析和语音转文字等场景
根据用户反馈,Whisper 滤镜在实际应用中表现良好,但也存在一些争议。有用户报告在某些视频中使用 “分散式字幕” 获得了负面反馈,而其他测试观众则没有介意。这表明该功能的有效性可能因内容和受众而异。
2.2 Vulkan 计算框架增强
FFmpeg 8.0 在 Vulkan 支持方面进行了重大升级,显著扩展了硬件加速能力:
新增的 Vulkan 加速功能:
-
新增 AV1 Vulkan 编码器,显著提升 AV1 编码性能
-
新增 VP9 Vulkan 解码器,提供 VP9 视频的硬件加速解码
-
实现 ProRes RAW 格式的 Vulkan 硬件加速处理
-
增强 FFV1 编解码器的 Vulkan 支持,包括编码和解码
-
改进 VVC (H.266) 解码的 Vulkan 支持
性能基准测试:
根据公开的基准测试数据,使用 Vulkan 硬件加速处理 5.8K ProRes RAW 视频文件时,不同 GPU 表现如下:
-
AMD Radeon RX 6900 XT:63 FPS
-
AMD Radeon RX 7900 XTX:84 FPS
-
NVIDIA Ada Lovelace 架构:120 FPS
-
Intel 集成显卡:9 FPS
这表明 FFmpeg 8.0 在 Vulkan 支持方面取得了显著进展,尤其是在 NVIDIA GPU 上表现突出,而 Intel 集成显卡的性能仍相对有限。
2.3 新编码格式与编解码器支持
FFmpeg 8.0 显著扩展了对多种音视频编解码器的支持,特别是在专业视频领域:
新增的编解码器支持:
-
APV (Advanced Professional Video):三星主导的专业视频编解码器,作为 Apple ProRes 的竞争对手,预计将在未来的 Galaxy 和 Pixel 手机中出现
-
ProRes RAW:Apple 的高质量压缩视频格式,新增解码支持
-
RealVideo 6.0:为旧格式提供更好的兼容性
-
G.728:低延迟音频编解码器
-
Sanyo LD-ADPCM:特定格式的音频编解码器
视频编码增强:
-
通过 libopenapv 包装器实现 APV 编码支持
-
新增基于 libjxl 库的 JPEG-XL 动态图像编码
-
增强 HDR 视频处理能力,支持更多 HDR 格式
-
改进 VVC (H.266) 支持,包括屏幕内容编码 (SCC)、块间复制 (IBC)、调色板模式和自适应颜色变换 (ACT)


639

被折叠的 条评论
为什么被折叠?



