FFmpeg 8.0 “Huffman“ 全面评测：Vulkan 加速、AI 集成与编解码革新

原创

于 2025-08-25 19:33:21 发布 · 2.8k 阅读

标签

#ffmpeg #人工智能 #xcode

一、版本概述与重要更新

FFmpeg 8.0 “Huffman” 作为 2025 年 8 月 22 日发布的最新主要版本，是自 2024 年 10 月发布的 7.1 版本以来的一次重大升级。这一版本被开发者称为 “迄今为止最大的版本之一”，包含了大量新功能、性能优化和架构改进(1)。此次更新距离上一版本发布间隔超过 10 个月，积累了众多重要变更。

1.1 主要新功能概览

FFmpeg 8.0 带来了多项重大改进，包括：

集成 OpenAI Whisper 音频 AI 模型，可直接在视频处理流程中实现自动语音识别、
显著增强 Vulkan 计算支持，为多个编解码器提供硬件加速
新增对 APV (Advanced Professional Video) 编解码器的支持
增加 VVC (H.266) VA-API 解码支持
提供 RealVideo 6.0 解码器支持
引入 G.728 音频解码器
实现基于 Vulkan 的 AV1 编码和 VP9 解码硬件加速

1.2 开发架构与工具链变更

除功能增强外，FFmpeg 8.0 还进行了底层架构的调整：

完全弃用 YASM 汇编器，转而强制使用 NASM
升级要求使用 C11 兼容的编译器进行构建
弃用 OpenMAX 视频编码器
移除了对 OpenSSL 1.1.0 及更早版本的支持
不再禁用 x86、ARM 和 AArch64 架构上的 GCC 自动向量化

二、新功能深度解析

2.1 OpenAI Whisper 音频 AI 集成

FFmpeg 8.0 最引人注目的新功能之一是集成了 OpenAI 的 Whisper 音频处理模型，通过新增的whisper滤镜实现。这一功能允许用户在视频处理流程中直接进行自动语音识别，无需依赖外部工具，极大提升了工作流程的集成度和便捷性。

核心功能与应用场景：

直接在视频处理流程中实现音频到文字的转换
支持多种语言的语音识别和翻译
可将识别结果输出为字幕文件或结构化数据
适用于创建视频字幕、内容分析和语音转文字等场景

根据用户反馈，Whisper 滤镜在实际应用中表现良好，但也存在一些争议。有用户报告在某些视频中使用 “分散式字幕” 获得了负面反馈，而其他测试观众则没有介意。这表明该功能的有效性可能因内容和受众而异。

2.2 Vulkan 计算框架增强

FFmpeg 8.0 在 Vulkan 支持方面进行了重大升级，显著扩展了硬件加速能力：

新增的 Vulkan 加速功能：

新增 AV1 Vulkan 编码器，显著提升 AV1 编码性能
新增 VP9 Vulkan 解码器，提供 VP9 视频的硬件加速解码
实现 ProRes RAW 格式的 Vulkan 硬件加速处理
增强 FFV1 编解码器的 Vulkan 支持，包括编码和解码
改进 VVC (H.266) 解码的 Vulkan 支持

性能基准测试：

根据公开的基准测试数据，使用 Vulkan 硬件加速处理 5.8K ProRes RAW 视频文件时，不同 GPU 表现如下：

AMD Radeon RX 6900 XT：63 FPS
AMD Radeon RX 7900 XTX：84 FPS
NVIDIA Ada Lovelace 架构：120 FPS
Intel 集成显卡：9 FPS

这表明 FFmpeg 8.0 在 Vulkan 支持方面取得了显著进展，尤其是在 NVIDIA GPU 上表现突出，而 Intel 集成显卡的性能仍相对有限。

2.3 新编码格式与编解码器支持

FFmpeg 8.0 显著扩展了对多种音视频编解码器的支持，特别是在专业视频领域：

新增的编解码器支持：

APV (Advanced Professional Video)：三星主导的专业视频编解码器，作为 Apple ProRes 的竞争对手，预计将在未来的 Galaxy 和 Pixel 手机中出现
ProRes RAW：Apple 的高质量压缩视频格式，新增解码支持
RealVideo 6.0：为旧格式提供更好的兼容性
G.728：低延迟音频编解码器
Sanyo LD-ADPCM：特定格式的音频编解码器