24.10.29 版本更新说明:
语音转文本
Shotcut首次引入基于OpenAI的Whisper的AI,这得益于whisper.cpp项目。
您可以通过字幕 > 语音转文本菜单项或按钮访问:语音转文本图标。
- 我们的构建包含了一个具有相当速度和准确性的基础模型,但不是很大。(您可以将这个模型视为大脑。)
- 您可以下载更大更好的模型(脑)的ggml格式,并在语音转文本对话框中进行配置,但这会更慢。
- 对话框会创建两个任务,这些任务会出现在任务面板中:一个是导出音频,另一个是转换为文本。
- 结果将作为新的顶级字幕轨道添加到字幕面板中。
- 目前,我们的构建仅支持Apple Silicon GPU。否则,它在CPU上是高度多线程的。
- 已知的小问题:字幕项有时比预期开始得早。时间由模型和工具提供,我们缺乏改进这一点的技能和资源。
- 请预期偶尔会出现错误。像人类一样,在非理想条件下,它并不完美。对于某些音频片段未能转换为预期文本的错误报告,我们将不予处理。
- OpenAI对使用其Whisper模型发出了一些警告:
特别是,我们警告不要使用Whisper模型来转录音频,这些音频是在未经个人同意的情况下录制的……我们建议不要在高风险领域(如决策背景)中使用,因为准确性方面的缺陷可能导致结果出现明显缺陷。
过渡改进
波纹删除一个过渡会恢复包含在过渡中的整个片段。
提起(非波纹删除)一个过渡不再留下空隙;空隙由相邻片段填充。
将相邻片段移开会增加过渡持续时间,而不是分离并留下空隙。
其他改进
移除了导出 > 视频 > 重采样按钮。现在,在进行某些更改时,会有简单的可忽略的内联警告。
向菜单添加了文件 > 在文件夹中显示项目。
在GPS文本视频滤镜的数值关键字中添加了小数<数字>选项。
将最近项目更改为项目:此视图中的项目不会再因最近项目达到最大长度而消失,旧项目也会被移除。
向项目的上下文菜单中添加了删除操作。
如果启用了GPU效果,则隐藏Reframe视频滤镜和按钮。
将FFmpeg升级到7.1版本。
修复
修复了在播放列表 > 菜单 > 将选定项添加到幻灯片中执行多次操作时导致的崩溃。理论上,这可以修复时间轴中的其他随机崩溃。
修复了打开包含无项字幕轨道的项目时导致的崩溃。
修复了Reframe输出视频滤镜中计算宽度的异常值导致导出失败的问题。
修复了Reframe视觉控制可以创建异常值尺寸的问题。
修复了AVCHD视频帧率加倍(可能修复其他格式)的问题。
修复了为包含空间音频的iPhone 16 Pro视频创建代理视频的问题。
修复了GPU滤镜粘贴在非GPU滤镜下方的问题。
修复了垂直视频模式下幻灯片生成器对话框过高问题。
修复了GPS文本视频滤镜中的GPS偏移会重置的问题。
修复了时间重映射滤镜中允许的最大时间以防止出现白帧的问题。