中文(繁體)

目前位置: 首頁> AI 資訊

Gemini AI 將支持MP4 等多種視頻格式,文件分析功能升級在即

作者: LoRA 時間: 2025年04月08日 1047

对于使用 Google Gemini AI 的用户来说,一个值得关注的更新正在路上:Gemini 即将扩展其文件分析能力,新增对 8 种常见视频格式的支持。这一变化,意味着 Gemini 将从文字和表格的分析,正式跨入视频处理的应用场景。

Gemini AI.jpg

这项功能的曝光,来自 Android Authority 对 Google App 16.13.38 测试版的 APK 代码分析。根据挖掘出的代码片段,Gemini 的文件处理能力正在显著增强,未来将支持包括 MP4、AVI、3GP、FLV、MOV、MPEG、MPG 和 WEBM 在内的主流视频格式。

更丰富的文件支持,意味着什么?

过去,Gemini 的文件分析主要集中在文本、代码、表格等结构化数据上。视频内容分析对于大多数 AI 用户,尤其是内容创作者、教师、开发者和研究人员来说,是一个技术门槛较高、资源要求较大的环节。

本次新增视频格式的支持,意味着用户今后可以直接将视频文件上传至 Gemini,由 AI 协助提取信息、生成摘要、甚至识别其中的语义内容,从而在工作效率和智能交互上取得新的突破。

支持格式一览

从当前测试版中发现的字段来看,Gemini 将兼容以下视频类型:

  • 3GP

  • AVI

  • FLV

  • MOV

  • MP4

  • MPEG

  • MPG

  • WEBM

这涵盖了从早期手机视频格式到目前主流的高清影音标准,基本可以满足个人用户和内容团队的大部分需求。

上传限制与权限机制

根据代码中的字符串信息,Gemini 对用户上传视频的总时长可能存在限制,例如:

“您的视频总时长必须在一小时以内。”
“您的视频总时长必须不超过 X 分钟。”

这表明,系统可能会根据不同用户权限(例如免费账户与高级订阅用户)设定上传上限。虽然 Google 尚未正式公布具体规则,但这一点对于大规模上传或处理视频的用户而言,需要额外留意。

未来还有哪些可能?

除了视频处理,Android Authority 在相同版本中还发现了一个值得注意的字段:“GitHub 附件类型”。这意味着 Gemini 或将在未来支持直接解析 GitHub 仓库中的内容。

如果这一功能落地,它将极大提升开发者的代码审阅效率。比如,你可以将一个开源项目的链接提交给 Gemini,它就能帮你分析代码结构、识别潜在问题,甚至总结项目文档。

为什么这对用户有意义?对于 AI 初学者和技术爱好者而言,这次升级不仅意味着更多的格式支持,更是 Gemini 正在向“多模态 AI 助理”迈进的重要信号。以下是一些实际场景举例:

  • 内容创作者 可让 AI 协助整理剪辑内容或生成视频脚本摘要

  • 教育工作者 可上传教学视频,由 AI 提取要点或自动生成问答

  • 开发者与研究人员 可以更便捷地与代码仓库和多媒体内容交互

而在隐私和效率层面,本地化支持或边缘处理的结合,也有望让未来的 Gemini 应用更安全、快速和实用。

总结

Google 正在悄然为 Gemini 注入更强的多媒体理解能力。从文本扩展到视频,再到代码仓库,Gemini 的边界正在不断扩大。而对用户而言,这意味着更多的工作可以交由 AI 自动完成,节省时间、降低技术门槛,并获得更专业的反馈与分析。

我们建议关注该功能正式上线时间,并根据自身需求适时尝试或调整使用策略。如果你对 AI 在多媒体场景下的应用感兴趣,这次升级值得你重点留意。