对于使用 Google Gemini AI 的用户来说,一个值得关注的更新正在路上:Gemini 即将扩展其文件分析能力,新增对 8 种常见视频格式的支持。这一变化,意味着 Gemini 将从文字和表格的分析,正式跨入视频处理的应用场景。
这项功能的曝光,来自 Android Authority 对 Google App 16.13.38 测试版的 APK 代码分析。根据挖掘出的代码片段,Gemini 的文件处理能力正在显著增强,未来将支持包括 MP4、AVI、3GP、FLV、MOV、MPEG、MPG 和 WEBM 在内的主流视频格式。
过去,Gemini 的文件分析主要集中在文本、代码、表格等结构化数据上。视频内容分析对于大多数 AI 用户,尤其是内容创作者、教师、开发者和研究人员来说,是一个技术门槛较高、资源要求较大的环节。
本次新增视频格式的支持,意味着用户今后可以直接将视频文件上传至 Gemini,由 AI 协助提取信息、生成摘要、甚至识别其中的语义内容,从而在工作效率和智能交互上取得新的突破。
从当前测试版中发现的字段来看,Gemini 将兼容以下视频类型:
3GP
AVI
FLV
MOV
MP4
MPEG
MPG
WEBM
这涵盖了从早期手机视频格式到目前主流的高清影音标准,基本可以满足个人用户和内容团队的大部分需求。
根据代码中的字符串信息,Gemini 对用户上传视频的总时长可能存在限制,例如:
“您的视频总时长必须在一小时以内。”
“您的视频总时长必须不超过 X 分钟。”
这表明,系统可能会根据不同用户权限(例如免费账户与高级订阅用户)设定上传上限。虽然 Google 尚未正式公布具体规则,但这一点对于大规模上传或处理视频的用户而言,需要额外留意。
除了视频处理,Android Authority 在相同版本中还发现了一个值得注意的字段:“GitHub 附件类型”。这意味着 Gemini 或将在未来支持直接解析 GitHub 仓库中的内容。
如果这一功能落地,它将极大提升开发者的代码审阅效率。比如,你可以将一个开源项目的链接提交给 Gemini,它就能帮你分析代码结构、识别潜在问题,甚至总结项目文档。
内容创作者 可让 AI 协助整理剪辑内容或生成视频脚本摘要
教育工作者 可上传教学视频,由 AI 提取要点或自动生成问答
开发者与研究人员 可以更便捷地与代码仓库和多媒体内容交互
而在隐私和效率层面,本地化支持或边缘处理的结合,也有望让未来的 Gemini 应用更安全、快速和实用。
Google 正在悄然为 Gemini 注入更强的多媒体理解能力。从文本扩展到视频,再到代码仓库,Gemini 的边界正在不断扩大。而对用户而言,这意味着更多的工作可以交由 AI 自动完成,节省时间、降低技术门槛,并获得更专业的反馈与分析。
我们建议关注该功能正式上线时间,并根据自身需求适时尝试或调整使用策略。如果你对 AI 在多媒体场景下的应用感兴趣,这次升级值得你重点留意。