Sora 2是OpenAI最新一代的影片生成模型,被外界形容为「影片界的 GPT-3.5」,在真实感、物理规律与可控性上均大幅超越初代版本。相较前代模型会出现「物体穿模」或「物理失真」的状况,Sora 2能更精确模拟现实世界的运动与互动。例如,若篮球员投篮失手,球会自然弹向篮板而非「自动入框」,显示模型已能理解物理中的失败情境。

除了拟真画面,Sora 2也新增声音同步与环境音效生成功能,可产出具备对话与背景声的完整影片。OpenAI 表示,这是迈向「通用影音生成系统」的重要一步,用户甚至能上传短片,让模型捕捉其样貌与声音,将本人融入各式场景中。此「cameo」功能是新推出iOS应用程式《Sora》的核心特色,用户可透过邀请制注册体验,录制自我肖像后便能与朋友互相「客串」影片。

目前,Sora 2仅在美加地区的Apple App Store上架,仍采邀请制试用,Android版本尚在开发中。ChatGPT Pro用户可在sora.com使用实验版Sora 2 Pro模型。OpenAI表示,未来将陆续开放更多国家地区,并于API中导入Sora 2技术,目标是推进AI世界模拟与共同创作的新时代。


點擊閱讀下一則新聞 點擊閱讀下一則新聞
Google推《防诈大作战》互动游戏!边玩边学破解诈骗手法