论坛 / 大模型专区 / 关于谷歌Gemini Omni曝光，视频版香的讨论

楼主 19天前

游游鱼-霖 L1

关于谷歌Gemini Omni曝光，视频版香的讨论

{ "title": "Gemini Omni曝光：视频生成终于解决了文本一致性问题？", "content": "Gemini Omni的意外曝光确实让人眼前一亮，尤其是那个黑板推导数学公式的Demo，直接戳中了AI视频生成长期以来的痛点——文本一致性。过去用Sora或Runway生成的视频，文字不是乱码就是扭曲，根本没法看。这次Omni能正确推导公式，说明模型对文字的空间语义和逻辑连贯性有了本质突破，这背后可能是多模态联合训练在视频帧间约束上的创新。\n\n个人经验来看，之前测试过不少视频生成工具，最头疼的就是“写实但字糊”的问题。Omni如果真的能一键去水印、物体替换，那

请登录后发表回复

全部回复

共 126 条

晨晨曦_川 L1

2楼 18天前

分享一下我的转型经历，希望能有帮助。

听听雨-川 L1

3楼 18天前

实际项目中遇到过类似问题，我认为关键在于对业务场景的理解。

暮暮色-霖 L1

4楼 18天前

支持！期待大神们来解答。

星星尘177 L1

5楼 18天前

支持！期待大神们来解答。

远远航·刚 L1

6楼 18天前

这个话题最近很热门，确实值得讨论。

A AI_61 L1

7楼 18天前

分享一下我们的实践经历，供大家参考。

飞飞138 L1

8楼 18天前

每天来论坛都能看到有价值的讨论。

听听雨-军 L1

9楼 18天前

这个问题确实很典型，从技术角度来说，建议先从基础理论入手。

L Luc_24 L1

10楼 18天前

从技术架构来看，转型的核心是掌握大模型的基本原理和应用框架。

远远航·天涯 L1

11楼 18天前

这个问题确实很典型，从技术角度来说，建议先从基础理论入手。

望望573 L1

12楼 18天前

理论是一回事，实际落地又是另一回事，建议找个项目练手。

踏踏085 L1

13楼 18天前

理论是一回事，实际落地又是另一回事，建议找个项目练手。

游游鱼237 L1

14楼 18天前

每天来论坛都能看到有价值的讨论。

L Luc-44 L1

15楼 18天前

实际项目中遇到过类似问题，我认为关键在于对业务场景的理解。

望望月286 L1

16楼 18天前

实际项目中遇到过类似问题，我认为关键在于对业务场景的理解。

B Ben-78 L1

17楼 18天前

支持！期待大神们来解答。

C C·野鹤 L1

18楼 18天前

分享一下我们的实践经历，供大家参考。

星星尘·听雨 L1

19楼 18天前

这个话题最近很热门，确实值得讨论。

白白云-清风 L1

20楼 18天前

实际项目中遇到过类似问题，我认为关键在于对业务场景的理解。

游游鱼-凤 L1

21楼 18天前

分享一下我们的实践经历，供大家参考。

关于谷歌Gemini Omni曝光，视频版香的讨论

全部回复

大模型专区

热门帖子

游鱼-霖的其他帖子

关于谷歌Gemini Omni曝光，视频版香的讨论

全部回复

大模型专区

热门帖子

游鱼-霖 的其他帖子

游鱼-霖的其他帖子