Vidu Q2生图功能上线:控制权进一步交给创作者
12月1日消息,图功Vidu推出升级后的线控Q2参考生图功能,并同步上线文生图与图像编辑功能,制权武威市某某自动化科技经销部试图解决AI多模态创作中“创意”与“可控性”难以兼顾的进步交长期难题。官方称,创作此次更新将创作的图功控制权进一步交还给创作者。 新版Q2生图功能在一致性表现、线控生成速度、制权工作流整合等方面均有所提升,进步交可应用于短剧动漫、创作武威市某某自动化科技经销部广告电商、图功泛娱乐、线控影视制作、制权文旅教育等多个场景。进步交平台同时开放限时免费体验,创作会员可在一个月内使用文生图、参考生图及图像编辑功能,旗舰版会员享受不限量生成。 官方介绍,Vidu在国际AI基准测试机构Artificial Analysis最新公布的图像编辑榜单中首次上榜即进入前四名,并在该指标上超过了GPT-5。这意味着其在图像编辑一致性与模型成熟度上已达到较高水平。 一致性能力方面。据悉,Q2参考生图在语义理解、风格支持、美学水准和参考要素灵活度方面均较上一版本提升。官方称,模型能够在保持主体一致的前提下给予创作者更多创作自由,生成速度最快可达5秒。 在参考能力方面,Q2主要包括: • 任意比例生成:可从同一参考图生成不同比例画面,适配广告、电商、短剧动漫等多种素材需求,支持4K输出。 • 位置、动作、构图复刻:通过升级的空间理解能力,可精准复刻角色站位、动作、布局,即便输入为草图或线稿,也能保持构图一致。 • 分镜切换:可基于同一画面生成不同景别,通过文字指令完成多镜头画面组合,再配合图生视频功能生成完整片段。 图片编辑能力增强方面,全新的Q2图像编辑功能支持局部添加、替换、删减或调整内容,并可进行风格转换及季节、时间变化处理。在编辑过程中,主体一致性与背景结构可保持稳定,不易出现变形或细节缺失。 相比传统修图软件依赖多工具调整的方式,Q2通过文本改图的方式降低了使用门槛,为创作者带来更高效率。 文生图与多风格输出方面,升级后的文生图能力可根据简单提示词直接生成连续分镜,覆盖超过百种主流与非主流美术风格,包括国画、日漫、美漫与复古画风等。无论远景、特写还是近景,均可保持人物外观的一致性。 参考生图功能则可基于固定角色,快速生成不同故事情节下的多张画面,使角色IP构建与多场景延展更加高效,适合漫画、绘本以及短剧类创作的批量生产。 据介绍,此次新增的“主体保存”功能打通了文生图、参考生图与参考生视频的模型链路。创作者可保存任一生图的主体,再在视频生成中调用,实现跨模态一致性。(定西)![]()
延伸阅读
- 最近发表
- 随机阅读
-
- 英语成为选修课,对于普通老百姓来说,真的会是好事儿吗
- 社评:“China Travel”爆火,见证高水平开放的中国
- 年纪大了就会“弯腰驼背”?当心背后的疾病
- 湖南通报洞庭湖决口险情:垸内水深5米
- 重庆发布国内首块L3级自动驾驶专用正式号牌
- 华容洞庭湖大堤决堤抢险:溃口宽220米,内外水位差0.17米
- 洪涝灾害后,饮食注意这6点
- 外交部回应斯塔默此前涉华言论
- 普京:俄罗斯目前没有看到乌克兰讨论领土问题的意愿
- 纳指与标普再创历史新高 热门中概股多数下跌
- 汪文斌大使抵达柬埔寨履新
- China Travel有多火?外国游客热门入境城市榜单出炉
- 电线杆老化倒塌引发野火 美国得州起诉电力公司
- 先丢一盘后逆转,德约科维奇第16次晋级温网男单16强
- WAIC2024观察:当全球AI界的镁光灯向东方聚焦
- 希腊军舰在红海击落也门胡塞武装无人机
- 陕西女老师事件持续发酵,知情人揭露:抽烟穿吊带,还有多位男友
- 洞庭湖决堤抢险双向封堵已达91.5米
- 洞庭湖决口封堵作业最新进展:已封堵87.3米
- 新初三茶话会加开一场,7月14日
- 搜索
-