阶跃星辰首次开源 为开源世界贡献多模态力量

阶跃星辰首次开源 为开源世界贡献多模态力量

2月19日,大模型创业公司阶跃星辰开源了两款阶跃Step系列多模态大模型——Step-Video-T2V 视频生成模型和 Step-Audio 语音模型。

上证报今日霍州讯(记者 宋薇萍 谭镕)2月19日,大模型创业公司阶跃星辰开源了两款阶跃Step系列多模态大模型——Step-Video-T2V视频生成模型和Step-Audio语音模型。

阶跃星辰表示,AGI的实现离不开全球开发者的共同努力,阶跃星辰开源的初心,是希望与市场分享最新的多模态大模型技术成果,为全球开源社区贡献一份来自中国的力量。

根据企业官方技术报告中的评测结果,阶跃Step-Video-T2V的参数量和模型性能目前在全球开源视频生成领域都处于领先水平;阶跃Step-Audio是业内首款产品级的开源语音交互模型。目前,市场各方已经可以在跃问App内体验。

其中,阶跃Step-Video-T2V模型的参数量达到300亿,可以直接生成204帧、540P分辨率的高质量视频,这意味着能确保生成的视频内容具有极高的信息密度和强大的一致性。

在生成效果上,Step-Video-T2V在复杂运动、美感人物、视觉想象力、基础文字生成、原生中英双语输入和镜头语言等方面具备强大的生成能力,且语义理解和指令遵循能力突出,能够高效助力视频创作者实现精准创意呈现。同时,Step-Video-T2V 对复杂运动场景具有优异的把控能力,无论是高雅优美的芭蕾舞、对抗激烈的空手道、紧张刺激的羽毛球,还是高速翻转的跳水,都能展现。

阶跃Step-Audio是行业内首个产品级的开源语音交互模型,能够根据不同的场景需求生成情绪、方言、语种、歌声和个性化风格的表达,能和用户自然地进行高质量对话。模型生成的语音具有自然流畅、情商高等特征,同时也能支持不同角色的音色克隆,满足影视娱乐、社交、游戏等行业场景下应用需求。

据介绍,由于目前行业内语音对话测试集相对缺失,阶跃星辰自建并开源了多维度评估体系StepEval-Audio-360基准测试,从角色扮演、逻辑推理、生成控制、文字游戏、创作能力、指令控制等9项基础能力的维度对开源语音模型进行全面测评。通过人工横评后的结果显示,Step-Audio的模型能力十分均衡,且在各个维度上均超过了此前市面上效果最佳的开源语音模型。

猜你喜欢

男人爽片,狂烧3亿美金!61岁布拉德皮特的床戏,是唯一败笔

同时,杰瑞·布鲁克海默也是《壮志凌云2》和《F1:狂飙飞车》的制片人,所以,这次也看到阿汤哥出现在该片的首映礼上,来了一次皮特和阿汤哥的世纪重聚。 这部电影背后的是苹果旗下的苹果原创电影公司,这次苹果和F1…

男人爽片,狂烧3亿美金!61岁布拉德皮特的床戏,是唯一败笔

全国气温预报图热到一片红 中东部多地全天闷热

当前我国正经历今年以来最强的高温过程,预计明后两天(7月4日至5日)高温范围将达到最大,长江中下游部分地区将遭遇同期罕见高温。不仅白天酷热难耐,夜间最低气温也普遍在26℃以上,全天闷热

全国气温预报图热到一片红 中东部多地全天闷热

专业人士解析下雨天高铁站台不能打伞 安全与秩序考量

7月3日,成都遭遇暴雨。在成都东站,有工作人员反复提醒站台上的乘客不要打伞。这一现象引发了网上关于高铁站台能否打伞的讨论。一位电力专业人士解释称,工作人员提醒不让在站台打伞主要是出于安全和维护秩序的考虑

专业人士解析下雨天高铁站台不能打伞 安全与秩序考量

温泉池里的泳衣哲学:当水花与笑容撞碎身体焦虑

冰岛蓝湖温泉的女孩们爱穿黑色高弹泳衣,在乳蓝色的温泉水里像游动的黑鱼,泳衣的功能性设计与火山岩背景碰撞出野性之美;意大利托斯卡纳的温泉庄园里,蕾丝泳衣与复古墨镜是标配,女子们泡在罗马柱环绕的池子里,泳衣的褶皱…

温泉池里的泳衣哲学:当水花与笑容撞碎身体焦虑

伊能静一家漫步巴黎街头,牛仔裤搭配显身材,秦昊发型竟然这么难看

尽管她一贯注重形象,然而臀部的肌肉下垂和凹陷的情况却让舆论反响热烈,其身材亦不似荧屏上那般匀称完美。当天,她与秦昊一同在巴黎的街道上漫步,9岁的米粒显得异常欢快,一手牵着父亲,一手牵着母亲,蹦蹦跳跳,气氛温馨…

伊能静一家漫步巴黎街头,牛仔裤搭配显身材,秦昊发型竟然这么难看