昨晚,来自法国AI实验室kyutai放出首个实时原生多模态Moshi,作用演示堪比5月发布的GPT-4o。比方下面这个demo中,Moshi作为帮手协助Alexa小哥踏上太空之旅,让人一秒幻视漂泊地球中的Moss。
不过,在第二个演示的过程中,Moshi过分急于抢话,说话者还未说完,它就切断了说话的内容。
前面的演示中,咱们首要看到的是,与Moshi互动关于实时事实性信息、对话等才能。
第三个demo中,首要去展现Moshi表达和了解心情的才能。因而,搭档Nell测验用不相同的风格的口气和Moshi去说话。
巴黎,这座爱情之城,此处时刻停止,心灵飞翔。坐落在欧洲的中心,正值开展黄金时期。塞纳河流动,夜晚星光闪耀,简直是一幅美丽的现象。
然后,Nell又让Moshi假装是一位海盗,去叙述自己在「七海」中冒险的阅历。
突然间,Moshi一会儿变换了口气,特别像咱们在《巴勒比海盗》中,听到Jack Sparrow的声响。
乃至,Moshi还能够用一种低声细语的声响,去叙述《黑客帝国》电影中的情节。
能够看出,Moshi模型能够在你发问没有结束时,就能给出答复,或许在你打断模型说话时,也能做出反响。
在最终一个演示中,搭档们决议测验做一些角色扮演。也便是咱们在开篇看到执行星舰使命的demo。