剑桥、腾讯AI Lab等提出狂语言模子PandaGPT:一个模子不同六种模态
来源:Scott Marcus网
时间:2025-03-09 21:46:35
克日,剑桥来自剑桥 、腾讯提出态NAIST 以及腾讯 AI Lab 的狂语钻研者推出了一款名为 PandaGPT 的跨模态语言模子 ,揭示了在家养智能规模的言模立异试验 。经由散漫 ImageBind 的个模模态对于齐能耐以及 Vicuna 的天在行腕,同时实现为了六种模态下的不同指令清晰与追寻能耐。尽管 PandaGPT 的种模下场尚有提升空间 ,但揭示了跨模态 AGI 智能的剑桥睁开后劲 。
来自剑桥 、腾讯提出态NAIST 以及腾讯 AI Lab 的狂语钻研者近期宣告了一项名为 PandaGPT 的钻研下场,这是言模一种将大型语言模子与差距模态对于齐、绑定以实现跨模态指令追寻能耐的个模技术。PandaGPT 可能实现诸如天生详细的不同图像形貌 、凭证视频编写故事以及回覆对于音频的种模下场等重大使命。它可能同时接管多模态输入,剑桥并做作地组合它们的语义 。

名目主页: https://panda-gpt.github.io/
代码: https://github.com/yxuansu/PandaGPT
论文: http://arxiv.org/abs/2305.16355
线上 Demo 揭示: https://huggingface.co/spaces/GMFTBY/PandaGPT

为了实现图像 & 视频