金磊 发自 凹非寺
量子位 | 公众号 QbitAI
【资料图】
现在,AI把“看视频”这事玩出了新高度。
可以边看视频,边和它聊天了!
例如这样婶儿的:
对于视频中熊猫基本的信息,AI可以对答如流。
甚至像“熊猫为什么举起它的手”、“熊猫感觉怎么样”这般意图、情绪方面的问题,AI也是可以做到。
再如下面这段视频:
对于人物的性别、做的运动,AI也是可以轻松拿捏。
这就是来自通用视觉平台OpenGVLab (由上海人工智能实验室和商汤科技联合打造) 的最新项目—— Ask-Anything 。
不得不说,GPT-4看图说都还没有开放,开源界就已经整出看视频聊天了。
也难怪网友对此直呼:
已经跟不上AI发展的速度了。
目前Ask-Anything提供了在线可玩的demo,操作也是非常的简单。
只需要将视频“拖拽”或“上传”到页面左上角的指定位置即可:
例如我们上传一个段女子做瑜伽的视频,AI就会瞬间给出一个主题: 瑜伽 。
然后输入OpenAI的API,点击“Watch it”,让AI先看一下视频;再点击“Let’s Chat”就可以展开对话了。
例如问“她在做什么”,AI就会说:
很抱歉之前没有给出明确的回答。由于我不知道具体是哪个场景的视频内容,因此只给出了大致的描述: 她似乎在做一个瑜伽姿势 。如果您有其他问题或需要更多帮助,请不要犹豫告诉我!
再追问“视频拍摄于什么时候”:
根据我的分析和对该场景的观察,我无法确定这个视频的具体拍摄日期和时间。然而,我可以告诉您的是,如果它是在现代城市中拍摄的,那么很可能是为了表现城市风光而进行的摄影作品。不过如果有更多的背景信息和文本数据可用的话,也许可以更好地推断出它的时间和地点。希望这可以帮助你得到更好的理解。
从结果上来看还是比较智能的。
至于背后的技术,据官方介绍,Ask-Anything目前支持ChatGPT、miniGPT4和StableLM。
该项目是由通用视觉开源平台 OpenGCLab 所打造。
这个平台是由上海人工智能实验室和商汤科技,于2022年2月发布并开源。
据了解,OpenGVLab平台是基于“书生”技术体系打造,在其支持下的AI,能够轻松看出打麻将、竞速摩托、熊猫等复杂的图片,置信度大大提高。
最后,demo地址放下面了,感兴趣的小伙伴可以上手体验了~
体验地址: http://106.14.223.212:7860/
参考链接: [1]https://github.com/OpenGVLab/Ask-Anything [2]https://twitter.com/_akhaliq/status/1650151007022620676
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一时间获知前沿科技动态
下一篇:最后一页
半月谈记者叶婧春日,鲁北麦田里,一簇簇麦苗经受住寒冬考验,争相发出新芽,陆续出苗返青。一名皮肤黝黑的
不怕打岔!微信推出“最近阅读”:近期阅读文章一键查
随着汽车市场的不断变化,豪华车的价格也在不断下探,所以购买豪华车的年龄也越来越低,更多的年轻人将首款
根据华为方面的消息,目前正在开展华为智慧屏的全面升级,主要分2个月完成升级,也就是4、5月,本次升级,
今天来聊聊关于主观跟客观有什么区别,主观与客观有什么区别的文章,现在就为大家来简单介绍下主观跟客观有
一季度,湖北高新技术产业实现增加值2602 11亿元,增长6 5%,高于GDP增速1 4个百分点。
跨江索道局部。极目新闻记者李博通讯员廖静4月19日,投资4800万元的湖北省恩施州首条跨江索道已竣工验收,
4月25日13点46分,沪企改革板块指数报1950 992点,跌幅达2%,成交41 20亿元,换手率0 50%。板块个股中,跌
2023年自贡社保缴费查询最新自贡社保个人缴费标准是多少,社会保险缴纳费用计算一般是根据当地去年社平工资
新华社伦敦4月24日电 知名经济专家、英国《金融时报》首席经济评论员马丁·沃尔夫日前接受新华社记者专访
X 关闭
上海推进三大先导产业规模实现倍增 打响“上海制造”品牌
深圳机场开通今年第5条国际货运航线 为深圳企业外贸出口提供新支撑
湖南公布90个建筑施工质量管理不合格工地名单
公众如何防范奥密克戎变异株?疾控专家回应
河南中招体育考试4月1日启动 计入中招成绩总分
婴幼儿疫苗最近暂停接种?郑州市疫情防控相关部门回应
X 关闭