首页
AI开源模型
AI数据集
AI工具集
AI办公能手
AI常用工具
AI交流工具
AI教程资讯
最新AI教程资讯
VE-Bench – 北京大学开源首个针对视频编辑质量评估的新指标
VE-Bench 是北京大学的研究团队 MMCAL 最近发布首个专门针对视频编辑质量评估的指标。VE-Bench 的设计目标是与人类感知能力高度一致,更准确地评估视频编辑效果。VE-Bench QA 在评估编辑视频时,不仅考虑了传统视频质量评估方法强调的审美、失真等视觉质量指标,还专注于文本与视频的对齐以及源视频与编辑后视频之间的相关性建模。
2024-12-30 14:57:51
EDTalk – 上海交大联合网易推出高效解耦的情感说话头像合成模型
EDTalk是上海交通大学联合网易研发的音频驱动唇部同步模型,能实现对嘴型、头部姿态和情感表情的独立操控。只需上传一张图片、一段音频和参考视频,就能驱动图片中的人物说话,支持自定义情感,如高兴、愤怒、悲伤等。
2024-12-30 14:36:21
上一页
1
2
3
7
下一页
人气排行
1
The Language of Motion – 斯坦福李飞飞团队推出的统一多模态语言模型
2
PartGen – 牛津大学联合 Meta AI 推出的3D对象生成和重建框架
3
启元重症大模型 – 腾讯和迈瑞医疗联合推出的重症医疗大模型
4
Infinity – 字节跳动推出的高分辨率图像生成模型
5
Granite 3.1 – IBM 推出的新版语言模型
6
OCTAVE – Hume AI推出的语音语言模型
7
DisPose – 北大等多所高校推出的增强人物图像控制动画质量的技术
8
Baichuan4-Finance – 百川智能推出的全链路金融领域增强大模型
9
OpenAI o3 – OpenAI推出的新一代最强推理模型
10
MarkItDown – 微软开源的多功能、多格式文档转Markdown工具
24小时排行
1
The Language of Motion – 斯坦福李飞飞团队推出的统一多模态语言模型
2
PartGen – 牛津大学联合 Meta AI 推出的3D对象生成和重建框架
3
启元重症大模型 – 腾讯和迈瑞医疗联合推出的重症医疗大模型
4
Infinity – 字节跳动推出的高分辨率图像生成模型
5
Granite 3.1 – IBM 推出的新版语言模型
6
OCTAVE – Hume AI推出的语音语言模型
7
DisPose – 北大等多所高校推出的增强人物图像控制动画质量的技术
8
Baichuan4-Finance – 百川智能推出的全链路金融领域增强大模型
9
OpenAI o3 – OpenAI推出的新一代最强推理模型
10
MarkItDown – 微软开源的多功能、多格式文档转Markdown工具
AI开源模型推荐
更多
商量SenseChat
2025-01-02
下载
Coze
2024-12-30
下载
Llama 3
2024-12-30
下载
Gemma
2024-12-30
下载
阿里巴巴M6
2024-12-31
下载
网站地图
AI下载
Copyright © 2025
本站内容均来自网友上传,如有侵权请联系下架