一键解锁全网最新鲜最热门的AI教程资讯-AI下载

最新AI教程资讯

VE-Bench – 北京大学开源首个针对视频编辑质量评估的新指标

VE-Bench 是北京大学的研究团队 MMCAL 最近发布首个专门针对视频编辑质量评估的指标。VE-Bench 的设计目标是与人类感知能力高度一致，更准确地评估视频编辑效果。VE-Bench QA 在评估编辑视频时，不仅考虑了传统视频质量评估方法强调的审美、失真等视觉质量指标，还专注于文本与视频的对齐以及源视频与编辑后视频之间的相关性建模。

2024-12-30 14:57:51

EDTalk – 上海交大联合网易推出高效解耦的情感说话头像合成模型

EDTalk是上海交通大学联合网易研发的音频驱动唇部同步模型，能实现对嘴型、头部姿态和情感表情的独立操控。只需上传一张图片、一段音频和参考视频，就能驱动图片中的人物说话，支持自定义情感，如高兴、愤怒、悲伤等。

2024-12-30 14:36:21

人气排行

1 The Language of Motion – 斯坦福李飞飞团队推出的统一多模态语言模型

2 PartGen – 牛津大学联合 Meta AI 推出的3D对象生成和重建框架

3 启元重症大模型 – 腾讯和迈瑞医疗联合推出的重症医疗大模型

4 Infinity – 字节跳动推出的高分辨率图像生成模型

5 Granite 3.1 – IBM 推出的新版语言模型

6 OCTAVE – Hume AI推出的语音语言模型

7 DisPose – 北大等多所高校推出的增强人物图像控制动画质量的技术

8 Baichuan4-Finance – 百川智能推出的全链路金融领域增强大模型

9 OpenAI o3 – OpenAI推出的新一代最强推理模型

10 MarkItDown – 微软开源的多功能、多格式文档转Markdown工具

24小时排行

1 The Language of Motion – 斯坦福李飞飞团队推出的统一多模态语言模型

2 PartGen – 牛津大学联合 Meta AI 推出的3D对象生成和重建框架

3 启元重症大模型 – 腾讯和迈瑞医疗联合推出的重症医疗大模型

4 Infinity – 字节跳动推出的高分辨率图像生成模型

5 Granite 3.1 – IBM 推出的新版语言模型

6 OCTAVE – Hume AI推出的语音语言模型

7 DisPose – 北大等多所高校推出的增强人物图像控制动画质量的技术

8 Baichuan4-Finance – 百川智能推出的全链路金融领域增强大模型

9 OpenAI o3 – OpenAI推出的新一代最强推理模型

10 MarkItDown – 微软开源的多功能、多格式文档转Markdown工具

AI开源模型推荐

更多

商量SenseChat

2025-01-02

下载

Coze

2024-12-30

下载

Llama 3

2024-12-30

下载

Gemma

2024-12-30

下载

阿里巴巴M6

2024-12-31

下载

网站地图 AI下载

Copyright © 2025

本站内容均来自网友上传，如有侵权请联系下架