MuseTalkMuseTalk 是一个实时高质量音频驱动唇形同步模型,旨在解决高分辨率、身份一致性和准确唇形同步的面部视觉配音挑战,尤其适用于实时应用如直播视频 。080训练模型# AI大模型# MuseTalk
SadTalkerSadTalker 是一个基于单张图像和音频生成说话人脸视频的模型,其核心功能是通过音频输入使静态图片中的图像动起来,并生成说话的虚拟人物。090训练模型# AI大模型# SadTalker
SoundView(声动视界)一款解决跨境电商视频创作的平台,利用多语种翻译、语音合成、语音识别、大模型等技术,提供视频配音、视频翻译、文本配音等业务,让带货视频、产品视频、选窜视频的创作更简单更高效090视频工具# SoundView# 声动视界# 视频工具
Seedance字节跳动开发的AI视频生成模型,模型能够根据文本或图像生成高质量的视频内容,支持多镜头切换、稳定运动轨迹和风格化控制,适用于创意内容创作、广告制作和教育演示等场景。060训练模型# AI大模型# Seedance
HalloHallo 是一个由复旦大学(Fudan University)开发的开源项目,专注于音频驱动的视觉合成技术,特别是用于人像动画生成。0100训练模型# AI大模型# ai数字人# Hallo
Veo3Veo 3 是 Google DeepMind 推出的新一代视频生成模型,专为电影制作人、故事讲述者和创意工作者设计,将视频与音频无缝结合,开启生成式 AI 的创作新篇章。0120训练模型# AI大模型# Veo3
sql-llm-benchmark专注于语言模型(LLM)SQL 能力评测的专业平台,构建了全面且具实践价值的 SQL 能力排行榜(SCALE),为开发者、数据库管理员及企业技术决策者提供关键参考090训练模型# AI大模型# sql-llm-benchmark
LMArena一个与人工智能(AI)模型评估和比较相关的平台,其核心功能是通过用户投票和社区参与的方式,对大型语言模型(LLM)进行评测和排名。060训练模型# AI大模型# LMArena# LMArena.ai