logo logo
  • 登录

AI数字人开源项目

数字人项目专栏
  • OpenGithub社区:https://open.itc.cn/
  • Github : https://github.com/OpenGithubs
  • Github 2024:https://github.com/OpenGithubs/Summary2024
  • 微信公众号社区: >>进入
  • 头条社区: >>进入
  • 知乎社区: >>进入

1.视频驱动肖像动画框架:LivePortrait 13.7k⭐

  • 项目地址:https://github.com/KwaiVGI/LivePortrait
  • 开源时间:2024-07-04
  • 最后更新:2025-01-01
  • 主要语言:Python
  • 项目分类:[AI]
  • 项目标签:[AI生成] [数字人]
  • 推荐理由:视频驱动肖像动画框架,专注于更好的泛化性、可控性和实际使用的效率。为了提高生成质量和泛化能力,我们将训练数据扩展到约 6900 万个高质量帧,采用混合图像 - 视频训练策略,升级网络架构,并设计更好的运动变换和优化目标。 项目流程图
  • Star历史曲线:[官网] Star历史曲线

2.多功能数字人项目:Fay 6.7k⭐

  • 项目地址:https://github.com/TheRamU/Fay
  • Github趋势榜:
    • 入选2025-01-16日榜,日增⭐6 stars today
    • 入选2024-12-16周榜,周增⭐94 stars this week
    • 入选2025-01-06月榜,月增⭐280 stars this month
  • 开源时间:2022-06-13
  • 最后更新:2024-01-23
  • 主要语言:JavaScript
  • 项目分类:[AI]
  • 项目标签:[AI聊天] [机器学习] [ 人工智能]
  • 推荐理由:一个完整的开源项目,包含了Fay控制器及数字人模型,可用于多种应用场景,如虚拟主播、语音助理、数字人互动等。作为开源项目,Fay提供了灵活的定制和扩展功能,适用于各种数字人应用场景。
  • Star历史曲线: Star历史曲线

3.声音模仿项目:echomimic 3.5k⭐

  • 项目地址:https://github.com/antgroup/echomimic
  • 开源时间:2024-07-03
  • 最后更新:2024-12-10
  • 主要语言:Python
  • 项目分类:[AI]
  • 项目标签:[交互式生成] [数字人]
  • 推荐理由:一个创新的声音模仿项目。通过可编辑的地标调节实现逼真的音频驱动肖像动画,为音频制作和声音特效提供了新的手段。
  • Star历史曲线:[官网] Star历史曲线

4.从音频生成面部运动系数的3D渲染工具:SadTalker 2.6k⭐

  • 项目地址:https://github.com/Winfredy/SadTalker
  • Github趋势榜:
    • 入选2023-04-14周榜,周增⭐878 stars this week
    • 入选2023-05-06月榜,月增⭐2,069 stars this month
  • 开源时间:2022-11-23
  • 最后更新:2023-04-25
  • 主要语言:Python
  • 项目分类:[视频图像] [AI]
  • 项目标签:[AI生成] [音频生成] [语音识别]
  • 推荐理由:一个能够从音频中生成面部运动系数的工具,它利用了3DMM(三维形变模型)和一种新颖的3D感知面部渲染技术。该工具可以根据音频生成头部姿势和表情,用于说话的头部生成。SadTalker 提供了一种创新的方式来生成逼真的面部运动,为音频相关的应用提供了更丰富的表现手段。
  • Star历史曲线:[官网] Star历史曲线

5.数字同步工具:LatentSync 2.0k⭐

  • 项目地址:https://github.com/bytedance/LatentSync
  • 开源时间:2024-12-11
  • 最后更新:2025-01-19
  • 主要语言:Python
  • 项目分类:[AI]
  • 项目标签:[AI生成] [交互式生成] [数字人]
  • 推荐理由:一个实用的同步生成项目,可以实现不同数据之间的同步生成,为多媒体创作和数据处理提供了高效的解决方案。
  • Star历史曲线: Star历史曲线

6.人脸说话生成框架:JoyGen 137⭐

  • 项目地址:https://github.com/JOY-MM/JoyGen
  • 开源时间:2025-01-02
  • 最后更新:2025-01-20
  • 主要语言:Python
  • 项目分类:[AI]
  • 项目标签:[数字人]
  • 推荐理由:一个有趣全新的人脸说话生成框架,包括音频驱动的唇部运动生成和视觉外观合成,能够生成让人感到快乐的图像、视频或文本内容。它可以为用户带来愉悦的体验,在娱乐和创意领域有一定的价值。
  • Star历史曲线:[官网] Star历史曲线

微信&公众号

欢迎添加微信好友共同学习进步,微信号:open_github

▲关注公众号”GitHub狐动社“,洞察Github开源动态