推荐三款AI工具
一、Champ
这是一款三维参数导引下可控一致的人体图像动画生成项目。只需一张照片,即可让照片中的人物动起来,实现动态人像复刻。项目依靠人体网格恢复模型,从输入视频中提取参数化三维人体网格模型SMPL序列,以渲染不同的信息控制视频的生成。多层运动融合模块(MLMF)通过深度、骨骼、蒙版、法线、语义等五项信息,控制视频的细节生成,使其更加真实灵动。此外,Champ利用SMPL保持了生成视频中人物体型的一致性。项目支持本地部署,但高分辨率生成需要一定硬件支持。
二、MuseV
MuseV是一款基于视觉条件并行去噪的无限长度和高保真虚拟人视频生成项目。支持图像到视频、文本到图像到视频、视频到视频等多种生成方式,并能兼容Stable Diffusion的生态系统。通过并行去噪技术,确保首帧信息不被破坏。在生成虚拟人视频方面表现出色,同时支持高质量、高分辨率的视频数据集训练。近期更新中,作者团队更新了Huggingface的GUI,用户可以在线体验。
三、BrushNet
BrushNet是一个具有分解双分支扩散的图像修复模型,可以修复画面上的Mask区域(蒙版,存在缺失的部分)。对于任何已经预先训练好的扩散模型,BrushNet都可以实现“即插即用”。它不会修改预训练扩散模型的权重,具有保存尺度调整功能,并可自定义非Mask区域的保存比例。这使得BrushNet具有很强的灵活性。此外,作者团队展示了将BrushNet与不同扩散模型相结合的能力,用户可以根据个人需求灵活选用已训练好的SD模型进行集成。
此外,还有一款开源的爬虫项目MediaCrawler,用于爬取小红书、抖音等平台的视频、图片、评论等信息。该项目基于playwright库搭桥,保留登录成功后的上下文浏览器环境,通过执行JS表达式获取加密参数。MediaCrawler具备模块化设计,用户可根据需求自定义爬取策略。但请注意,使用此类工具时需遵守相关法律法规和平台规定。