Lumiere是谷歌发布的一个文本到视频扩散模型,于2024年正式发布。这个模型能够直接生成全帧率、低分辨率视频,通过训练海量文本和视频数据,可以将文字描述直接转化为高质量、真实、多样且连贯动作的视频。适用于多种内容创作和视频编辑应用,如图像到视频、视频修复和风格化生成。Lumiere的时空扩散U-...
Imagen 3是Google DeepMind开发的最新文生图大模型,于2024年5月14日(美国当地时间)在谷歌的I/O开发者大会上正式发布。它能够根据文本提示生成高质量、高分辨率的图像,具有更好的细节和丰富的光照效果。这个模型支持多种视觉风格,从照片般逼真到油画质感,甚至黏土动画场景。Imag...
Stylar AI是一个基于人工智能的AI图像设计工具,凭借其智能生成、丰富的风格库、精确控制和Stylarize功能等特点来帮助用户创建和编辑图像,旨在简化设计流程并激发创意,帮助用户轻松实现专业水平的设计作品。无论是设计师还是爱好者,都可以利用Stylar AI的高清输出和智能剪切功能,将想象力...
Toona.io是一个免费在线AI漫画和插画上色工具,它利用先进的人工智能算法自动为黑白漫画和插画上色。这款工具旨在简化上色过程,使艺术家和漫画创作者能够更专注于创作本身,而不是花费大量时间在上色上。其主要功能包括为黑白漫画上色、自动识别并裁切漫画窗格,以及为漫画图片添加过渡动效。无论是专业的插画师...
腾讯混元DiT是一个基于Diffusion transformer的文本到图像生成模型,也是业内首个中文原生的DiT架构文生图开源模型。该模型具有中英文细粒度理解能力,能够与用户进行多轮对话,根据上下文生成并完善图像。腾讯混元DiT的参数量达到15亿,支持中英文双语输入及理解,进一步提升了生成图像的...
Tripo AI是由VAST公司研发的一款基于AI人工智能的3D三维建模工具,它可以让你用简单的文字或图片就能创建出惊人的三维模型,可以识别输入的内容,自动调整模型的形状、纹理、光照等参数,使得模型更加逼真和美观。它基于VAST在AI算法领域的诸多前置研究和数十亿参数级别的海量3D高质量原生数据库训...
Harmonai是一个开源生成音频工具,专注于开源的生成音频模型,让每个人都能轻松愉快地进行音乐制作。他们的目标是让音乐制作更加容易和有趣,让每个人都能表达自己的创造力。该公司推出的Dance Diffusion模型是其核心技术之一。该模型利用先进的AI算法,可以生成定制的无限音乐库,为用户提供高品...
Meshy是一款基于人工智能技术的3D模型生成和优化工具。它可以帮助用户快速地将文本和图像转化为高质量的3D模型,并支持多种生成模式,如文本转3D、图像转3D等。此外,Meshy还可以自动分析和优化3D模型的拓扑结构,去除不必要的面和顶点,从而提高模型的性能和渲染效果。同时检测和修复模型中的错误,如...
Appicons AI是一个由人工智能驱动的在线应用图标生成工具,它可以让用户在几分钟内创建出专业的移动应用图标,无需任何设计技能或软件。用户只需选择一种风格,输入应用的名称,然后就可以看到Appicons AI为他们生成的多种图标设计。用户可以根据自己的喜好,调整图标的颜色、形状、大小和视觉效果,...
LogoStoreAI是一个创新的人工智能驱动的标志生成器,专注于为各种规模的企业和个人提供独特且具有视觉冲击力的logo库。这个平台充分运用AI技术,帮助初创企业和小型企业找到最能代表他们品牌精神和业务特色的logo,以提升其品牌形象并创造出强大的视觉形象。LogoStoreAI不仅是一个资源丰富...
TEXT-TO-CAD是一种基于生成式AI的CAD文件生成工具。它允许用户通过文本提示来生成CAD文件。这个工具特别适合设计师和工程师,他们可以快速、高效地从文本提示生成精确的CAD模型。例如,用户可以输入“一个10片平刃的叶轮”或“一个36齿的螺旋齿轮”,TEXT-TO-CAD会根据这些提示生成相...
Adobe Firefly Image 2 是Adobe推出的一款生成式人工智能模型,建立在Firefly图像模型的基础上,专为设计师和创作者提供更强大、更智能的图像生成能力。它通过简单的文字描述,可以生成高质量的图像、文字效果和鲜艳的调色板。Firefly Image 2在创意和质量上带来了重大进...
Penpot是一个开源的设计和原型制作工具,它专为团队协作而构建,允许设计师、开发者和产品经理在同一平台上无缝地创建、分享和迭代设计项目。这个平台基于Web,因此它能够在任何操作系统上运行,并为用户提供丰富的功能以提高工作效率和简化工作流程。它的主要应用场景包括线框和模型设计、UX测试和反馈以及团队...
Stable Doodle 是一款神器的草图到图像的AI工具。它可以将用户绘制的草图轮廓一键生成精美的图片,利用最新的Stable Diffusion模型对草图进行分析,完成补充细节、填色、优化图片等工作,生成“视觉上令人愉悦”的艺术再现。此外,Stable Doodle还提供了文本提示功能,用户可...
DreamTalk 是一个基于扩散的、以音频驱动的表达性说话头部生成框架,能够跨多种说话风格生成高质量的说话头部视频,由清华大学、阿里巴巴和华中科大共同开发。它的主要功能是通过人工智能技术让人物头像能够说话、唱歌,并保持嘴唇的同步以及模仿表情变化。这一框架能够生成高质量的动画,使人物脸部动作看起来非...
face to sticker是一款在线AI将人脸转换为贴纸的工具,用户可以通过上传包含人脸的图像,然后调整一些参数,如图像的尺寸、生成步数等,来定制生成的贴纸。这些贴纸不仅具有个性化特点,还适用于各种个人创作和社交分享场景,目前免费使用。此外,face to sticker采用了先进的人工智能技术...
Boximator是字节跳动推出的一款利用深度学习技术进行视频合成的先进工具。它使用文本提示和额外的盒子约束来生成丰富且可控制的视频运动,从而为用户创造独特的视频场景提供了灵活的运动控制。具体来说,Boximator可以通过文本精准控制生成视频中人物或物体的动作,能生成包含多个角色以及特定类型运动的...
华知大模型是由同方知网与华为合作开发的中华知识大模型。它是一个专注于知识服务与科研行业的全栈自主可控的大模型,旨在覆盖政企文教等多个行业场景,并提供30多项通用能力体系。华知大模型的核心特色能力包括智能写作、学术搜问、AI伴读、标准智能问答、机构业务知识智能问答以及图书馆读者智能服务系统等。此外,华...
AnimateZero是腾讯AI团队发布的一款AI视频生成模型,通过改进预训练的视频扩散模型(Video Diffusion Models),能够更精确地控制视频的外观和运动,实现从静态图像到动态视频的无缝转换。用户可以通过输入文本和图像来生成视频,比如由动漫人物的图片生成的视频,不仅人物动作流畅,...
PIXART-Σ是华为推出的图像生成模型,由华为诺亚方舟实验室、大连理工大学和香港大学的研究团队开发。采用Diffusion Transformer (DiT) 架构,可直接生成 4K 分辨率的 AI 图像。用户只需输入一段文字描述就能生成具有4K高分辨率的图像,相较于前身PixArt-α,它提供了...