AI把小说变漫画?Lore Machine推出AI新工具,224万字文本生成1792张图

AI百科2个月前更新 快创云
31 0

  13年前,我撰写了一篇滑稽的短篇小说,描述了一个享用高档猫粮的男士。而今,一款名为的生成式人工智能平台将我的文字转变成了漫画。

  当我将故事输入文本框后,屏幕上显示:“我们正在识别场景、地点、人物及氛围。此过程可能需要2分钟。”平台分析文本,提取人物与地点描述,随后将信息传递给图像生成模型。不久,一个图文并茂的故事板出现在屏幕上。

  当我看到那些几乎被遗忘的角色以生动的方式展现时,我的心跳不禁加速。

  图 | 文字描述:故事叙述者坐在地上与猫咪们共享早餐(来源: / WILL DOUGLAS HEAVEN)

  该平台在一年多开发后首次向公众开放。每月10美元的订阅费,可上传总计10万字的文本(单次最多3万字),并为短篇小说、剧本、播客转录等生成80张图片。更高级的企业计划每月160美元,可接收224万字,生成1792张图片。

  配图风格多样,包括漫画、水彩及80年代电视节目风格等。创始人托贝·坎皮恩向创意机构展示了该工具的功能,该机构自此一直使用其早期版本。曾将一个短片剧本交给该机构,利用平台一夜之间将其转化为16页的漫画小说。托贝回忆道:“我们所有人都惊呆了。与其说被其图像生成能力打动,不如说被其叙事水平所震撼。从叙事流程到人物情感,它都处理得相当出色。”

  目前,正在为一部漫画系列开发虚构宇宙,该系列的文本源自网飞热门剧集《爱,死亡和机器人》的创作者。

  令人惊叹的效果背后,其实是由熟悉的组件构成。大型语言模型会扫描文本,识别出人物、地点及整体情绪。随后,利用Stable Diffusion的一个版本来生成图像。其独特之处在于易用性。从上传故事到下载漫画,我只需点击六次鼠标。这使其成为新一批非常易用的人工智能工具之一,这些工具将生成式模型的惊人力量隐藏在一键式网络界面之后。

  内容创作公司的CEO本·帕尔默表示:“要跟上新的人工智能工具的发展,需要做很多工作,而且每个工具的界面和工作流程都不同。使用一个具有统一UI设计的大型工具非常有吸引力。我觉得这就是这个行业的发展方向。”

  两年前,成立了公司,原本致力于开发一种基于区块链的维基百科。但当他看到人们如何使用生成式模型时,他改变了方向。曾使用免费的文本到图像模型Midtravel制作了英国诗人塞缪尔·泰勒·柯勒律治经典作品《古舟子咏》的漫画版。这些成果在网上疯传,但制作起来并不容易。“我妻子讨厌那个项目。”他说,“我每天早上四点就起床工作,试图把这些图像做好。”问题是,像Midtravel这样的文本到图像模型只会一个接一个地生成图像,这使得它很难让相同角色在不同画面之间保持一致,甚至在多个图像中锁定特定风格也很困难。因此,“我最终转向了一种更为曲折、抽象的表达方式。”这段经历让他意识到这项技术需要更容易使用。

  尽管该平台在某些方面表现不错,但并不完美。在我故事的一个场景中,一个短发角色长出了刘海;在另一个场景中,一个角色出现了两次。这些漫画图片也逐渐开始让人觉得有些宽泛,情节刻画不够具体。但与手动、一次又一次地输入提示相比,这是一个巨大的进步。“一致性非常好。”托贝说。这让他有信心在客户项目中使用该平台。“如果我们需要一直回去解决一致性问题,我们就不可能按时交付图片。”

  图 | 用人工智能生成的故事板(来源: / WILL DOUGLAS HEAVEN)

  和所有生成式模型一样,该平台背后的技术会根据用户指令生成有毒内容。托贝表示,他们已经阻止它生成描绘暴力或仇恨刻板印象的图像。但除此之外,他不愿意抑制艺术家的创造性表达。例如,为名人同人小说制作插图是允许的。起初,对最感兴趣的公司是营销机构。但他希望此次公开发布能鼓励更多用户尝试。他说六个月前,美国曼哈顿一所学校的校长给他打了电话,该学校专门为有学习障碍的孩子提供服务。校长希望利用此工具将课本转化为漫画,以便孩子们能够看图学习。“我甚至从未想过这一点,因为我太拘泥于好莱坞一类的东西了。”托贝补充道。

© 版权声明

相关文章