基于人工智能(AI)的程序占据了越来越多的利基市场,并被用于所有可能的领域。现在,一提到人工智能,很多人就会想到“为文本查询制作一张有趣的图片”之类的事情。 但事实上,这还不是他们的全部能力。
基于AI的程序已经发展得更广,在配音、创建徽标、编辑视频和照片以及为撰稿人或营销人员创建和分析文本方面呈现出出色的结果。它们甚至被用来在博彩公司、银行和加密货币交易所中通过视频验证,我们之前在 Telegram 频道中写过关于博彩的内容:
Deepfakes 甚至可以用来让老太太在亚洲流媒体应用程序上伪装成年轻女孩。
我们将推出一个新的领域,我们将在其中讨论基于AI的有用且有趣的程序和服务。在本文中,我们将向您展示基于AI的世界有多么多样化,并分析最近围绕初创公司Kaedim的丑闻,该公司被指控在将 2D 对象转换为 3D 时使用人力,而并非人工智能。
在超过 15 个案例中,我们将分析存在哪些基于 AI 的程序,并告诉您如何有效地利用它们来赚钱。
Kaedim,它有什么问题?
Kaedim 是一个基于 AI 的程序,可在 15 分钟内将 2D 概念转化为完整的 3D 模型,并提供良好的设计输出。
如果我们谈论的是由机器而非人力,那么实现良好、正确的模型设计是很困难的。此外,他们网站上的开发人员表示,您可以转换任何图片,无论是简单的绘图还是复杂、逼真的照片。问题如此之多,答案却如此之少。因为开发人员对他们是如何做到的保持沉默,并提到了训练有素的人工智能。
用户开始产生怀疑并试图揭开 Kaedim 的秘密。他们问的第一个问题是机器如何设法如此简化成品 3D 模型的细节。看看通过 Kaedim 建模的鸟。 所有的羽毛都去哪儿了?
如果具有许多小而多余的细节的现实背景下的对象,在完成版本中没有丢失这些细节,而是变成其自身的简化版本,则不会出现问题。基于 AI 的程序可以做很多东西,但是如何正确地剪掉多余的东西以及在什么基础上选择这些多余的东西是机器很难做到的。这只能由人来完成。即使这是由人工智能完成的,无论拓扑结构多么完美,也不会产生这样的结果。此外,上传图像时,您可以指定应该做哪些改变。技术超前多年?是有疑问的。
推特用户联系了@Forbes 和@80Level,他们在他们的出版物中介绍了 Kaedim,并询问他们是否亲眼目睹了从头到尾的 2D 到 3D 转换过程。然而并没有得到答案,然后他们开始分析评论。
后来,其中一位用户找到了一份旧招聘启事,其中 Kaedim 正在寻找“在 15 分钟内快速将 2D 源转换为低质量 3D 对象”的员工。
推特用户表示,人工智能的唯一来源是来自第三世界国家的专家:有条件的印度人以 1 美元一个的价格“铆接”3D 模型。这样的假设使一切都可以说得通了。
将订阅此资源的成本与该领域的类似项目进行比较,我们可以坦率的说价格有点高了。30 个型号的完整订阅起价为每月 299 美元,1000 个型号最高可达 7700 美元。试用版每个项目收费 6 美元。
据他们称,许多从事 3D 建模多年的用户在评论中声称该项目纯属骗局。
其中一个论点是,如果他们设法开发出一种基于人工智能的程序,能够独立地将 2D 对象转换为 3D,那么这种技术就会成为一个突破,就像著名的谷歌一样。
两天后,Kaedim 团队终于决定公开澄清。除了对工作的诚实和透明的评论外,他们还透露了大家非常感兴趣的图像处理过程:
首先,AI 处理原始图像并将其转换为 3D 模型,然后工程师检查 AI 的工作情况。并且,如有必要,还会有人“按照 Kaedim 的高质量标准”编辑模型。
这是有道理的,但它仍然留下了一个问题:所有这些手动编辑的目的是什么?为什么不直接给用户一个不完美的结果,一个完全由 AI 制作的结果? 随着时间的推移,人工智能会学习,其工作质量也会提高。所有最成功的基于人工智能的程序,如DALL-E和Midjourney,都是根据这一原则开发的。
有趣的是,2022 年 8 月,Kaedim 服务的创始人康斯坦丁·普索玛 (Konstantin Psoma) 接受了《福布斯》(Forbes) 的采访,她在采访中发表了几句高调言论,但遭到用户的嘲笑。例如,“创建3D模型是游戏开发过程中最耗时的部分之一。”还有:“游戏行业因其错过上线最后期限而被用户诟病。”你最喜欢的游戏被推迟了多少次?借助 Kaedim 工具,游戏开发人员可以将创建游戏的速度提高 10 倍,这意味着您现在等待一款游戏的时间,可以发布十款游戏。
服务的主要受众是比较粗鲁的。但这样的陈述表明,这位企业家要么故意误导读者以宣传她的初创公司,要么她自己并不了解这一领域。如果康斯坦丁认为 metaverses 是“游戏品牌重塑”,并且流行项目的续集被推迟了很长时间,因为“他们不能使用多年前制作的以前游戏中使用的 3D 模型,因为它们现在存储空间不足”,那我们还能说什么?
Kaedim 联合创始人康斯坦丁·普索玛
尽管有上述陈述,采访中仍然有一个有趣的事实:这位企业家表示,她的团队发布了一个 API,任何人都可以使用该 API 将 2D 自动转换到 3D 并集成到他们的应用程序、游戏和虚拟世界中。
Kaedim 是否是一个骗局尚不完全清楚。但大多数测试过 AI 的推特用户都倾向于第一种选择。
上文中,我们已经提到了其他几个实际存在并且已经可以体验的基于 AI 的程序。因此,我们将转向介绍一些有趣的基于 AI 的程序和在实践中使用这些服务的示例。
最受欢迎的基于 AI 的设计创作程序已经走向未来,现在正在产生惊人的结果。 DALL-E 2 根据文本请求创建美丽而准确的图像,并生成徽标、包装设计和动画,并使用OutPainting功能增强图像,同时保留风格和含义。以下是一些使用此 AI 的案例研究,它们会给您留下深刻印象。
DALL-E 2 可以轻松生成很多相同风格的元素;这个示例,说明如何为您的网站、应用程序或任何东西创建图标。基于 AI 的程序如此成功地完成了这项任务,以至于人们不由自主地问了一个问题:到底需要设计师吗?配色和风格都选的很好,如果要修改,只需要向AI提交请求,就能达到完美的效果。
使用基于 AI 的 DALL-E-2 程序,您可以简化景观、角色和对象的开发过程。开发人员创建了一款游戏,其中 AI 生成了背景元素、环境,甚至动画。结果呈现非常好,特别是考虑到基于 AI 的程序只运行了很短的时间。未来,人工智能将进一步发展其技能。可想而知,等待我们的将是怎样的结果。
这是一个更先进和流行的基于 AI 的程序,可以根据文本请求创建图像。它产生的图片令人印象深刻。您可以使用 Midjourney 做任何事情:商业标志、包装设计、游戏设计、剪辑等等。
来自克麦罗沃的糖果店 Tortishnaya 设计了带有 Midjourney 的巧克力棒,结果非常神奇。
他们通常依赖设计师的服务,但这次他们决定尝试使用人工智能来开发包装。结果证明是有趣且不同寻常的,但是,正如糖果店的代表所说,这比手工完成设计花费的时间要多得多。最后,他们补充说这很有趣,但下次他们不会使用 AI 来创建包装,而是将工作交给设计师。
这是包装设计的第二个例子,这次是爆米花。 这个结果是人工智能在一分钟内生成的。
看起来不错,但问题是这些只是设计图像,而不是可打印的模板。 尽管如此,它可以作为进一步发展的想法,这已经很好了。
使用Midjourney进行游戏设计
与 DALL-E 2 示例一样,Midjourney 可用于设计游戏。举一个例子,一款名为 Shoon 的 2D 游戏的开发者使用 AI,为游戏中的背景、飞机模型和奇怪的生物生成后世界末日的风景。
除此之外,我们使用 Copilot 或 AlphaCode 生成代码(顺便说一句,这些服务受到程序员的称赞,但不是作为编码员的“替代品”,而是作为助手),以及使用 AI 的背景声音, 那么就可以几乎完全使用 AI 来创建游戏。
MidJourney在艺术中的使用
Midjourney 创造出惊人的复杂风景和绘画。它们如此不同寻常,以至于可以与艺术家的作品相媲美。或许在未来,我们更应该期待当代艺术的一个新分支,因为艺术反映现实,而现实就是AI。
这是一个有趣的例子,一位美国艺术家在科罗拉多州博览会举行的比赛中获得数字艺术类别的第一名:
他使用 Midjourney AI 程序生成了 100 张图像,选择了前 3 张,然后使用另一个基于 Gigapixel AI 的程序对图像进行了放大。
带领艺术家走向胜利的形象让人想起伦勃朗和卡拉瓦乔等古代大师的作品。也许艺术家用他们的画作创造了一个新形象,但结果简直是神奇。
互联网上有许多著名艺术家的音乐视频都使用了 Midjourney 生成的图像。如果您专业制作此类视频。也许在某个时候,您的作品会引起表演者和视频制作者的兴趣。在我们这个时代,一切皆有可能;最主要的是高质量地展示你的想法。此外,可以使用Stable Diffusion 程序对 Midjourney 中的图像进行动画处理,我们将在下面讨论这个。
如果您还通过 Mubert 服务根据文本请求生成音乐(“节拍”),则可以创建更加独特的视频。但是,如果您决定通过著名艺术家的视频赚钱,请记住 YouTube 可能会“声明”版权。 因此,制作此类视频的人通常会更改音轨,从而无法被视频托管算法识别。
这些算法非常严格,甚至可以标记使用受版权保护的小声音创作音乐的音乐家。正因为如此,音乐家们经常不得不重做并重新上传他们的作品。Mubert肯定会面临这样的问题; 只是互联网用户尚未对其进行彻底测试。
这是一个基于 AI 的开源程序,于 2022 年 8 月 22 日向公众发布。Stable Diffusion 的结果与上述 DALL-E 2 和 Midjourney 的结果相似,但不同之处在于该程序是完全免费的,可以不受限制地工作。这个基于人工智能的程序创造了令人惊叹的风景和人物,改变了图像的风格,并生成文本查询,就像它的“同事”一样。
顺便说一句,以前的服务是付费的,但它们提供免费试用期,其条款(如定价政策)经常变化。这就是为什么我们没有提供选择细节但提供官方网站链接的原因。
以下是 AI 如何通过两次单击从简单的草图生成逼真的绘图的示例:
这表明即使您根本不擅长绘画,也可以使用 Stable Diffusion 来创建徽标。最主要的是只要大概地指出你需要什么,然后浏览选项并添加你的偏好即可。
在 Stable Diffusion 中,您还可以根据视频和文本生成动画。这是以每秒 8 帧的动画风格翻拍 La La Land 中的舞蹈场景。
Stable Diffusion的问题是什么?
由于该程序是开源的,因此存在如何控制它的问题。在这种情况下,人工智能程序可用于生成违禁图像,例如宣传暴力和色情内容。
该网络还引发了版权争议。人工智能从开源中收集所有图像,包括受版权保护的当代艺术家的画作。
艺术家 RJ 帕默对 Stable Diffusion 和其他类似的基于人工智能的程序的工作表示了强烈的担忧,因为他的画可以被人工智能用来生成图像。
正是出于这个原因,库存照片服务和 NFT 不允许销售,并阻止使用 AI 制作的图像。他们辩解说,虽然图像是新的,但它是由许多其他人的绘画和照片的碎片制成的,这意味着他们侵犯了版权。例如,Dune subreddit 最近禁止了 AI 生成的图像,并将它们标记为“合成内容”。
这很可能会在未来发生变化。
Telegram 频道“Metaverse and IIshche”的作者就此事发表了自己的看法。他认为,人工智能和艺术是刚刚出现的问题,因此人们需要了解如何使用以避免问题。艺术家的大脑也接受了基于人工智能的程序的训练,该程序包含有关其他艺术家的绘画、他们自己的经历和他们的生活位置的信息。艺术家将他们以前见过的一切再循环成新的东西,这就是创造新艺术作品的方式。
现在像 RJ 帕默这样的人很难接受这样一个事实,即需要 AI 处理大量信息并在几秒钟内生成新的东西,因此他们感到不公平。
Nikolai Ironov 是由 Artemy Lebedev Studio 开发的基于 AI 的徽标创建程序。该服务以 9,900 卢布的价格提供五个不同项目的创建,其中包括 999 个徽标。您可以轻松地尝试各种样式、颜色、字体和布局,以找到最适合您需要的一种。
从理论上讲,这听起来很棒。 无需浪费时间寻找设计师或工作室或编辑您的设计。一切都可以在此时此地快速高效地完成。
数字机构亚特兰大的艺术总监通过为与 OSAGO 相关的 Arama 网络平台创建徽标来测试该程序。以下是他们获得的结果:
将结果展示给客户后,他说:“我认为情况会更糟。”
亚特兰大机构在 vc.ru 上的帖子的用户一致评论认为,最好多付三倍的钱给设计师,并获得一个至少能反映品牌价值的标志。
另一个在线人工智能标志制作工具是 Looka。 Looka 和 Nikolai Ironov 之间存在显着差异。在生成徽标之前,Looka 会收集全面的信息和偏好。创建徽标没有任何限制,最重要的是,定价合理。
他生成的所有标志都是独一无二的,并且由于深入分析,使结果变得更好、更有趣。完成的结果可以矢量格式下载,标志可以手动修改。
如前所述,您可以生成任意数量的徽标,但只需为最终结果付费,基本版 4.99 美元,扩展版 7.99 美元。徽标立即以三个版本下载:彩色、黑白和透明。因此,您可将其将在任何表面上打印。
Wizard 是一种基于 AI 的工具,用于快速创建网站布局。该工具非常易于使用:您在纸上画出界面草图,将其加载到 Wizard 中,整洁的布局就准备好了。这是一种魔法,可以让每个创建网站的人都更轻松。看看它是如何工作的:
该工具本身是免费的;您只需注册即可开始使用。还提供每月 12 美元的高级付费版本,其中包括无限项目和对所有模板的访问权限。免费版包括三个项目和十个模板。
使用Symmetric Sketch,您可以将草图转换为三维模型。与被称为恶作剧的 Kaedim 不同的是,它的源代码是在公共领域发布的,任何人都可以验证该程序不是假的。但是请注意,这不是基于人工智能的程序。该服务使用较为复杂的的差异几何和优化。
尽管如此,Symmetric Sketch 使设计师能够更轻松地创建所需的对象和图形,或者将未来的家具虚拟地放置在公寓中。
DataLocator是一个尖端系统,可让您使用人工智能实时监控社交网络上的品牌提及情况。与 Mention 等类似工具不同,DataLocator 使用人工智能技术来收集和分析信息,使其成为市场研究的重要内容。
虽然它以其在 Telegram 上的卓越监控功能而闻名,但在其他平台上的进一步测试尚未完全公开。
我们希望 DataLocator 继续得以发展,扩展其监控所有流行社交网络和搜索引擎的能力。 通过这样,它将允许用户不仅跟踪特定品牌的数据,而且跟踪单个关键字,因为操作原理是相同的:关键字搜索。
Bloom 是一种非凡的人工智能开放语言模型,支持 46 种自然语言和 13 种编程语言。与其他仅专注于英语的大型语言模型不同,Bloom 的开发人员已决定将注意力转移到开发此类模型以前不支持的其他语言上。
使用 Bloom 非常简单:写一个生成提示,AI 就会生成所需的文本,无论是结构还是故事。这个工具可以在任何地方使用,包括营销。当您可以使用完全免费的 Bloom 自行生成文本时,不再需要向母语人士订购文本。那么为什么不试一试呢?
Zvukogram 是一个最先进的基于 AI 的程序,可以将书面文本转换为声音的系列。用户可以选择男性和女性的声音,以及需要的免费或付费的语音选项。这项服务被主要的YouTube频道和电视节目广泛使用,提供 20 多种语言和各种不同的声音。
像 Zvukogram 这样的基于人工智能的程序对于发声创意非常有用,比如在赌博行业。您可以从真实的新闻故事中选择一个节选,用这个基于 AI 的程序在其上叠加语音,并创作出能够激发观众信心的出色创意作品。其他类似的程序包括 Voicechanger.io、Google 的 Deep Voice、Wavenet 和 Respeecher(它允许用户加载带有语音的音轨并从中制作模型,以便您过后可以简单地加载文本并使用相同的声音)。
这些基于 AI 的程序不仅可用于创意,还可用于 TikTok 或 YouTube 上视频的画外音等用途。然而,它们也可能被滥用,正如一名诈骗者所证明的那样,他试图使用带有Deep Fake的程序来欺骗两个加密附属程序,以取代他的真实声音并创建两个不同的角色。当程序崩溃时,他的欺骗行为最终被揭穿,露出了他的真实声音。
Pixelcut 是一款基于 AI 的移动应用程序,可使图像编辑更加高效和直接。该应用程序在 App Store 和 Play Market 中可用,是共享软件。
使用 Pixelcut,用户可以删除背景、不需要的对象和内容,恢复质量,并叠加各种背景、贴纸和文本。
Dain App 是一款基于 AI 的应用程序,非常适合进行完整的视频编辑。它可以提高 每秒帧数、调整视频颜色、消除视频缺陷以及将视频转换为 4K 格式。基于人工智能的程序本身可以计算出物体移动的轨迹,以补齐缺失的帧,使视频流畅。
该应用程序是免费的,可在此处下载。
其他流行的人工智能程序和服务
其他流行的人工智能程序和服务包括;
结论
基于人工智能的程序被用于各个领域,它们极大地改善了我们的生活。DataLocator、Bloom、Zvukogram、Pixelcut 和 Dain App 是人工智能技术如何帮助我们更高效、更有创意地工作的一些例子。
如果你一直在想,“类神经网络如何让我受益?” 那么我们希望我们已经回答了您的问题。类神经网络被用于各种领域,使生活变得更简单、更有吸引力。一旦你尝试了它们,你就会想知道没有它们你是如何管理的。
我们将继续讨论类神经网络的最新发展,更重要的是,如何以及在何处使用它们。我们将比较哪些效果较差,哪些效果更好。我们还将继续为您提供新的想法,以简化您的日常工作。