当前位置: 首页 新闻详细

社交媒体时代蒙娜丽莎的观看之道,6个近期爆火的AI图像生成工具

专业新媒体运营推广——跟随大平台节奏

电话+V:159999-78052,欢迎咨询图像 从文艺复兴到社交媒体pdf,[专业新媒体运营推广],[各种商圈业内交流],[抖音运营推广课程],[微信运营推广课程],[小红书运营推广课程],[让你站在风口忘记焦虑]

一、社交媒体时代蒙娜丽莎的观看之道

  编译:黄松

  巴黎卢浮宫的《蒙娜丽莎》前,几乎每刻都围着不下百人,拿着手机拍摄防弹玻璃后“又黑又小”的画,在数字媒体时代,在《蒙娜丽莎》面前的人不仅仅是看艺术作品,拍照、发社交媒体更是一种体验和“我去过那”的证据。比较约翰·伯格《观看方式》对于可机械复制的时代改变艺术的描述,数字和社交媒体时代又赋予艺术作品哪些含义?

法国卢浮宫《蒙娜丽莎》前举着手机拍摄的观众

  巴黎卢浮宫内,一对年轻的夫妇穿过人群走到蒙娜丽莎前。几秒后,妻子转过身,微笑地举起手机,按下自拍。接着,她把手机交给丈夫拍摄了一些佯装欣赏的照片;然后两人手挽手自拍后转身离开。

  “画太小了,这太拥挤了,无法近距离观察细节。”妻子说,她是一位来自上海的28岁金融分析师,她与外籍丈夫在巴黎对蜜月。这是她第一次看到达芬奇《蒙娜丽莎》真迹,但印象并不深刻。“在画册或是互联网上,我可以看到更清晰的蒙娜丽莎。”而之所以选择参观卢浮宫是因为《蒙娜丽莎》神秘的微笑很有名,且在丹·布朗的《达芬奇的密码》让她对作品和卢浮宫博物馆有了更多想象。

  这对夫妇与拥有500年历史的绘画作品的互动方式恰恰体现了数字媒体时代的艺术体验。卢浮宫的开放时间里,《蒙娜丽莎》前大约时时刻刻围绕大约150名参观者,其中大部分在拍摄《蒙娜丽莎》或《蒙娜丽莎》与自己的合影。在数字媒体时代,在《蒙娜丽莎》面前的人不仅仅是看实际的艺术作品,更是一种体验和经历,当他们把拍摄有《蒙娜丽莎》的照片发布在社交媒体上,就成了“我去过那”的证据。

  2017年,卢浮宫吸引了810万游客,依旧长期保持着全球参观人数最多的博物馆之一的地位。其中《蒙娜丽莎》是一张被无限复制的女性肖像,她被认为是佛罗伦萨布商的夫人丽莎·焦孔多。16世纪初,达芬奇以油画的技法完成了它。最早《蒙娜丽莎》收藏于法国皇室的枫丹白露宫之中,卢浮宫建成之后移往卢浮宫。早先这幅作品并不出名,也没有被当做镇馆。直到1911年8月20日,曾在卢浮宫内担任油漆匠的佩鲁贾于闭馆时躲入储藏室,趁隔天周一休馆取下画作,藏于大衣内窃出博物馆。馆方在22日发现《蒙娜丽莎》遭窃,于是进行一周闭馆调查,并祭出高额悬赏金。由于持续没有画作的下落,在各家报纸的报导下,《蒙娜丽莎》逐渐有了知名度。两年后,佩鲁贾想要将《蒙娜丽莎》卖给佛罗伦萨乌菲兹美术馆,遭警方逮捕。《蒙娜丽莎》回到卢浮宫后,在两天内吸引了十万人前来观看,或许失窃造就其成为了“世界名画”。如今这幅长77厘米,宽53厘米的“小画”在防弹玻璃和层层温控的保护下,陈列在卢浮宫之中。

2014年10月,美国音乐明星Jay-Z、碧昂丝在卢浮宫《蒙娜丽莎》的合影。

  2014年10月,美国音乐明星Jay-Z、碧昂丝,以及他们的女儿布露?艾薇一起参观了卢浮宫,在社交媒体Instagram上发布了参观照片引起了巨大关注和反响,被美国的网络新闻媒体公司BuzzFeed描述为“没有任何图像比碧昂丝和Jay-Z站在蒙娜丽莎面前更重要!”并补充到,“这可能是我们这个时代最好的照片。”

  或许对于专业的艺术工作者、评论家或策展人而言,将观看《蒙娜丽莎》的体验仅仅作为旅游时的自拍就显得足够简单,然而就Jay-Z和碧昂丝等卢浮宫的观光客而言,在社交媒体上发布包含有《蒙娜丽莎》真迹的照片,就显示了自己确实看过原作。

  对于评论家或策展人而言,将“蒙娜丽莎体验”视为仅仅是自拍旅游就足够简单了。然而Jay-Z和Beyoncé几乎和所有访问卢浮宫的人一样,确实看过这幅画。

  事实上,当下对于《蒙娜丽莎》的观看方式代表了在数字媒介、视觉文化的时代,大多数艺术形式的饱和。

  “她比她身坐其中的岩石更古老;像吸血鬼似的,她已经死去过多次,谙熟死亡的秘密。”1873年,英国评论家瓦尔特·帕特的名著《文艺复兴》中最有名的段落就是关于《蒙娜丽莎》的。早在大众旅游、智能手机、应用程序等出现前,他就唤起了《蒙娜丽莎》的永恒。

  但可机械复制的时代改变艺术,而数字时代的到来这种变化更为明显。另一位英国评论家约翰·伯格在他1972年出版的《观看方式》一书中写道,在数字复制时代,“画作的含义不再是图画的附属品,而变得可传播。”

  去年去世的约翰·伯格可能也已经注意到2014年碧昂丝在Instagram上发布的与卢浮宫《蒙娜丽莎》的合影获得了近84万人的点赞。

碧昂丝在社交媒体Instagram上发布了参观照片获得近84万人的点赞

  同样,富有的艺术藏家也不需要在花费数百万美元购买克里斯托弗·伍尔、葛哈·李希特前花费数小时观看原作,因为在数字复制的时代,藏家已经多次看到了作品的数字版,并已经确切知道它的样子。

  尽管名牌机构的当代艺术的品质足以让藏家放心,但他们还是会通过印刷来提升作品的价值。而经典作品却会因为再现而削弱其神圣性,《蒙娜丽莎》就是一个例子。

  “这是非常不可思议的,它小而黑。”一位第二次看到《蒙娜丽莎》真迹的33岁工程师说。

  相比之下,在佳士得预展上看《救世主》反倒有一种准宗教的体验,这幅被认为是达芬奇的作品,在一条广告公司拍摄的、名为《最后的达芬奇》的视频助力下,感动了千万人,也影响了《救世主》最终拍出4.55亿美元的纪录。

  约翰·伯格在《观看方式》认为,“可机械复制时代”的艺术品原作的价值是市场价格,而现在的复制手段也摧毁了艺术的权威性。

  回到卢浮宫,每年都有数以百万计的参观者无视《岩间圣母》径直走向《蒙娜丽莎》,卢浮宫所藏的《岩间圣母》被认为在1483年至1486年之间或之前完成,是有完整纪录的达芬奇作品,设想它出现在市场上,再破纪录数亿美元的纪录不在话下。所以专业人士,未必会去挤《蒙娜丽莎》的热闹,而会在无人关注的《岩间圣母》前做长时间的停留。

达芬奇,《岩间圣母》,卢浮宫藏

  作为全世界最著名的艺术品,《蒙娜丽莎》被她的名声所累,她的意义也并不单单是达芬奇的真迹,而是喧嚣社交媒体的“炫耀”。

  或许这就是当代的“观看之道”。

二、6个近期爆火的AI图像生成工具

1.即时灵感:这是一款国内的在线AI绘画工具,用户只需输入中文描述,就能迅速生成图片。它提供了20种不同的风格模型,推荐新手从“万能通用模型”开始尝试,逐步探索其他风格,也可以自定义模型。生成速度非常快,通常在15-20秒内就能生成4张图片。用户可以选择图片进行精细化编辑,并且可以轻松导出不同尺寸的图片,非常适合用于头像、壁纸、配图以及社交媒体内容制作。

2.Artbreeder:这是一个利用遗传算法和深度学习技术在线生成艺术作品的工具。它支持多种艺术风格和主题,包括肖像、动物、场景和抽象艺术等,为用户提供了广阔的创作天地。

3.StarryAI:基于深度学习和生成对抗网络(GAN)技术,StarryAI能够生成独特的艺术作品,包括绘画、插图和动画等。用户可以上传图片或手绘草图作为创作的起点,并与AI互动调整创作结果。此外,它还提供了预设的艺术风格和工具,帮助简化创作流程。

4.DeepArt.io:作为一个基于人工智能的在线艺术生成工具,DeepArt.io能够将照片或图像转换成艺术作品,支持的艺术风格包括印象派、文艺复兴和现代主义等。

5.DALL-E:由OpenAI开发的DALL-E是一款能够生成富有想象力图像的工具,它利用GPT-3模型创造出各种奇特、荒谬甚至令人惊叹的图像,体现了人工智能技术的巨大潜力。

6.RunwayML:RunwayML是一款功能强大的AI图像生成工具,它支持训练和部署深度学习模型,提供图像合成和风格转换技术,包括肖像生成、场景生成和艺术风格转换等功能,以满足更专业和复杂的设计需求。

数字文艺复兴:英伟达造出“AI版”米开朗基罗,实现高保真3D重建

原创2023-06-20 15:15·机器之心Pro机器之心报道

编辑:PandaW

正如米开朗基罗能用大理石雕刻出令人惊叹、栩栩如生的作品,英伟达宣称Neuralangelo生成的3D结构也带有精细的细节和纹理。

对通过基于图像的神经渲染来恢复密集的3D表面,神经表面重建已被证明是可行的。然而,目前的方法很难恢复真实世界场景的详细结构。

为了解决这个问题,英伟达和约翰霍普金斯大学发布了一项研究,开发了一种命名为Neuralangelo(即神经朗基罗)的模型,其可以将2D视频片段重建成细节丰富的3D结构,比如生成建筑、雕塑和其它现实物体的逼真虚拟复制品。

项目网站:
https://research.nvidia.com/labs/dir/neuralangelo/

论文地址:
https://research.nvidia.com/labs/dir/neuralangelo/paper.pdf

附加材料:
https://research.nvidia.com/labs/dir/neuralangelo/supplementary.pdf

这项研究已入选CVPR2023。英伟达在其官方博客上使用了「数字文艺复兴」来形容这项研究,足见其潜在的重要价值。

正如米开朗基罗能用大理石雕刻出令人惊叹、栩栩如生的作品,英伟达宣称Neuralangelo生成的3D结构也带有精细的细节和纹理。创意专业人士可以将这些3D对象导入到设计应用中,进一步编辑它们来创造艺术作品、开发视频游戏、创造机器人和产业数字人应用。

Neuralangelo能将复杂的材料纹理(比如屋顶瓦、玻璃板和光滑大理石)从2D视频转译到成3D结构,其能力已经显著超越之前的方法。其具有非常高的保真度,让开发者和创意专业人士能更轻松地快速创建可用的虚拟对象,而所需的材料不过是用手机拍摄的一段视频。

该研究的作者之一同时也是一位高级研究主管的Ming-YuLiu表示:「Neuralangelo具备的3D重建能力将能极大地造福创作者,帮助他们在数字世界中创建出现实世界。这一工具最终能让开发者将细节丰富的对象——不管是小型雕像还是大型建筑——导入到虚拟环境中,进而用于视频游戏或产业数字孪生人。」

英伟达给出了一段演示视频,可以看到该模型既能重建出米开朗基罗那著名的大卫雕像,也能重建出日常可见的平板卡车。Neuralangelo还能重建出建筑的内部和外部——视频中给出了英伟达的湾区公园的详细3D模型。

下面我们来看看Neuralangelo的具体方法和论文中的一些实验结果。

方法

Neuralangelo采用了实时NGP作为底层3D场景的一种神经SDF表征,并通过神经表面渲染根据多视角图像观察进行优化;其中NGP是指NeuralGraphicsPrimitives(神经图形基元);SDF是指signeddistancefunction(有符号的距离函数)。为了充分释放多分辨率哈希编码的潜力,英伟达研究者提出了两大发现。一,使用数值梯度来计算高阶导数对实现优化稳定来说至关重要,比如用于程函正则化(eikonalregularization)的表面法线。二,为了重建出不同细节程度的结构,需要一种渐进式的优化方案。研究者将这两种思路组合到了Neuralangelo中,实验也证明了这样做确实可行,能极大提升神经表面重建的重建准确度和视图合成质量。

Neuralangelo重建场景的密集结构使用的是多视角图像。它会跟随相机视角方向采样3D位置,并使用一种多分辨率哈希编码来对这些位置进行编码。编码后的特征会被输入一个SDFMLP和一个颜色MLP,以使用基于SDF的体积渲染来合成图像。

数值梯度计算

研究者表示,有关哈希编码位置的解析梯度会受到局部性的影响。因此,优化更新只会传递给局部哈希网格,缺乏非局部的平滑性。针对这种局部性问题,英伟达提出了一种简单的补救方案:使用数值梯度。图2给出了该方法的概况。

图2:为高阶导数使用数值梯度可将反向传播更新散播到局部哈希网格单元之外,由此变成解析梯度的一种平滑化版本。

SDF有一种特殊性质:其在单位范数的梯度方面是可微的。SDF的梯度几乎在所有地方都满足程函方程(eikonalequation)。为了迫使经过优化的神经表征成为可行的SDF,通过会在SDF预测结果上施加一个程函损失。

为了实现端到端优化,需要在SDF预测结果上使用一种双重反向操作。

在计算SDF的表面法线时,人们事实上采用的方法就是使用解析梯度。但是,在三线性插值(trilinearinterpolation)下,与位置相关的哈希编码的解析梯度在空间上不是连续的。为了找到体素网格中的采样位置,需要首先根据网格分辨率对每个3D点进行缩放。

哈希编码的导数是局部的,即当3D点越过网格单元边界时,对应的哈希项将会不同。因此,前述的程函损失就只会反向传播到本地采样的哈希项。当连续表面(比如平墙)横跨多个网格单元时,这些网格单元应当产生连贯一致的表面法线,而不该有突然的过渡。为了确保表面表征中的一致性,需要对这些网格单元进行联合优化。但是,解析梯度却受限于局部网格单元,除非对应的网格单元碰巧能被同时采样和优化。但我们很难保证总是能够这样采样。

为了克服哈希编码的解析梯度的局部性问题,英伟达提出的方案是使用数值梯度来计算表面法线。如果数值梯度的步长小于哈希编码的网格大小,则数值梯度就等于解析梯度;否则,多个网格单元的哈希项就会参与到表面法线计算中。

这样一来,通过表面法线的反向传播就能让多个网格单元的哈希项同时收到优化更新。直观来说,使用精心选择的步长的数值梯度可被解读成在解析梯度表达式上的平滑化操作。还有另一种方法可以替代法线监督,即teacher-studentcurriculum,其中要使用预测的有噪声法线来帮助MLP输出,这样就能利用到MLP的平滑性。但是,这样的教师-学生损失的解析梯度仍然只会反向传播给局部网格单元。相较而言,数值梯度无需添加网络便能够解决局部性问题。

要使用数值梯度计算表面法线,还需要额外的SDF样本。给定一个采样过的点,还需要在该点周围一定步长内沿正则坐标的每个轴额外采样两个点。

渐进式的细节水平

为了避免陷入错误的局部最小值,从粗到细的优化可以更好地塑造损失图景。这样的策略已被用于许多计算机视觉应用。Neuralangelo也采用了一种从粗到细的优化方案来在细节上渐进式地重建表面。使用高阶导数的数值梯度能自然地让Neuralangelo执行从粗到细的优化,这需要考虑两个方面。

步长:前面已经提到,数值梯度可被解释成一种平滑化操作,其中步长控制着分辨率及重建的细节量。如果让程函损失用更大的步长来计算数值表面法线,能在更大规模上确保表面法线的一致性,由此能得到一致和连续的表面。反过来,如果程函损失的步长更小,就只能影响更小的区域,就能避免细节平滑。在实践中,英伟达的做法是先将步长初始化为最粗的哈希网格大小,然后在整个优化过程中指数级地降低步长以匹配不同的哈希网格大小。

哈希网格分辨率:如果从优化一开始,所有哈希网格都被激活,为了捕获几何细节,细粒度哈希网格就必须首先「忘记」粗粒度优化(更大步长)所学到的东西,并用更小的步长「重新学习」。如果优化收敛而导致这个过程失败,那么就会丢失几何细节。因此,一开始只会激活一组初始的粗粒度哈希网格,当步长缩小至其空间大小时,会在优化过程中渐进式地激活更细的哈希网格。这样一来,就能避免「重新学习」过程,从而更好地捕获细节。在实践中,英伟达研究者的做法是在所有参数上应用权重衰减,以避免最终结果被单一分辨率特征主导。

优化

为了进一步促进重建表面的平滑性,他们还提出添加一个先验,具体做法是正则化SDF的平均曲率。平均曲率是通过离散拉普拉斯算子计算的,类似于表面法线计算,否则当使用三线性插值时,哈希编码的二阶解析梯度在任意位置都为零。

Neuralangelo的整体损失定义为所有损失(RGB合成损失、程函损失、曲率损失)的加权和,如下所示:

包括MLP和哈希编码在内的所有网络参数都是以端到端方式联合训练的。

实验

图3:在DTU基准上的定性比较

可以看到,Neuralangelo得到的表面更加准确,保真度也更高。

图4:定性比较不同的从粗到细优化方案

当使用解析梯度时(AG和AG+P),粗粒度的表面通常带有伪影。当使用数值梯度时(NG),可以得到更好的粗粒度形状,细节也更为平滑。英伟达的新方法(NG+P)得到的表面既平滑又有精细细节。

表1:在DTU数据集上的定量实验结果

可以看到,Neuralangelo的重建准确度最高,图像合成质量也最好。

图5:在Tanks和Temples数据集上的定性比较

相比于其它对比方法会丢失表面细节或有较多噪声,Neuralangelo能更好地捕获场景细节。



【WINDRISES NEWMEDIA PROMOTION】尊享直接对接老板

电话+V:159999-78052

专注于新媒体运营推广配套流程服务方案。为企业及个人客户提供高性价比的运营方案,解决小微企业和个人创业难题

图像 从文艺复兴到社交媒体pdf
发布人:dongqiang19950814 发布时间:2024-10-30