把文本变成画作，AI对艺术“下手”了-蓝影头条

把文本变成画作，AI对艺术“下手”了

[百科] 时间：2024-04-25 09:48:51 来源：蓝影头条作者：时尚点击：79次

中评社北京2月1日电／据科技日报报道，下手自然语言处理与视觉处理，把文本变都重在对不同模态数据所包含的成画语义信息进行识别和理解，但是艺术两种数据的语义表现形式和处理方法不同，导致存在所谓的下手“语义壁垒”，现在这种壁垒正在被AI打破。把文本变　　1月初，成画美国人工智能公司OpenAI推出两个跨越文本与图像次元的艺术模型：DALL·E和CLIP，前者可以基于文本生成图像，下手后者则可以基于文本对图片进行分类。把文本变这个突破说明通过文字语言来操纵视觉概念现在已经触手可及。成画自然语言处理和视觉处理的艺术边界已经被打破，多模态AI系统正在逐步建立。下手　　“数据的把文本变来源或者形式是多种多样的，每一种都可以称为一种模态。成画例如图像、视频、声音、文字、红外、深度等都是不同模态的数据。单模态AI系统只能处理单个模态的数据。例如对于人脸识别系统或者语音识别系统来说，它们各自只能处理图像和声音数据。”中国科学院自动化研究所副研究员黄岩在接受科技日报记者采访时表示。　　相对而言，多模态AI系统可以同时处理不止一种模态的数据，而且能够结合多种模态数据进行综合分析。“例如服务机器人系统或者无人驾驶系统就是典型的多模态系统，它们在导航的过程中会实时采集视频、深度、红外等多种模态的数据，进行综合分析后选择合适的行驶路线。”黄岩说。　　不同层次任务强行关联会产生“壁垒”　　就像人类有视觉、嗅觉、听觉一样，AI也有自己的“眼鼻嘴”，而为了研究的针对性和深入，科学家们通常会将其分为计算机视觉、自然语言处理、语音识别等研究领域，分门别类地解决不同的实际问题。　　自然语言处理与视觉处理分别是怎样的过程，二者之间为什么会有壁垒？　　语义是指文字、图像或符号之间的构成关系及意义。“自然语言处理与视觉处理，都重在对不同模态数据所包含的语义信息进行识别和理解，但是两种数据的语义表现形式和处理方法不同，导致存在所谓的‘语义壁垒’。”黄岩说。

(责任编辑：时尚)

紫百合有力雙殺女神马来西亚军方：两架直升机相撞后坠毁导致10人死亡