近年不少科技公司都聚焦于人工智能技术的开发,最近微软(Microsoft)就公开了他们一项最新的技术成果。人工智能系统单纯透过文字描述就能够创作图像,该技术在文字描述中寻找关键字词,然后再用来创作高清的图像,据悉这个关注重点的技巧让图像的画质较之前提升 3 倍。
负责研发的 Microsoft 深度学习技术首席研究员 Xiaodong He 表示,图像是人工智能由零开始,逐像素逐像素创作。他以一幅人工智能创作的黄色雀鸟图像做解说,表示人工智能分析文字后,再透过一项名为 Generative Adversarial Network(GAN,生成对抗性网络)的技术将文字转化成图像,人工智能创作的黄色雀鸟并不一定在现实世界存在,只是电脑的一种想像。
GAN 技术由两组机器学习模型组成,一组负责以文字制作图像,另一组则以文字去判断制作出图像的真确性,两者结合去制作完美的图像。研究员指人工智能系统能够创作出任何类型的形象,例如飘浮的双层巴士、放牧中的牲畜等,而且在文字中欠缺的一些细节,系统会在影像中自行补完。
- Microsoft’s AI Bot Can Draw Any Picture From Text Descriptions
(本文由 Unwire HK 授权转载;首图来源:微软)