设为主页 | 加入收藏 | 繁體中文

这可能是第一台拥有想像力的计算机

   让我们想象一下如许的场景,一片一望无际的麦田中种着一棵橡树,以及万里无云的天空所营建出的一个阳光明媚的午后。当大少数人读到这句话时,可以很容易就在他们的脑海里想象出如许的故乡景象。这种人类所独有的能力可以让你在读到一个场景的描述后,想象出如许的场景。不过,这一宝贵的技能可能不再是我们人类所独有的了。

  这类在你看来可能想象力远远超越了当今计算机能力的事情,将由来自日本东京大学的Hiroharu Kato 和 Tatsuya Harada 所带来。
  最近,他们颁布了一台计算机,它能将一个对物体的描述转换成图像。这便是对想象力所作出的一个完善定义。
  可以一定的是,这些计算机的想象力还比力简单,乃至偶然非常混乱且没有任何意义。但不可否认的是,这台计算机代表着计算机的创造力明显地向前迈进了一大步。
  计算机科学家长期以来都是利用文字管理来处置惩罚图像,这一方法非常直接,比方:用户在搜索引擎中输出一个单词或一系列单词,并利用要害词得到高度相关的图像。这并不是由于计算机拥有特殊的能力来明白用户输出的要害词。究竟上,通过要害词来得到结果的技能已经非常壮大,但与此相反,在处置惩罚图像时就无法发挥出等效的能力。
  因此,几年前计算机科学家末尾将图像当作一系列像素来对待,图像会被分成一系列的短序列,每个序列对应于图像的一个特定部分。比方,一个短序列可能对应于一个杯子的边缘、皮肤的某个区域或天空的某部分。
  这些短序列对人类可能没有什么意义,但对计算机而言就能将它们视为要害词。因此,一台电脑分析一张图片就能通过计算序列的数量以及呈现的频率,就像是通过计算文档中词语的呈现频率一样。计算机科学家称这些序列为“视觉要害词”。
  Kato 和 Harada 的方法则是反其道而行,想要鉴于视觉要害词的分配,而得到原始图像。这是一个非常困难的技能问题,固然视觉要害词可以描述图像的一部分,它并不能解释在图像中的什么位置。
  Kato 和 Harada 用两种差别的方法来处置惩罚这一问题。
  首先是评价每个视觉要害词如何和其他视觉要害词组合在一起。这一过程并非非常简单,由于视觉要害词没有任何明显的外形,因此并不能像拼图一样适合被组合在一起。
  第二种方法是评价给定的视觉要害词应该呈现在图象特定部分的可能性。比方,表示天空区域的视觉要害词更可能呈现在图像的顶部。
  有了以上两种方法的铺垫,最后 Kato 和 Harada 会利用自己的方法让计算机能够明白人类平凡的日常句子,并天生相应的图像。他们会把语句中的每一个单词转换成视觉要害词,然后再将要害词转换成图像。而把平凡的单词转换成视觉要害词同样又是另一个顺手的任务。
  整个项目困难重重,但这是一个满盈希望的末尾,并希望能够开辟一条通往新世代的图像创立体系之路。
 

    文章作者: 福州军威计算机技术有限公司
    军威网络是福州最专业的电脑维修公司,专业承接福州电脑维修、上门维修、IT外包、企业电脑包年维护、局域网网络布线、网吧承包等相关维修服务。
    版权声明:原创作品,允许转载,转载时请务必以超链接形式标明文章原始出处 、作者信息和声明。否则将追究法律责任。

TAG:
评论加载中...
内容:
评论者: 验证码: