潘云鹤:“视觉知识”推动AI 2.0突破

  • 时间:
  • 浏览:1

调查大疑问加载中,请稍候。

若长时间无响应,请刷新本页面

  记者 韩扬眉

  人类对世界的认知中,3000%的信息来自视觉,亲戚亲戚让让你们 希望人工智能未来要能像人一样敏锐地观测、认知和预测世界。在中国工程院院士潘云鹤看来,实现视觉知识表达、推理、学习和应用的技术将是人工智能(AI)2.0取得突破的重要方向之一。

  近日,潘云鹤首次系统地提出“视觉知识”概念,在接受《中国科学报》专访时对其进行了具体阐述和解释。

  《中国科学报》:您提出视觉知识一种生活生活概念的背景是哪些?

  潘云鹤:视觉除理技术对AI发展有重要影响。

  首先,近年来,图像识别水平的快速提升推动了AI热潮的形成。图像识别技术的突破不仅提高了计算机对人脸、文字、指纹及生物特性、医学图片等识别的准确率,而且进一步推动了智能制造等领域的发展。中国科学技术发展战略研究院按技术分类对2018年中美AI企业数量进行了统计,都要能看出,提供和应用图像识别技术的企业占一半以上。

  其次,传统的知识表达方法有显著不够。早期图像识别和计算机视觉建立在图像除理技术之上;深度神经网络的使用以数据驱动的方法来学习特性表达,有效提高了图像分类和识别的准确率。

  不过,作为AI知识表达的一种生活生活方法,深度神经网络难以解释、不可推理,以及因需小量标识的数据训练网络参数而难以除理地会引入数据偏见等不够。而且,亲戚亲戚让让你们 儿都要能研究一种生活生活全新的知识表达——视觉知识。

  这启示亲戚亲戚让让你们 儿,数字视觉领域是推动AI发展的重要领域;更好的知识表达是推动数字视觉发展的关键技术;克服深度神经网络不够是“视觉知识”研究的关键方向。

  《中国科学报》:哪些是视觉知识?它哪些特性?

  潘云鹤:视觉知识是知识表达的一种生活生活新形式,它能表达世界的時光特性与变化特性。计算机图形学经过长期发展,提供了视觉知识表达与操作的技术基础。而且,对视觉知识进行表达及其推理等操作,还需在此基础加带以改造与重构。

  视觉知识与迄今为止人工智能所用知识表达方法不同。视觉概念具有典型与范畴特性、层次特性与动作特性等次责。视觉概念能构成视觉命题,包括场景特性与动态特性。视觉命题能构成视觉叙事。重构计算机图形学成果可实现视觉知识表达及其推理与操作,重构计算机视觉成果可实现视觉知识学习。

  实现视觉知识表达、推理、学习、使用的理论和技术将是AI 2.0取得突破的重要方向之一。

  视觉知识机会难以用语言符号表达,曾被统归为常识,而以往AI研究的一大弱点便是视觉知识研究不够。而且,视觉知识的研究与运用机会是AI 2.0的两个重要发展方向。

  《中国科学报》:怎么才能 才能 构建视觉知识体系?

  潘云鹤:视觉知识体系构建与利用都要能除理的首要大疑问是视觉知识学习,这也是两个知识学习的无人区。建立两个系统的知识体系,往往更都要能自顶向下的设计,在一种生活生活过程中,诸如3D特性重建等计算机视觉研究成果为系统的视觉知识学习提供了发展土壤。

  不过,视觉知识学习要将目标从视觉特性重建进一步深入到视觉知识重建,还都要能对现有计算机视觉技术作进一步研究,比如,重建3D特性的层次特性,定位其在概念范畴中的位置等。

  除了视觉概念,都要能研究视觉命题与视觉叙事的表达和学习。

  《中国科学报》:视觉知识哪些应用?

  潘云鹤:从当前AI热潮中视觉识别技术的广泛渗透,可推知视觉知识的应用极广。这里我举例说明视觉知识的各种应用。

  基于知识的识别方法,如用于图像识别。同类“猫”,根据“猫”的视觉概念的典型与范畴等,使用综合推理方法自动生成猫的范畴内外各种图像大数据,并根据范畴内外自动标识为正、负范例。而且,用上述范例大数据训练多层神经网络,最后,用训练过的多层神经网络识别图像。

  事实上,视觉知识有着独特的优点,要能提供综合生成能力、時光比较能力和形象显示能力,而哪些正是字符知识所不够的重要能力。它们能在创造、预测和人机融合等方面为AI新发展提供基础动力。

  《中国科学报》:关于视觉知识,未来,亲戚亲戚让让你们 儿都要能关注的重点还哪些?

  潘云鹤:建设视觉知识词典将是十分重要的,这是两个巨大而实用的知识平台和数据平台,应当联合全球人工智能、计算机图形学和计算机视觉科技工作者同時 建设。为了顺利而高效地完成视觉知识词典的建设,群智组织模式不可或缺。

[ 责编:宋雅娟 ]

阅读剩余全文(