BOYU SPORTS

谷歌要将人类的多重感官赋予人工智能系统【博鱼·体育】

更新时间 2025-01-26 18:28 阅读

本文摘要：在人工智能的世界中，还有很多不足之处尚待解决问题。

在人工智能的世界中，还有很多不足之处尚待解决问题。大多数AI解决方案并无法处置多种类型的输出。

具体来说，大多数人工智能工具不能专心一个方向，比如声音、视觉或文字。目前，还少有人去尝试将三方面融合一起去建构一套AI解决方案，为什么？因为以目前的技术水平，我们离创立一套原始AI系统还差很近。但现在，有人再一开始尝试，谷歌和麻省理工学院一个新项目正在向一个多功能原始AI方案迈进第一步。更加具体地说，双方将合作开发出能同时处置声音、文本和图像的AI解决方案。

可以想象，一旦研究项目有所突破，将彰显人工智能以类似于人类的多重感官，这将是一个极具野心的研究项目。对于我们人类来说，在任何等价的时间，我们完全都不有可能只用于一种感官。另一方面，而人工智能却几乎不具备这种能力。

将所见所闻相匹配是人类的第二天赋，但对机器来说，需要构建一种“感官”早已十分无以了。所以，意味着是在感官方面，让AI不具备人类的某些功能只不过早已是一项看起来不有可能已完成的任务，更加不用说道机器的智能水平了。

不论以何种方式，创立一个需要像人类一样自学和适应环境的算法并不更容易。麻省理工学院和谷歌公布的全新研究报告则为这一尝试说明了道路，让人们看见了彰显AI系统多重“感官”的可能性。新的论文阐述了如何AI如何调节自己听见和看见的东西，并将其实时，这十分类似于人脑的运作方式。

图丨麻省理工学院博士后研究员YusufAytar论文的牵头作者、麻省理工学院博士后YusufAytar回应：“不管你是听到了了引擎声，还是看见了汽车，这都无所谓，因为你立刻能辨识出有这是同一概念。这些信息早已在你的大脑中被统一一起。”这里的关键词就是协商与统一。研究人员并没教会算法新的东西，而是建构了一种方式让算法将一种感官与另一种感官相连统一一起。

Aytar荐了一个例子来解释：当一辆自动驾驶汽车听到救护车的声音时，就能将其与救护车的样子联系在一起，即便因为视线阻碍没看到救护车，也能提早作出拐弯。为了训练这套AI系统，麻省理工学院的研究人员首先向神经网络展出了一些具有音频的视频文件，当神经网络接管到这些视频和音频后，就不会开始尝试预测物体与声音之间的联系。

然后，研究人员开始同一算法中输出具有文字说明的图像，让神经网络将图片中的物体与其文字说明联系一起。以此类推，这样就已完成了视频、声音、图像、文字间的互相切换与辨识。图丨将声音、图像、文字输出同一神经网络培训这个系统将必须大量的工作，尽管早已证明了几个测试早已非常顺利。

现在，算法只是获取“非常简单”的信息，但没理由指出它无法处置更加简单的事情。用于这种开创性的技术将在未来几年为人类发展世界带给新的生命。

尽管早已展开过的测试都十分顺利，但训练这个系统还有很多额工作要做到。目前，研究人员只为算法获取了比较非常简单的信息，以后的训练数据将不会更加简单。

为AI系统彰显多重感官，这种开创性的研究方向不致将在未来几年内为人工智能领域的研究带给新的突破。(生物谷Bioon.。

本文关键词：BOYU SPORTS,博鱼·体育,博鱼·体育(中国)官方入口

本文来源：BOYU SPORTS-www.9street.net