IBM受生物启发,创造了一个超越传统的人工智能
2020年01月22日 由 TGS 发表
888668
0
听说过FlyHash吗?这个算法的灵感来自于果蝇的嗅觉回路,它可以产生哈希码——物体的数字表示,其性能优于经典算法。但非常可惜的是,由于FlyHash使用随机投影,它无法从数据中学习。
为了克服这一限制,普林斯顿大学、圣地亚哥大学、IBM Research和MIT-IBM Watson AI实验室的研究人员开发了BioHash,它应用“局部”和“生物学上合理的”突触可塑性规则,来生成哈希码。研究人员表示,它比之前发布的各种哈希方法基准测试都要好,而且它还可以生成对相似度搜索有用的二进制表示。
这种被称为扩展表征的现象在神经生物学中几乎无处不在。 “扩展”是指将高维输入数据映射到更高维的二次表示。例如,在上述果蝇嗅觉系统中,大约50个神经元会将它们的活动发送到约2500个细胞——凯尼恩细胞,从而实现约50倍的扩增。
从计算的角度来看,扩展可以增加AI模型的内存存储容量。正是基于这种动机,该团队设计了散列算法BioHash,可用于相似度搜索。在相似度搜索中,给定一个查询、一个相似度度量和一个包含任意数量项的数据库,就可以从数据库中检索与查询最相似的项的排序列表。FlyHash利用了LHS,BioHash也是如此。
但不同的是,BioHash速度更快,可扩展性也更强。
研究人员在MNIST和CIFAR-10上对Biohash进行了培训,以及测试。MNIST是一组包含7万张灰度图像的手写数字,其中10类数字从“0”到“9”不等,CIFAR-10是一个包含6万张来自10类数字的数据集。BioHash在速度方面表现出了最好的检索性能,远远超过了其他方法,而BioHash的改进版本——BioConvHash——由于加入了专门构建的过滤器,性能得到了进一步的提升。
团队断言:扩展表示之所以在生物中普遍存在,是因为它们把相似的刺激聚在一起,把不同的刺激分开。
事实已经证明,神经生物学和机器学习领域是密切相关的。