Nature:AlphaZero加强版AlphaTensor问世,发现史上最快矩阵乘法算法,在医学上能做什么?
时间:2022-10-13 16:03:09 热度:37.1℃ 作者:网络
AlphaZero,DeepMind开发的人工智能。2016年末2017年初,该程序在中国棋类网站上以“大师”(Master)为注册账号与中日韩数十位围棋高手进行快棋对决,连续60局无一败绩;2017年10月18日,DeepMind团队公布了最强版AlphaGo ,代号AlphaGo Zero。它的独门秘籍是“自学成才”。而且,是从一张白纸开始,零基础学习,在短短3天内,成为顶级高手。经过短短3天的自我训练,AlphaGo Zero就强势打败了此前战胜李世石的旧版AlphaGo,战绩是100:0的。
区别于AlphaGo,AlphaZero不仅能下围棋,还能下将棋和国际象棋。AlphaZero最长花了13天学习,随后与世界冠军级的棋类AI对决:在国际象棋中,AlphaZero在4个小时后首次击败了第九季TCEC世界冠军Stockfish。在日本将棋中,AlphaZero在2小时后击败了将棋联盟赛世界冠军Elmo。在围棋上,AlphaZero经过30个小时的鏖战,击败了李世石版AlphaGo。2018年12月,AlphaGo Zero登上《自然》杂志封面,完整论文首次公开。大大促进了全球人工智能产业的飞速发展。梅斯小编接下来详细聊聊AlphaZero的未来。
一、除了棋类,AlphaZero在医学上能做什么?
现在的问题是,机器学习能否帮助人类发现所关心问题的真相?比如像癌症和意识、免疫系统之谜、基因组之谜等科学和医学尚未解决的重大问题。
早期迹象令人鼓舞。2020年8月份,《自然医学》上的两篇文章探讨了机器学习如何应用于医学诊断。在一项研究中,DeepMind研究人员与伦敦莫尔菲尔德眼科医院(Moorfields Eye Hospital)的临床医生合作,开发出一种深度学习算法,可以准确地对各种视网膜病变进行分类。
另一篇文章也涉及一种机器学习算法,其能够确定急诊室病人的CT扫描是否显现出中风、颅内出血或其他重要神经疾病的迹象。对于中风患者来说,每一分钟都很重要;治疗耽误的时间越长,结果就越糟。新算法的准确性堪比人类专家,而且比人类专家快150倍。一个更快的诊断有助于医生对最紧急病例进行快速分类,并由人类放射科医生进行复查。
如果用DeepMind在pubmed上检索一下,能发现有323篇文章,很多都是重量级文章,可以说深度学习算法已广泛应用于医学领域:
二、AlphaTensor:再刷Nature封面
矩阵乘法可是计算机科学中最基础的数学算法之一,也是各种AI计算方法的基石,如今计算机处理图像语音、压缩数据等全都离不开它。自从德国数学家沃尔克·施特拉森(Volker Strassen)在1969年提出“施特拉森算法”后,矩阵乘法的计算速度一直进步甚微。
现在,这只新出炉的AlphaTensor不仅改进了目前最优的4×4矩阵解法(50年前由施特拉森提出),还进一步提升了其他70余种不同大小矩阵的计算速度。
这是DeepMind最新研究成果AlphaTensor,一经发出就登上了Nature封面。
AlphaTensor为一个 50 年来的悬而未决的数学问题找到了新答案:找到两个矩阵相乘的最快方法。AlphaTensor 建立在 AlphaZero 之上,训练了一个神经网络来指导规划过程,以搜索有效的矩阵乘法算法。
矩阵乘法是代数中最简单的操作之一,通常在高中数学课上教授。但在课堂之外,这个不起眼的数学运算在当代数字世界有着巨大的影响力,在现代计算机中无处不在。
3*3矩阵相乘的计算
矩阵乘法被用于处理智能手机上的图像,识别语音命令,为计算机游戏生成图形,运行模拟以预测天气,压缩数据和视频以在互联网上共享等,应用极为广泛。
世界各地的公司花费了大量的时间和金钱来开发计算硬件,以有效地进行矩阵乘法。因此,即使是对矩阵乘法效率的微小改进也会产生广泛的影响。
几个世纪以来,数学家们认为,标准的矩阵乘法算法是人们在效率方面所能达到的最佳状态。
但在1969年,德国数学家Volken Strassen震惊了数学界,他表明确实存在更好的算法。
此前的矩阵乘法的标准算法与Strassen的算法相比,后者在乘2x2矩阵时少用了一个标量乘法(7次而不是8次)。就整体计算效率而言,乘法比加法重要得多。
通过研究非常小的矩阵(大小为2x2),他发现了一种巧妙的方法来组合矩阵的条目,从而产生一种更快的算法。尽管经过几十年的研究,这个问题的更大版本仍然没有得到解决--以至于人们不知道如何有效地将两个小到3x3的矩阵相乘。
在Nature的新论文中,我们探讨了现代人工智能技术如何推进新矩阵乘法算法的自动发现。AlphaTensor发现了在许多矩阵大小上比现有技术水平更有效的算法。我们的人工智能设计的算法优于人类设计的算法,这是在算法发现领域的一个重大进步。
三、AlphaTensor核心价值:AI推动算法发现的自动化
AlphaTensor随着时间的推移逐渐改进,重新发现了历史上的快速矩阵乘法算法,如Strassen的算法,最终超越了人类的直觉领域,发现的算法比以前已知的更快。
例如,如果学校里教的传统算法是用100次乘法对一个4x5乘以5x5的矩阵进行乘法,而这个数字在人类的聪明才智下被减少到80次,AlphaTensor已经找到了只用76次乘法就能完成同样操作的算法。
除此之外,AlphaTensor的算法自50年前发现以来,首次在有限域中改进了Strassen的两级算法。这些小矩阵的乘法算法可以作为基元来乘以任意大小的大得多的矩阵。
这些算法在相同的硬件上比常用的算法快10-20%,这展示了AlphaTensor在优化任意目标上的灵活性。
四、AlphaTensor在未来医学上可能应用
AlphaTensor有助于推进我们对矩阵乘法算法的丰富性的理解。了解这个空间可能会释放出新的结果,帮助确定矩阵乘法的渐进复杂性,这是计算机科学中最基本的开放问题之一。
因为矩阵乘法是许多计算任务的核心组成部分,涵盖了计算机图形、数字通信、神经网络训练和科学计算,AlphaTensor发现的算法可以使这些领域的计算效率大大提升。
AlphaZero是一个强大的算法,可以远远超出传统游戏的领域,帮助解决数学中的开放问题。
在我们的研究基础上,我们希望能够推动更多的工作--应用人工智能来帮助社会解决数学和整个科学领域的一些最重要的挑战。
MIT计算机科学家Virginia Williams就表示:研究者们可以再尝试一下,去搞明白这些特定算法中有没有什么特殊规律。此外,也可以研究一下如果将这些特殊算法组合起来,是否能发现更多更优的计算方法。
目前AlphaTensor的相关代码已经开源。
五、以Deepmind开发的为主的深度学习在医学中的应用
深度学习和机器学习(ML)已被广泛应用于解决各种复杂的挑战,如医疗、金融、环境、营销、安全和工业等各领域。ML方法的特点是能够检查许多数据并发掘其相关性,提供解释,并识别模式。ML可以帮助提高许多疾病的诊断系统的可靠性、性能、可预测性和准确性。
1、利用机器学习技术进行医学诊断
ML算法被用于计算机辅助诊断(CAD)应用中。这些算法从医学检测报告中收集的许多诊断样本中学习,并与专家的诊断一起支持医学专家预测和诊断未来的疾病。ML的使用有助于提高特定疾病诊断系统的可靠性、性能和准确性,例如ML模型在乳房X光片中自动分类聚集微钙化的适用; 支持向量机(SVM)通过研究头皮脑电图(EEG)信号来精确识别癫痫发作;一种称为co-Forest的联合训练方法,可用于CAD系统;一种名为复合协变量预测因子的监督ML方法对转移性肝细胞癌(HCC)患者进行分类;用于诊断心律失常的基于特征投影的监督算法;使用ML技术预测心力衰竭的模型等。
例如,在病人分层方面,临床表现、疾病进展和遗传易感性的异质性常常存在于诊断为同一神经退行性疾病的个体群体中。这种异质性使得从整体上研究诊断组来理解疾病机制变得困难,因为不同的个体可能有不同的机制导致疾病的发生,这也使得确定有效的治疗方法变得更具挑战性。因此,根据比诊断类更详细的标准对研究参与者进行分层正变得越来越普遍。患者群体的异质性也是临床试验设计的一个问题。结果变量的自然异质性是一种无益的噪声源,可以掩盖治疗干预的效果。
2、药物化学
有许多关于利用有机化学来发现药物的研究已经发表,一些有效的研究使用机器学习模型来帮助引入预测,例如研究人员利用香精油化学成分(EOs)的机器学习来解释所取得的实验结果;使用了六种机器学习方法和1823种化学品来研究生殖毒性,实验结果表明:SVM模型取得了最好的性能,此外还确定了合理边界,将准确预测和不准确预测分为两类;使用机器学习方法(分类和回归树以及深度神经网络分类)来寻找药用植物提取物的抗病毒特性等。
3、脑研究
大量研究利用ML技术进行大脑相关研究,例如将高维非线性模式分类方法应用于功能磁共振成像图像,以区分与谎言和真相相关的大脑活动的空间模式;一种结合常规和灌注磁共振的计算机辅助分类方法,用于鉴别诊断脑瘤类型和分级;利用SVM通过分析头皮EEG,通过构建特定于患者的分类器来检测癫痫发作;各种机器学习算法(如SVM、NN和随机森林(RF))在预测中重度创伤性脑损伤(TBI)预后方面的附加值;使用改进的CSP和转移学习算法来提高EEG信号分类的准确性,并加快训练时间等。
4、医学影像
医学图像的模式可以通过ML技术识别,允许放射科医生根据放射信息做出明智的决定,如基本放射照相术、计算机断层扫描(CT)、MRI、正电子发射断层扫描(PET)图像和放射学报告。例如研究人员提出了一种序列增强学习技术,用于在乳房X光片中使用SVM检测微钙化(MC)簇时提高性能等。ML和模式识别算法对大脑成像有重大影响,从长远来看,ML领域的技术发展和放射学可以互惠互利。深度学习(DL)是ML的一个分支,它处理的是受大脑的生物和功能启发的算法(即ANN)。DL已经迅速成为医学影像领域评估医学图像的首选方法,这使得相关研究的数量不断增加,覆盖神经病理学、腹部、肺部、心脏、视网膜、肌肉骨骼和乳房等。
5、可穿戴传感器
ML技术在可穿戴传感器中的应用十分广泛
相信,医学人工智能由此可以更上一个台阶!未来在人工智能基础上的外骨骼,假肢,图像识别,靶标识别,病人分层,结构生物学等都能广泛应用到这一技术。
参考资料:
Fawzi A, Balog M, Huang A, Hubert T, Romera-Paredes B, Barekatain M, Novikov A, R Ruiz FJ, Schrittwieser J, Swirszcz G, Silver D, Hassabis D, Kohli P.Discovering faster matrix multiplication algorithms with reinforcement learning.Nature . 2022 Oct;610(7930):47-53. doi: 10.1038/s41586-022-05172-4
https://www.nature.com/articles/s41586-022-05172-4
https://mp.weixin.qq.com/s/3Qcn5DXetd48ihlkj1uBtQ,新智元
Shehab M, Abualigah L, Shambour Q, et al. Machine learning in medical applications: A review of state-of-the-art methods[J]. Computers in Biology and Medicine, 2022, 145: 105458.