当个课代表,就是之前算法的矩阵加速运算 它不是通过变成一个又臭又长的式子,减少了一次乘法,使得速度提升嘛
那 如果我们有别的同类的式子,我们是不是可以对矩阵运算进一步加速
这个式子实际上类似加法器的那样,可以表示为输入的加法乘固定参数 再进行相乘 再相加
通过强化学习 找到比较少的乘法次数,就可以实现加速矩阵了
话说想了想,Google的TPU,是不是就是利用矩阵加速算法来加速机器学习训练
你说的“之前的算法”是指Strassen算法?这个确实意义不大。但是其实x86是有加速矩阵乘法相关的指令的(SSE),并且一直在用,原理并不是Strassen算法,而是想方设法并行计算。SSE具体的指令和计算硬件我没用过,不太了解,但是RISC-V的我知道一些。
并行地计算,除了SIMD,也可以向量化。RISC-V的向量指令集就是用的向量化,然后交给流水线进行计算。这种大量数据、相同操作序列,非常适合流水线。之前读文档做了一点笔记(其实是体系结构的课程作业)。
编辑[2022.11.13]:上面的SSE可能得改成AVX