当前位置: 代码迷 >> java >> JBLAS的表现
  详细解决方案

JBLAS的表现

热度:83   发布时间:2023-07-26 14:28:09.0

我想执行重矩阵乘法

由于我的应用程序需要高性能,因此我决定使用JBLAS。

但是,我发现JBLAS在测试中比简单的for循环慢。

    double[][] M = new double[3000][3100];
    double[] a = new double [3100];
    double[] b = new double[3000];
    for(double[] row: M){
        Arrays.fill(row, 3.343);
    }
    Arrays.fill(a, 1.324);
    DoubleMatrix M1 = new DoubleMatrix(M);
    DoubleMatrix a1 = new DoubleMatrix(a);
    DoubleMatrix b1= new DoubleMatrix(b);

    //1. Simple for loop : 366 ms
    for(int i=0; i<3000; i++){
        for(int j=0; j<3100; j++){
            b[i] = b[i] + a[j]*M[i][j];
        }
    }
    // 2. JBLAS : 1190 ms
    b1 = M1.mmul(a1);

尽管它们是相同的计算,但JBLAS的速度比简单的for循环慢3倍。

是因为我的错误吗? 还是其他原因?

谢谢!

我自己找到了解决方案,并分享!

原因是本机代码涉及复制数据,因此矩阵向量乘法之类的操作无法从本机代码中受益。

因此,如果mmul函数识别出矩阵*向量乘法,则它将使用Java代码。

您可以在这里获得更多信息

  相关解决方案