de/d2d/dlamsh_8f_source.html

      SUBROUTINE dlamsh ( S, LDS, NBULGE, JBLK, H, LDH, N, ULP )

*

*  -- ScaLAPACK auxiliary routine (version 1.7) --

*     University of Tennessee, Knoxville, Oak Ridge National Laboratory,

*     and University of California, Berkeley.

*     May 1, 1997

*

*     .. Scalar Arguments ..

      INTEGER            LDS, NBULGE, JBLK, LDH, N

      DOUBLE PRECISION   ULP

*     ..

*     .. Array Arguments ..

      DOUBLE PRECISION   S(LDS,*), H(LDH,*)

*     ..

*

*  Purpose

*  =======

*

*  DLAMSH sends multiple shifts through a small (single node) matrix to

*     see how consecutive small subdiagonal elements are modified by

*     subsequent shifts in an effort to maximize the number of bulges

*     that can be sent through.

*  DLAMSH should only be called when there are multiple shifts/bulges

*     (NBULGE > 1) and the first shift is starting in the middle of an

*     unreduced Hessenberg matrix because of two or more consecutive small

*     subdiagonal elements.

*

*  Arguments

*  =========

*

*  S       (local input/output) DOUBLE PRECISION array, (LDS,*)

*          On entry, the matrix of shifts.  Only the 2x2 diagonal of S is

*             referenced.  It is assumed that S has JBLK double shifts

*             (size 2).

*          On exit, the data is rearranged in the best order for

*             applying.

*

*  LDS     (local input) INTEGER

*          On entry, the leading dimension of S.  Unchanged on exit.

*              1 < NBULGE <= JBLK <= LDS/2

*

*  NBULGE  (local input/output) INTEGER

*          On entry, the number of bulges to send through H ( >1 ).

*              NBULGE should be less than the maximum determined (JBLK).

*              1 < NBULGE <= JBLK <= LDS/2

*          On exit, the maximum number of bulges that can be sent

*              through.

*

*  JBLK    (local input) INTEGER

*          On entry, the number of shifts determined for S.

*          Unchanged on exit.

*

*  H       (local input/output) DOUBLE PRECISION array (LDH,N)

*          On entry, the local matrix to apply the shifts on.

*              H should be aligned so that the starting row is 2.

*          On exit, the data is destroyed.

*

*  LDS     (local input) INTEGER

*          On entry, the leading dimension of S.  Unchanged on exit.

*

*  N       (local input) INTEGER

*          On entry, the size of H.  If all the bulges are expected to

*              go through, N should be at least 4*NBULGE+2.

*              Otherwise, NBULGE may be reduced by this routine.

*

*  ULP     (local input) DOUBLE PRECISION

*          On entry, machine precision

*          Unchanged on exit.

*

*  Implemented by:  G. Henry, May 1, 1997

*

*  =====================================================================

*

*     .. Parameters ..

      DOUBLE PRECISION ZERO, TEN

      parameter( zero = 0.0d+0, ten = 10.0d+0 )

*     ..

*     .. Local Scalars ..

      INTEGER          K, IBULGE, M, NR, J, IVAL, I

      DOUBLE PRECISION H44, H33, H43H34, H11, H22, H21, H12, H44S,

     $                 H33S, V1, V2, V3, H00, H10, TST1, T1, T2, T3,

     $                 SUM, S1, DVAL

*     ..

*     .. Local Arrays ..

      DOUBLE PRECISION V(3)

*     ..

*     .. External Subroutines ..

      EXTERNAL         dlarfg, dcopy

*     ..

*     .. Intrinsic Functions ..

      INTRINSIC        max, abs

*     ..

*     .. Executable Statements ..

*

      m = 2

      DO 10 ibulge = 1, nbulge

         h44 = s(2*jblk-2*ibulge+2, 2*jblk-2*ibulge+2)

         h33 = s(2*jblk-2*ibulge+1,2*jblk-2*ibulge+1)

         h43h34 = s(2*jblk-2*ibulge+1,2*jblk-2*ibulge+2)*

     $            s(2*jblk-2*ibulge+2, 2*jblk-2*ibulge+1)

         h11 = h( m, m )

         h22 = h( m+1, m+1 )

         h21 = h( m+1, m )

         h12 = h( m, m+1 )

         h44s = h44 - h11

         h33s = h33 - h11

         v1 = ( h33s*h44s-h43h34 ) / h21 + h12

         v2 = h22 - h11 - h33s - h44s

         v3 = h( m+2, m+1 )

         s1 = abs( v1 ) + abs( v2 ) + abs( v3 )

         v1 = v1 / s1

         v2 = v2 / s1

         v3 = v3 / s1

         v( 1 ) = v1

         v( 2 ) = v2

         v( 3 ) = v3

         h00 = h( m-1, m-1 )

         h10 = h( m, m-1 )

         tst1 = abs( v1 )*( abs( h00 )+abs( h11 )+abs( h22 ) )

         IF( abs( h10 )*( abs( v2 )+abs( v3 ) ).GT.ulp*tst1 ) THEN

*           Find minimum

            dval = (abs(h10)*(abs(v2)+abs(v3))) / (ulp*tst1)

            ival = ibulge

            DO 15 i = ibulge+1, nbulge

               h44 = s(2*jblk-2*i+2, 2*jblk-2*i+2)

               h33 = s(2*jblk-2*i+1,2*jblk-2*i+1)

               h43h34 = s(2*jblk-2*i+1,2*jblk-2*i+2)*

     $                  s(2*jblk-2*i+2, 2*jblk-2*i+1)

               h11 = h( m, m )

               h22 = h( m+1, m+1 )

               h21 = h( m+1, m )

               h12 = h( m, m+1 )

               h44s = h44 - h11

               h33s = h33 - h11

               v1 = ( h33s*h44s-h43h34 ) / h21 + h12

               v2 = h22 - h11 - h33s - h44s

               v3 = h( m+2, m+1 )

               s1 = abs( v1 ) + abs( v2 ) + abs( v3 )

               v1 = v1 / s1

               v2 = v2 / s1

               v3 = v3 / s1

               v( 1 ) = v1

               v( 2 ) = v2

               v( 3 ) = v3

               h00 = h( m-1, m-1 )

               h10 = h( m, m-1 )

               tst1 = abs( v1 )*( abs( h00 )+abs( h11 )+abs( h22 ) )

               IF ( (dval.GT.(abs(h10)*(abs(v2)+abs(v3)))/(ulp*tst1))

     $             .AND. ( dval .GT. 1.d0 ) ) THEN

                  dval = (abs(h10)*(abs(v2)+abs(v3))) / (ulp*tst1)

                  ival = i

               END IF

  15        CONTINUE

            IF ( (dval .LT. ten) .AND. (ival .NE. ibulge) ) THEN

               h44 = s(2*jblk-2*ival+2, 2*jblk-2*ival+2)

               h33 = s(2*jblk-2*ival+1,2*jblk-2*ival+1)

               h43h34 = s(2*jblk-2*ival+1,2*jblk-2*ival+2)

               h10 =    s(2*jblk-2*ival+2, 2*jblk-2*ival+1)

               s(2*jblk-2*ival+2,2*jblk-2*ival+2) =

     $              s(2*jblk-2*ibulge+2,2*jblk-2*ibulge+2)

               s(2*jblk-2*ival+1,2*jblk-2*ival+1) =

     $              s(2*jblk-2*ibulge+1,2*jblk-2*ibulge+1)

               s(2*jblk-2*ival+1,2*jblk-2*ival+2) =

     $              s(2*jblk-2*ibulge+1,2*jblk-2*ibulge+2)

               s(2*jblk-2*ival+2, 2*jblk-2*ival+1) =

     $              s(2*jblk-2*ibulge+2, 2*jblk-2*ibulge+1)

               s(2*jblk-2*ibulge+2, 2*jblk-2*ibulge+2) = h44

               s(2*jblk-2*ibulge+1,2*jblk-2*ibulge+1) = h33

               s(2*jblk-2*ibulge+1,2*jblk-2*ibulge+2) = h43h34

               s(2*jblk-2*ibulge+2, 2*jblk-2*ibulge+1) = h10

            END IF

            h44 = s(2*jblk-2*ibulge+2, 2*jblk-2*ibulge+2)

            h33 = s(2*jblk-2*ibulge+1,2*jblk-2*ibulge+1)

            h43h34 = s(2*jblk-2*ibulge+1,2*jblk-2*ibulge+2)*

     $               s(2*jblk-2*ibulge+2, 2*jblk-2*ibulge+1)

            h11 = h( m, m )

            h22 = h( m+1, m+1 )

            h21 = h( m+1, m )

            h12 = h( m, m+1 )

            h44s = h44 - h11

            h33s = h33 - h11

            v1 = ( h33s*h44s-h43h34 ) / h21 + h12

            v2 = h22 - h11 - h33s - h44s

            v3 = h( m+2, m+1 )

            s1 = abs( v1 ) + abs( v2 ) + abs( v3 )

            v1 = v1 / s1

            v2 = v2 / s1

            v3 = v3 / s1

            v( 1 ) = v1

            v( 2 ) = v2

            v( 3 ) = v3

            h00 = h( m-1, m-1 )

            h10 = h( m, m-1 )

            tst1 = abs( v1 )*( abs( h00 )+abs( h11 )+abs( h22 ) )

         END IF

         IF( abs( h10 )*( abs( v2 )+abs( v3 ) ).GT.ten*ulp*tst1 ) THEN

*           IBULGE better not be 1 here or we have a bug!

            nbulge = max(ibulge -1,1)

            RETURN

         END IF

         DO 120 k = m, n - 1

            nr = min( 3, n-k+1 )

            IF( k.GT.m )

     $         CALL dcopy( nr, h( k, k-1 ), 1, v, 1 )

            CALL dlarfg( nr, v( 1 ), v( 2 ), 1, t1 )

            IF( k.GT.m ) THEN

               h( k, k-1 ) = v( 1 )

               h( k+1, k-1 ) = zero

               IF( k.LT.n-1 )

     $            h( k+2, k-1 ) = zero

            ELSE

               h( k, k-1 ) = -h( k, k-1 )

            END IF

            v2 = v( 2 )

            t2 = t1*v2

            IF( nr.EQ.3 ) THEN

               v3 = v( 3 )

               t3 = t1*v3

               DO 60 j = k, n

                  sum = h( k, j ) + v2*h( k+1, j ) + v3*h( k+2, j )

                  h( k, j ) = h( k, j ) - sum*t1

                  h( k+1, j ) = h( k+1, j ) - sum*t2

                  h( k+2, j ) = h( k+2, j ) - sum*t3

   60          CONTINUE

               DO 70 j = 1, min( k+3, n )

                  sum = h( j, k ) + v2*h( j, k+1 ) + v3*h( j, k+2 )

                  h( j, k ) = h( j, k ) - sum*t1

                  h( j, k+1 ) = h( j, k+1 ) - sum*t2

                  h( j, k+2 ) = h( j, k+2 ) - sum*t3

   70          CONTINUE

            END IF

  120    CONTINUE

   10 CONTINUE

*

      RETURN


      END

dlamsh
subroutine dlamsh(s, lds, nbulge, jblk, h, ldh, n, ulp)
Definition dlamsh.f:2

max
#define max(A, B)
Definition pcgemr.c:180

min
#define min(A, B)
Definition pcgemr.c:181