d2/d90/cgesdd_8f_source.html

*> \brief \b CGESDD

*

*  =========== DOCUMENTATION ===========

*

* Online html documentation available at

*            http://www.netlib.org/lapack/explore-html/

*

*> \htmlonly

*> Download CGESDD + dependencies

*> <a href="http://www.netlib.org/cgi-bin/netlibfiles.tgz?format=tgz&filename=/lapack/lapack_routine/cgesdd.f">

*> [TGZ]</a>

*> <a href="http://www.netlib.org/cgi-bin/netlibfiles.zip?format=zip&filename=/lapack/lapack_routine/cgesdd.f">

*> [ZIP]</a>

*> <a href="http://www.netlib.org/cgi-bin/netlibfiles.txt?format=txt&filename=/lapack/lapack_routine/cgesdd.f">

*> [TXT]</a>

*> \endhtmlonly

*

*  Definition:

*  ===========

*

*       SUBROUTINE CGESDD( JOBZ, M, N, A, LDA, S, U, LDU, VT, LDVT,

*                          WORK, LWORK, RWORK, IWORK, INFO )

*

*       .. Scalar Arguments ..

*       CHARACTER          JOBZ

*       INTEGER            INFO, LDA, LDU, LDVT, LWORK, M, N

*       ..

*       .. Array Arguments ..

*       INTEGER            IWORK( * )

*       REAL               RWORK( * ), S( * )

*       COMPLEX            A( LDA, * ), U( LDU, * ), VT( LDVT, * ),

*      $                   WORK( * )

*       ..

*

*

*> \par Purpose:

*  =============

*>

*> \verbatim

*>

*> CGESDD computes the singular value decomposition (SVD) of a complex

*> M-by-N matrix A, optionally computing the left and/or right singular

*> vectors, by using divide-and-conquer method. The SVD is written

*>

*>      A = U * SIGMA * conjugate-transpose(V)

*>

*> where SIGMA is an M-by-N matrix which is zero except for its

*> min(m,n) diagonal elements, U is an M-by-M unitary matrix, and

*> V is an N-by-N unitary matrix.  The diagonal elements of SIGMA

*> are the singular values of A; they are real and non-negative, and

*> are returned in descending order.  The first min(m,n) columns of

*> U and V are the left and right singular vectors of A.

*>

*> Note that the routine returns VT = V**H, not V.

*>

*> The divide and conquer algorithm makes very mild assumptions about

*> floating point arithmetic. It will work on machines with a guard

*> digit in add/subtract, or on those binary machines without guard

*> digits which subtract like the Cray X-MP, Cray Y-MP, Cray C-90, or

*> Cray-2. It could conceivably fail on hexadecimal or decimal machines

*> without guard digits, but we know of none.

*> \endverbatim

*

*  Arguments:

*  ==========

*

*> \param[in] JOBZ

*> \verbatim

*>          JOBZ is CHARACTER*1

*>          Specifies options for computing all or part of the matrix U:

*>          = 'A':  all M columns of U and all N rows of V**H are

*>                  returned in the arrays U and VT;

*>          = 'S':  the first min(M,N) columns of U and the first

*>                  min(M,N) rows of V**H are returned in the arrays U

*>                  and VT;

*>          = 'O':  If M >= N, the first N columns of U are overwritten

*>                  in the array A and all rows of V**H are returned in

*>                  the array VT;

*>                  otherwise, all columns of U are returned in the

*>                  array U and the first M rows of V**H are overwritten

*>                  in the array A;

*>          = 'N':  no columns of U or rows of V**H are computed.

*> \endverbatim

*>

*> \param[in] M

*> \verbatim

*>          M is INTEGER

*>          The number of rows of the input matrix A.  M >= 0.

*> \endverbatim

*>

*> \param[in] N

*> \verbatim

*>          N is INTEGER

*>          The number of columns of the input matrix A.  N >= 0.

*> \endverbatim

*>

*> \param[in,out] A

*> \verbatim

*>          A is COMPLEX array, dimension (LDA,N)

*>          On entry, the M-by-N matrix A.

*>          On exit,

*>          if JOBZ = 'O',  A is overwritten with the first N columns

*>                          of U (the left singular vectors, stored

*>                          columnwise) if M >= N;

*>                          A is overwritten with the first M rows

*>                          of V**H (the right singular vectors, stored

*>                          rowwise) otherwise.

*>          if JOBZ .ne. 'O', the contents of A are destroyed.

*> \endverbatim

*>

*> \param[in] LDA

*> \verbatim

*>          LDA is INTEGER

*>          The leading dimension of the array A.  LDA >= max(1,M).

*> \endverbatim

*>

*> \param[out] S

*> \verbatim

*>          S is REAL array, dimension (min(M,N))

*>          The singular values of A, sorted so that S(i) >= S(i+1).

*> \endverbatim

*>

*> \param[out] U

*> \verbatim

*>          U is COMPLEX array, dimension (LDU,UCOL)

*>          UCOL = M if JOBZ = 'A' or JOBZ = 'O' and M < N;

*>          UCOL = min(M,N) if JOBZ = 'S'.

*>          If JOBZ = 'A' or JOBZ = 'O' and M < N, U contains the M-by-M

*>          unitary matrix U;

*>          if JOBZ = 'S', U contains the first min(M,N) columns of U

*>          (the left singular vectors, stored columnwise);

*>          if JOBZ = 'O' and M >= N, or JOBZ = 'N', U is not referenced.

*> \endverbatim

*>

*> \param[in] LDU

*> \verbatim

*>          LDU is INTEGER

*>          The leading dimension of the array U.  LDU >= 1; if

*>          JOBZ = 'S' or 'A' or JOBZ = 'O' and M < N, LDU >= M.

*> \endverbatim

*>

*> \param[out] VT

*> \verbatim

*>          VT is COMPLEX array, dimension (LDVT,N)

*>          If JOBZ = 'A' or JOBZ = 'O' and M >= N, VT contains the

*>          N-by-N unitary matrix V**H;

*>          if JOBZ = 'S', VT contains the first min(M,N) rows of

*>          V**H (the right singular vectors, stored rowwise);

*>          if JOBZ = 'O' and M < N, or JOBZ = 'N', VT is not referenced.

*> \endverbatim

*>

*> \param[in] LDVT

*> \verbatim

*>          LDVT is INTEGER

*>          The leading dimension of the array VT.  LDVT >= 1; if

*>          JOBZ = 'A' or JOBZ = 'O' and M >= N, LDVT >= N;

*>          if JOBZ = 'S', LDVT >= min(M,N).

*> \endverbatim

*>

*> \param[out] WORK

*> \verbatim

*>          WORK is COMPLEX array, dimension (MAX(1,LWORK))

*>          On exit, if INFO = 0, WORK(1) returns the optimal LWORK.

*> \endverbatim

*>

*> \param[in] LWORK

*> \verbatim

*>          LWORK is INTEGER

*>          The dimension of the array WORK. LWORK >= 1.

*>          if JOBZ = 'N', LWORK >= 2*min(M,N)+max(M,N).

*>          if JOBZ = 'O',

*>                LWORK >= 2*min(M,N)*min(M,N)+2*min(M,N)+max(M,N).

*>          if JOBZ = 'S' or 'A',

*>                LWORK >= min(M,N)*min(M,N)+2*min(M,N)+max(M,N).

*>          For good performance, LWORK should generally be larger.

*>

*>          If LWORK = -1, a workspace query is assumed.  The optimal

*>          size for the WORK array is calculated and stored in WORK(1),

*>          and no other work except argument checking is performed.

*> \endverbatim

*>

*> \param[out] RWORK

*> \verbatim

*>          RWORK is REAL array, dimension (MAX(1,LRWORK))

*>          If JOBZ = 'N', LRWORK >= 5*min(M,N).

*>          Otherwise,

*>          LRWORK >= min(M,N)*max(5*min(M,N)+7,2*max(M,N)+2*min(M,N)+1)

*> \endverbatim

*>

*> \param[out] IWORK

*> \verbatim

*>          IWORK is INTEGER array, dimension (8*min(M,N))

*> \endverbatim

*>

*> \param[out] INFO

*> \verbatim

*>          INFO is INTEGER

*>          = 0:  successful exit.

*>          < 0:  if INFO = -i, the i-th argument had an illegal value.

*>          > 0:  The updating process of SBDSDC did not converge.

*> \endverbatim

*

*  Authors:

*  ========

*

*> \author Univ. of Tennessee

*> \author Univ. of California Berkeley

*> \author Univ. of Colorado Denver

*> \author NAG Ltd.

*

*> \date November 2011

*

*> \ingroup complexGEsing

*

*> \par Contributors:

*  ==================

*>

*>     Ming Gu and Huan Ren, Computer Science Division, University of

*>     California at Berkeley, USA

*>

*  =====================================================================

      SUBROUTINE cgesdd( JOBZ, M, N, A, LDA, S, U, LDU, VT, LDVT,

     $                   work, lwork, rwork, iwork, info )

*

*  -- LAPACK driver routine (version 3.4.0) --

*  -- LAPACK is a software package provided by Univ. of Tennessee,    --

*  -- Univ. of California Berkeley, Univ. of Colorado Denver and NAG Ltd..--

*     November 2011

*

*     .. Scalar Arguments ..

      CHARACTER          jobz

      INTEGER            info, lda, ldu, ldvt, lwork, m, n

*     ..

*     .. Array Arguments ..

      INTEGER            iwork( * )

      REAL               rwork( * ), s( * )

      COMPLEX            a( lda, * ), u( ldu, * ), vt( ldvt, * ),

     $                   work( * )

*     ..

*

*  =====================================================================

*

*     .. Parameters ..

      INTEGER            lquerv

      parameter( lquerv = -1 )

      COMPLEX            czero, cone

      parameter( czero = ( 0.0e+0, 0.0e+0 ),

     $                   cone = ( 1.0e+0, 0.0e+0 ) )

      REAL               zero, one

      parameter( zero = 0.0e+0, one = 1.0e+0 )

*     ..

*     .. Local Scalars ..

      LOGICAL            wntqa, wntqas, wntqn, wntqo, wntqs

      INTEGER            blk, chunk, i, ie, ierr, il, ir, iru, irvt,

     $                   iscl, itau, itaup, itauq, iu, ivt, ldwkvt,

     $                   ldwrkl, ldwrkr, ldwrku, maxwrk, minmn, minwrk,

     $                   mnthr1, mnthr2, nrwork, nwork, wrkbl

      REAL               anrm, bignum, eps, smlnum

*     ..

*     .. Local Arrays ..

      INTEGER            idum( 1 )

      REAL               dum( 1 )

*     ..

*     .. External Subroutines ..

      EXTERNAL           cgebrd, cgelqf, cgemm, cgeqrf, clacp2, clacpy,

     $                   clacrm, clarcm, clascl, claset, cungbr, cunglq,

     $                   cungqr, cunmbr, sbdsdc, slascl, xerbla

*     ..

*     .. External Functions ..

      LOGICAL            lsame

      INTEGER            ilaenv

      REAL               clange, slamch

      EXTERNAL           clange, slamch, ilaenv, lsame

*     ..

*     .. Intrinsic Functions ..

      INTRINSIC          int, max, min, sqrt

*     ..

*     .. Executable Statements ..

*

*     Test the input arguments

*

      info = 0

      minmn = min( m, n )

      mnthr1 = int( minmn*17.0 / 9.0 )

      mnthr2 = int( minmn*5.0 / 3.0 )

      wntqa = lsame( jobz, 'A' )

      wntqs = lsame( jobz, 'S' )

      wntqas = wntqa .OR. wntqs

      wntqo = lsame( jobz, 'O' )

      wntqn = lsame( jobz, 'N' )

      minwrk = 1

      maxwrk = 1

*

      IF( .NOT.( wntqa .OR. wntqs .OR. wntqo .OR. wntqn ) ) THEN

         info = -1

      ELSE IF( m.LT.0 ) THEN

         info = -2

      ELSE IF( n.LT.0 ) THEN

         info = -3

      ELSE IF( lda.LT.max( 1, m ) ) THEN

         info = -5

      ELSE IF( ldu.LT.1 .OR. ( wntqas .AND. ldu.LT.m ) .OR.

     $         ( wntqo .AND. m.LT.n .AND. ldu.LT.m ) ) THEN

         info = -8

      ELSE IF( ldvt.LT.1 .OR. ( wntqa .AND. ldvt.LT.n ) .OR.

     $         ( wntqs .AND. ldvt.LT.minmn ) .OR.

     $         ( wntqo .AND. m.GE.n .AND. ldvt.LT.n ) ) THEN

         info = -10

      END IF

*

*     Compute workspace

*      (Note: Comments in the code beginning "Workspace:" describe the

*       minimal amount of workspace needed at that point in the code,

*       as well as the preferred amount for good performance.

*       CWorkspace refers to complex workspace, and RWorkspace to

*       real workspace. NB refers to the optimal block size for the

*       immediately following subroutine, as returned by ILAENV.)

*

      IF( info.EQ.0 .AND. m.GT.0 .AND. n.GT.0 ) THEN

         IF( m.GE.n ) THEN

*

*           There is no complex work space needed for bidiagonal SVD

*           The real work space needed for bidiagonal SVD is BDSPAC

*           for computing singular values and singular vectors; BDSPAN

*           for computing singular values only.

*           BDSPAC = 5*N*N + 7*N

*           BDSPAN = MAX(7*N+4, 3*N+2+SMLSIZ*(SMLSIZ+8))

*

            IF( m.GE.mnthr1 ) THEN

               IF( wntqn ) THEN

*

*                 Path 1 (M much larger than N, JOBZ='N')

*

                  maxwrk = n + n*ilaenv( 1, 'CGEQRF', ' ', m, n, -1,

     $                     -1 )

                  maxwrk = max( maxwrk, 2*n+2*n*

     $                     ilaenv( 1, 'CGEBRD', ' ', n, n, -1, -1 ) )

                  minwrk = 3*n

               ELSE IF( wntqo ) THEN

*

*                 Path 2 (M much larger than N, JOBZ='O')

*

                  wrkbl = n + n*ilaenv( 1, 'CGEQRF', ' ', m, n, -1, -1 )

                  wrkbl = max( wrkbl, n+n*ilaenv( 1, 'CUNGQR', ' ', m,

     $                    n, n, -1 ) )

                  wrkbl = max( wrkbl, 2*n+2*n*

     $                    ilaenv( 1, 'CGEBRD', ' ', n, n, -1, -1 ) )

                  wrkbl = max( wrkbl, 2*n+n*

     $                    ilaenv( 1, 'CUNMBR', 'QLN', n, n, n, -1 ) )

                  wrkbl = max( wrkbl, 2*n+n*

     $                    ilaenv( 1, 'CUNMBR', 'PRC', n, n, n, -1 ) )

                  maxwrk = m*n + n*n + wrkbl

                  minwrk = 2*n*n + 3*n

               ELSE IF( wntqs ) THEN

*

*                 Path 3 (M much larger than N, JOBZ='S')

*

                  wrkbl = n + n*ilaenv( 1, 'CGEQRF', ' ', m, n, -1, -1 )

                  wrkbl = max( wrkbl, n+n*ilaenv( 1, 'CUNGQR', ' ', m,

     $                    n, n, -1 ) )

                  wrkbl = max( wrkbl, 2*n+2*n*

     $                    ilaenv( 1, 'CGEBRD', ' ', n, n, -1, -1 ) )

                  wrkbl = max( wrkbl, 2*n+n*

     $                    ilaenv( 1, 'CUNMBR', 'QLN', n, n, n, -1 ) )

                  wrkbl = max( wrkbl, 2*n+n*

     $                    ilaenv( 1, 'CUNMBR', 'PRC', n, n, n, -1 ) )

                  maxwrk = n*n + wrkbl

                  minwrk = n*n + 3*n

               ELSE IF( wntqa ) THEN

*

*                 Path 4 (M much larger than N, JOBZ='A')

*

                  wrkbl = n + n*ilaenv( 1, 'CGEQRF', ' ', m, n, -1, -1 )

                  wrkbl = max( wrkbl, n+m*ilaenv( 1, 'CUNGQR', ' ', m,

     $                    m, n, -1 ) )

                  wrkbl = max( wrkbl, 2*n+2*n*

     $                    ilaenv( 1, 'CGEBRD', ' ', n, n, -1, -1 ) )

                  wrkbl = max( wrkbl, 2*n+n*

     $                    ilaenv( 1, 'CUNMBR', 'QLN', n, n, n, -1 ) )

                  wrkbl = max( wrkbl, 2*n+n*

     $                    ilaenv( 1, 'CUNMBR', 'PRC', n, n, n, -1 ) )

                  maxwrk = n*n + wrkbl

                  minwrk = n*n + 2*n + m

               END IF

            ELSE IF( m.GE.mnthr2 ) THEN

*

*              Path 5 (M much larger than N, but not as much as MNTHR1)

*

               maxwrk = 2*n + ( m+n )*ilaenv( 1, 'CGEBRD', ' ', m, n,

     $                  -1, -1 )

               minwrk = 2*n + m

               IF( wntqo ) THEN

                  maxwrk = max( maxwrk, 2*n+n*

     $                     ilaenv( 1, 'CUNGBR', 'P', n, n, n, -1 ) )

                  maxwrk = max( maxwrk, 2*n+n*

     $                     ilaenv( 1, 'CUNGBR', 'Q', m, n, n, -1 ) )

                  maxwrk = maxwrk + m*n

                  minwrk = minwrk + n*n

               ELSE IF( wntqs ) THEN

                  maxwrk = max( maxwrk, 2*n+n*

     $                     ilaenv( 1, 'CUNGBR', 'P', n, n, n, -1 ) )

                  maxwrk = max( maxwrk, 2*n+n*

     $                     ilaenv( 1, 'CUNGBR', 'Q', m, n, n, -1 ) )

               ELSE IF( wntqa ) THEN

                  maxwrk = max( maxwrk, 2*n+n*

     $                     ilaenv( 1, 'CUNGBR', 'P', n, n, n, -1 ) )

                  maxwrk = max( maxwrk, 2*n+m*

     $                     ilaenv( 1, 'CUNGBR', 'Q', m, m, n, -1 ) )

               END IF

            ELSE

*

*              Path 6 (M at least N, but not much larger)

*

               maxwrk = 2*n + ( m+n )*ilaenv( 1, 'CGEBRD', ' ', m, n,

     $                  -1, -1 )

               minwrk = 2*n + m

               IF( wntqo ) THEN

                  maxwrk = max( maxwrk, 2*n+n*

     $                     ilaenv( 1, 'CUNMBR', 'PRC', n, n, n, -1 ) )

                  maxwrk = max( maxwrk, 2*n+n*

     $                     ilaenv( 1, 'CUNMBR', 'QLN', m, n, n, -1 ) )

                  maxwrk = maxwrk + m*n

                  minwrk = minwrk + n*n

               ELSE IF( wntqs ) THEN

                  maxwrk = max( maxwrk, 2*n+n*

     $                     ilaenv( 1, 'CUNMBR', 'PRC', n, n, n, -1 ) )

                  maxwrk = max( maxwrk, 2*n+n*

     $                     ilaenv( 1, 'CUNMBR', 'QLN', m, n, n, -1 ) )

               ELSE IF( wntqa ) THEN

                  maxwrk = max( maxwrk, 2*n+n*

     $                     ilaenv( 1, 'CUNGBR', 'PRC', n, n, n, -1 ) )

                  maxwrk = max( maxwrk, 2*n+m*

     $                     ilaenv( 1, 'CUNGBR', 'QLN', m, m, n, -1 ) )

               END IF

            END IF

         ELSE

*

*           There is no complex work space needed for bidiagonal SVD

*           The real work space needed for bidiagonal SVD is BDSPAC

*           for computing singular values and singular vectors; BDSPAN

*           for computing singular values only.

*           BDSPAC = 5*M*M + 7*M

*           BDSPAN = MAX(7*M+4, 3*M+2+SMLSIZ*(SMLSIZ+8))

*

            IF( n.GE.mnthr1 ) THEN

               IF( wntqn ) THEN

*

*                 Path 1t (N much larger than M, JOBZ='N')

*

                  maxwrk = m + m*ilaenv( 1, 'CGELQF', ' ', m, n, -1,

     $                     -1 )

                  maxwrk = max( maxwrk, 2*m+2*m*

     $                     ilaenv( 1, 'CGEBRD', ' ', m, m, -1, -1 ) )

                  minwrk = 3*m

               ELSE IF( wntqo ) THEN

*

*                 Path 2t (N much larger than M, JOBZ='O')

*

                  wrkbl = m + m*ilaenv( 1, 'CGELQF', ' ', m, n, -1, -1 )

                  wrkbl = max( wrkbl, m+m*ilaenv( 1, 'CUNGLQ', ' ', m,

     $                    n, m, -1 ) )

                  wrkbl = max( wrkbl, 2*m+2*m*

     $                    ilaenv( 1, 'CGEBRD', ' ', m, m, -1, -1 ) )

                  wrkbl = max( wrkbl, 2*m+m*

     $                    ilaenv( 1, 'CUNMBR', 'PRC', m, m, m, -1 ) )

                  wrkbl = max( wrkbl, 2*m+m*

     $                    ilaenv( 1, 'CUNMBR', 'QLN', m, m, m, -1 ) )

                  maxwrk = m*n + m*m + wrkbl

                  minwrk = 2*m*m + 3*m

               ELSE IF( wntqs ) THEN

*

*                 Path 3t (N much larger than M, JOBZ='S')

*

                  wrkbl = m + m*ilaenv( 1, 'CGELQF', ' ', m, n, -1, -1 )

                  wrkbl = max( wrkbl, m+m*ilaenv( 1, 'CUNGLQ', ' ', m,

     $                    n, m, -1 ) )

                  wrkbl = max( wrkbl, 2*m+2*m*

     $                    ilaenv( 1, 'CGEBRD', ' ', m, m, -1, -1 ) )

                  wrkbl = max( wrkbl, 2*m+m*

     $                    ilaenv( 1, 'CUNMBR', 'PRC', m, m, m, -1 ) )

                  wrkbl = max( wrkbl, 2*m+m*

     $                    ilaenv( 1, 'CUNMBR', 'QLN', m, m, m, -1 ) )

                  maxwrk = m*m + wrkbl

                  minwrk = m*m + 3*m

               ELSE IF( wntqa ) THEN

*

*                 Path 4t (N much larger than M, JOBZ='A')

*

                  wrkbl = m + m*ilaenv( 1, 'CGELQF', ' ', m, n, -1, -1 )

                  wrkbl = max( wrkbl, m+n*ilaenv( 1, 'CUNGLQ', ' ', n,

     $                    n, m, -1 ) )

                  wrkbl = max( wrkbl, 2*m+2*m*

     $                    ilaenv( 1, 'CGEBRD', ' ', m, m, -1, -1 ) )

                  wrkbl = max( wrkbl, 2*m+m*

     $                    ilaenv( 1, 'CUNMBR', 'PRC', m, m, m, -1 ) )

                  wrkbl = max( wrkbl, 2*m+m*

     $                    ilaenv( 1, 'CUNMBR', 'QLN', m, m, m, -1 ) )

                  maxwrk = m*m + wrkbl

                  minwrk = m*m + 2*m + n

               END IF

            ELSE IF( n.GE.mnthr2 ) THEN

*

*              Path 5t (N much larger than M, but not as much as MNTHR1)

*

               maxwrk = 2*m + ( m+n )*ilaenv( 1, 'CGEBRD', ' ', m, n,

     $                  -1, -1 )

               minwrk = 2*m + n

               IF( wntqo ) THEN

                  maxwrk = max( maxwrk, 2*m+m*

     $                     ilaenv( 1, 'CUNGBR', 'P', m, n, m, -1 ) )

                  maxwrk = max( maxwrk, 2*m+m*

     $                     ilaenv( 1, 'CUNGBR', 'Q', m, m, n, -1 ) )

                  maxwrk = maxwrk + m*n

                  minwrk = minwrk + m*m

               ELSE IF( wntqs ) THEN

                  maxwrk = max( maxwrk, 2*m+m*

     $                     ilaenv( 1, 'CUNGBR', 'P', m, n, m, -1 ) )

                  maxwrk = max( maxwrk, 2*m+m*

     $                     ilaenv( 1, 'CUNGBR', 'Q', m, m, n, -1 ) )

               ELSE IF( wntqa ) THEN

                  maxwrk = max( maxwrk, 2*m+n*

     $                     ilaenv( 1, 'CUNGBR', 'P', n, n, m, -1 ) )

                  maxwrk = max( maxwrk, 2*m+m*

     $                     ilaenv( 1, 'CUNGBR', 'Q', m, m, n, -1 ) )

               END IF

            ELSE

*

*              Path 6t (N greater than M, but not much larger)

*

               maxwrk = 2*m + ( m+n )*ilaenv( 1, 'CGEBRD', ' ', m, n,

     $                  -1, -1 )

               minwrk = 2*m + n

               IF( wntqo ) THEN

                  maxwrk = max( maxwrk, 2*m+m*

     $                     ilaenv( 1, 'CUNMBR', 'PRC', m, n, m, -1 ) )

                  maxwrk = max( maxwrk, 2*m+m*

     $                     ilaenv( 1, 'CUNMBR', 'QLN', m, m, n, -1 ) )

                  maxwrk = maxwrk + m*n

                  minwrk = minwrk + m*m

               ELSE IF( wntqs ) THEN

                  maxwrk = max( maxwrk, 2*m+m*

     $                     ilaenv( 1, 'CUNGBR', 'PRC', m, n, m, -1 ) )

                  maxwrk = max( maxwrk, 2*m+m*

     $                     ilaenv( 1, 'CUNGBR', 'QLN', m, m, n, -1 ) )

               ELSE IF( wntqa ) THEN

                  maxwrk = max( maxwrk, 2*m+n*

     $                     ilaenv( 1, 'CUNGBR', 'PRC', n, n, m, -1 ) )

                  maxwrk = max( maxwrk, 2*m+m*

     $                     ilaenv( 1, 'CUNGBR', 'QLN', m, m, n, -1 ) )

               END IF

            END IF

         END IF

         maxwrk = max( maxwrk, minwrk )

      END IF

      IF( info.EQ.0 ) THEN

         work( 1 ) = maxwrk

         IF( lwork.LT.minwrk .AND. lwork.NE.lquerv )

     $      info = -13

      END IF

*

*     Quick returns

*

      IF( info.NE.0 ) THEN

         CALL xerbla( 'CGESDD', -info )

         return

      END IF

      IF( lwork.EQ.lquerv )

     $   return

      IF( m.EQ.0 .OR. n.EQ.0 ) THEN

         return

      END IF

*

*     Get machine constants

*

      eps = slamch( 'P' )

      smlnum = sqrt( slamch( 'S' ) ) / eps

      bignum = one / smlnum

*

*     Scale A if max element outside range [SMLNUM,BIGNUM]

*

      anrm = clange( 'M', m, n, a, lda, dum )

      iscl = 0

      IF( anrm.GT.zero .AND. anrm.LT.smlnum ) THEN

         iscl = 1

         CALL clascl( 'G', 0, 0, anrm, smlnum, m, n, a, lda, ierr )

      ELSE IF( anrm.GT.bignum ) THEN

         iscl = 1

         CALL clascl( 'G', 0, 0, anrm, bignum, m, n, a, lda, ierr )

      END IF

*

      IF( m.GE.n ) THEN

*

*        A has at least as many rows as columns. If A has sufficiently

*        more rows than columns, first reduce using the QR

*        decomposition (if sufficient workspace available)

*

         IF( m.GE.mnthr1 ) THEN

*

            IF( wntqn ) THEN

*

*              Path 1 (M much larger than N, JOBZ='N')

*              No singular vectors to be computed

*

               itau = 1

               nwork = itau + n

*

*              Compute A=Q*R

*              (CWorkspace: need 2*N, prefer N+N*NB)

*              (RWorkspace: need 0)

*

               CALL cgeqrf( m, n, a, lda, work( itau ), work( nwork ),

     $                      lwork-nwork+1, ierr )

*

*              Zero out below R

*

               CALL claset( 'L', n-1, n-1, czero, czero, a( 2, 1 ),

     $                      lda )

               ie = 1

               itauq = 1

               itaup = itauq + n

               nwork = itaup + n

*

*              Bidiagonalize R in A

*              (CWorkspace: need 3*N, prefer 2*N+2*N*NB)

*              (RWorkspace: need N)

*

               CALL cgebrd( n, n, a, lda, s, rwork( ie ), work( itauq ),

     $                      work( itaup ), work( nwork ), lwork-nwork+1,

     $                      ierr )

               nrwork = ie + n

*

*              Perform bidiagonal SVD, compute singular values only

*              (CWorkspace: 0)

*              (RWorkspace: need BDSPAN)

*

               CALL sbdsdc( 'U', 'N', n, s, rwork( ie ), dum, 1, dum, 1,

     $                      dum, idum, rwork( nrwork ), iwork, info )

*

            ELSE IF( wntqo ) THEN

*

*              Path 2 (M much larger than N, JOBZ='O')

*              N left singular vectors to be overwritten on A and

*              N right singular vectors to be computed in VT

*

               iu = 1

*

*              WORK(IU) is N by N

*

               ldwrku = n

               ir = iu + ldwrku*n

               IF( lwork.GE.m*n+n*n+3*n ) THEN

*

*                 WORK(IR) is M by N

*

                  ldwrkr = m

               ELSE

                  ldwrkr = ( lwork-n*n-3*n ) / n

               END IF

               itau = ir + ldwrkr*n

               nwork = itau + n

*

*              Compute A=Q*R

*              (CWorkspace: need N*N+2*N, prefer M*N+N+N*NB)

*              (RWorkspace: 0)

*

               CALL cgeqrf( m, n, a, lda, work( itau ), work( nwork ),

     $                      lwork-nwork+1, ierr )

*

*              Copy R to WORK( IR ), zeroing out below it

*

               CALL clacpy( 'U', n, n, a, lda, work( ir ), ldwrkr )

               CALL claset( 'L', n-1, n-1, czero, czero, work( ir+1 ),

     $                      ldwrkr )

*

*              Generate Q in A

*              (CWorkspace: need 2*N, prefer N+N*NB)

*              (RWorkspace: 0)

*

               CALL cungqr( m, n, n, a, lda, work( itau ),

     $                      work( nwork ), lwork-nwork+1, ierr )

               ie = 1

               itauq = itau

               itaup = itauq + n

               nwork = itaup + n

*

*              Bidiagonalize R in WORK(IR)

*              (CWorkspace: need N*N+3*N, prefer M*N+2*N+2*N*NB)

*              (RWorkspace: need N)

*

               CALL cgebrd( n, n, work( ir ), ldwrkr, s, rwork( ie ),

     $                      work( itauq ), work( itaup ), work( nwork ),

     $                      lwork-nwork+1, ierr )

*

*              Perform bidiagonal SVD, computing left singular vectors

*              of R in WORK(IRU) and computing right singular vectors

*              of R in WORK(IRVT)

*              (CWorkspace: need 0)

*              (RWorkspace: need BDSPAC)

*

               iru = ie + n

               irvt = iru + n*n

               nrwork = irvt + n*n

               CALL sbdsdc( 'U', 'I', n, s, rwork( ie ), rwork( iru ),

     $                      n, rwork( irvt ), n, dum, idum,

     $                      rwork( nrwork ), iwork, info )

*

*              Copy real matrix RWORK(IRU) to complex matrix WORK(IU)

*              Overwrite WORK(IU) by the left singular vectors of R

*              (CWorkspace: need 2*N*N+3*N, prefer M*N+N*N+2*N+N*NB)

*              (RWorkspace: 0)

*

               CALL clacp2( 'F', n, n, rwork( iru ), n, work( iu ),

     $                      ldwrku )

               CALL cunmbr( 'Q', 'L', 'N', n, n, n, work( ir ), ldwrkr,

     $                      work( itauq ), work( iu ), ldwrku,

     $                      work( nwork ), lwork-nwork+1, ierr )

*

*              Copy real matrix RWORK(IRVT) to complex matrix VT

*              Overwrite VT by the right singular vectors of R

*              (CWorkspace: need N*N+3*N, prefer M*N+2*N+N*NB)

*              (RWorkspace: 0)

*

               CALL clacp2( 'F', n, n, rwork( irvt ), n, vt, ldvt )

               CALL cunmbr( 'P', 'R', 'C', n, n, n, work( ir ), ldwrkr,

     $                      work( itaup ), vt, ldvt, work( nwork ),

     $                      lwork-nwork+1, ierr )

*

*              Multiply Q in A by left singular vectors of R in

*              WORK(IU), storing result in WORK(IR) and copying to A

*              (CWorkspace: need 2*N*N, prefer N*N+M*N)

*              (RWorkspace: 0)

*

               DO 10 i = 1, m, ldwrkr

                  chunk = min( m-i+1, ldwrkr )

                  CALL cgemm( 'N', 'N', chunk, n, n, cone, a( i, 1 ),

     $                        lda, work( iu ), ldwrku, czero,

     $                        work( ir ), ldwrkr )

                  CALL clacpy( 'F', chunk, n, work( ir ), ldwrkr,

     $                         a( i, 1 ), lda )

   10          continue

*

            ELSE IF( wntqs ) THEN

*

*              Path 3 (M much larger than N, JOBZ='S')

*              N left singular vectors to be computed in U and

*              N right singular vectors to be computed in VT

*

               ir = 1

*

*              WORK(IR) is N by N

*

               ldwrkr = n

               itau = ir + ldwrkr*n

               nwork = itau + n

*

*              Compute A=Q*R

*              (CWorkspace: need N*N+2*N, prefer N*N+N+N*NB)

*              (RWorkspace: 0)

*

               CALL cgeqrf( m, n, a, lda, work( itau ), work( nwork ),

     $                      lwork-nwork+1, ierr )

*

*              Copy R to WORK(IR), zeroing out below it

*

               CALL clacpy( 'U', n, n, a, lda, work( ir ), ldwrkr )

               CALL claset( 'L', n-1, n-1, czero, czero, work( ir+1 ),

     $                      ldwrkr )

*

*              Generate Q in A

*              (CWorkspace: need 2*N, prefer N+N*NB)

*              (RWorkspace: 0)

*

               CALL cungqr( m, n, n, a, lda, work( itau ),

     $                      work( nwork ), lwork-nwork+1, ierr )

               ie = 1

               itauq = itau

               itaup = itauq + n

               nwork = itaup + n

*

*              Bidiagonalize R in WORK(IR)

*              (CWorkspace: need N*N+3*N, prefer N*N+2*N+2*N*NB)

*              (RWorkspace: need N)

*

               CALL cgebrd( n, n, work( ir ), ldwrkr, s, rwork( ie ),

     $                      work( itauq ), work( itaup ), work( nwork ),

     $                      lwork-nwork+1, ierr )

*

*              Perform bidiagonal SVD, computing left singular vectors

*              of bidiagonal matrix in RWORK(IRU) and computing right

*              singular vectors of bidiagonal matrix in RWORK(IRVT)

*              (CWorkspace: need 0)

*              (RWorkspace: need BDSPAC)

*

               iru = ie + n

               irvt = iru + n*n

               nrwork = irvt + n*n

               CALL sbdsdc( 'U', 'I', n, s, rwork( ie ), rwork( iru ),

     $                      n, rwork( irvt ), n, dum, idum,

     $                      rwork( nrwork ), iwork, info )

*

*              Copy real matrix RWORK(IRU) to complex matrix U

*              Overwrite U by left singular vectors of R

*              (CWorkspace: need N*N+3*N, prefer N*N+2*N+N*NB)

*              (RWorkspace: 0)

*

               CALL clacp2( 'F', n, n, rwork( iru ), n, u, ldu )

               CALL cunmbr( 'Q', 'L', 'N', n, n, n, work( ir ), ldwrkr,

     $                      work( itauq ), u, ldu, work( nwork ),

     $                      lwork-nwork+1, ierr )

*

*              Copy real matrix RWORK(IRVT) to complex matrix VT

*              Overwrite VT by right singular vectors of R

*              (CWorkspace: need N*N+3*N, prefer N*N+2*N+N*NB)

*              (RWorkspace: 0)

*

               CALL clacp2( 'F', n, n, rwork( irvt ), n, vt, ldvt )

               CALL cunmbr( 'P', 'R', 'C', n, n, n, work( ir ), ldwrkr,

     $                      work( itaup ), vt, ldvt, work( nwork ),

     $                      lwork-nwork+1, ierr )

*

*              Multiply Q in A by left singular vectors of R in

*              WORK(IR), storing result in U

*              (CWorkspace: need N*N)

*              (RWorkspace: 0)

*

               CALL clacpy( 'F', n, n, u, ldu, work( ir ), ldwrkr )

               CALL cgemm( 'N', 'N', m, n, n, cone, a, lda, work( ir ),

     $                     ldwrkr, czero, u, ldu )

*

            ELSE IF( wntqa ) THEN

*

*              Path 4 (M much larger than N, JOBZ='A')

*              M left singular vectors to be computed in U and

*              N right singular vectors to be computed in VT

*

               iu = 1

*

*              WORK(IU) is N by N

*

               ldwrku = n

               itau = iu + ldwrku*n

               nwork = itau + n

*

*              Compute A=Q*R, copying result to U

*              (CWorkspace: need 2*N, prefer N+N*NB)

*              (RWorkspace: 0)

*

               CALL cgeqrf( m, n, a, lda, work( itau ), work( nwork ),

     $                      lwork-nwork+1, ierr )

               CALL clacpy( 'L', m, n, a, lda, u, ldu )

*

*              Generate Q in U

*              (CWorkspace: need N+M, prefer N+M*NB)

*              (RWorkspace: 0)

*

               CALL cungqr( m, m, n, u, ldu, work( itau ),

     $                      work( nwork ), lwork-nwork+1, ierr )

*

*              Produce R in A, zeroing out below it

*

               CALL claset( 'L', n-1, n-1, czero, czero, a( 2, 1 ),

     $                      lda )

               ie = 1

               itauq = itau

               itaup = itauq + n

               nwork = itaup + n

*

*              Bidiagonalize R in A

*              (CWorkspace: need 3*N, prefer 2*N+2*N*NB)

*              (RWorkspace: need N)

*

               CALL cgebrd( n, n, a, lda, s, rwork( ie ), work( itauq ),

     $                      work( itaup ), work( nwork ), lwork-nwork+1,

     $                      ierr )

               iru = ie + n

               irvt = iru + n*n

               nrwork = irvt + n*n

*

*              Perform bidiagonal SVD, computing left singular vectors

*              of bidiagonal matrix in RWORK(IRU) and computing right

*              singular vectors of bidiagonal matrix in RWORK(IRVT)

*              (CWorkspace: need 0)

*              (RWorkspace: need BDSPAC)

*

               CALL sbdsdc( 'U', 'I', n, s, rwork( ie ), rwork( iru ),

     $                      n, rwork( irvt ), n, dum, idum,

     $                      rwork( nrwork ), iwork, info )

*

*              Copy real matrix RWORK(IRU) to complex matrix WORK(IU)

*              Overwrite WORK(IU) by left singular vectors of R

*              (CWorkspace: need N*N+3*N, prefer N*N+2*N+N*NB)

*              (RWorkspace: 0)

*

               CALL clacp2( 'F', n, n, rwork( iru ), n, work( iu ),

     $                      ldwrku )

               CALL cunmbr( 'Q', 'L', 'N', n, n, n, a, lda,

     $                      work( itauq ), work( iu ), ldwrku,

     $                      work( nwork ), lwork-nwork+1, ierr )

*

*              Copy real matrix RWORK(IRVT) to complex matrix VT

*              Overwrite VT by right singular vectors of R

*              (CWorkspace: need 3*N, prefer 2*N+N*NB)

*              (RWorkspace: 0)

*

               CALL clacp2( 'F', n, n, rwork( irvt ), n, vt, ldvt )

               CALL cunmbr( 'P', 'R', 'C', n, n, n, a, lda,

     $                      work( itaup ), vt, ldvt, work( nwork ),

     $                      lwork-nwork+1, ierr )

*

*              Multiply Q in U by left singular vectors of R in

*              WORK(IU), storing result in A

*              (CWorkspace: need N*N)

*              (RWorkspace: 0)

*

               CALL cgemm( 'N', 'N', m, n, n, cone, u, ldu, work( iu ),

     $                     ldwrku, czero, a, lda )

*

*              Copy left singular vectors of A from A to U

*

               CALL clacpy( 'F', m, n, a, lda, u, ldu )

*

            END IF

*

         ELSE IF( m.GE.mnthr2 ) THEN

*

*           MNTHR2 <= M < MNTHR1

*

*           Path 5 (M much larger than N, but not as much as MNTHR1)

*           Reduce to bidiagonal form without QR decomposition, use

*           CUNGBR and matrix multiplication to compute singular vectors

*

            ie = 1

            nrwork = ie + n

            itauq = 1

            itaup = itauq + n

            nwork = itaup + n

*

*           Bidiagonalize A

*           (CWorkspace: need 2*N+M, prefer 2*N+(M+N)*NB)

*           (RWorkspace: need N)

*

            CALL cgebrd( m, n, a, lda, s, rwork( ie ), work( itauq ),

     $                   work( itaup ), work( nwork ), lwork-nwork+1,

     $                   ierr )

            IF( wntqn ) THEN

*

*              Compute singular values only

*              (Cworkspace: 0)

*              (Rworkspace: need BDSPAN)

*

               CALL sbdsdc( 'U', 'N', n, s, rwork( ie ), dum, 1, dum, 1,

     $                      dum, idum, rwork( nrwork ), iwork, info )

            ELSE IF( wntqo ) THEN

               iu = nwork

               iru = nrwork

               irvt = iru + n*n

               nrwork = irvt + n*n

*

*              Copy A to VT, generate P**H

*              (Cworkspace: need 2*N, prefer N+N*NB)

*              (Rworkspace: 0)

*

               CALL clacpy( 'U', n, n, a, lda, vt, ldvt )

               CALL cungbr( 'P', n, n, n, vt, ldvt, work( itaup ),

     $                      work( nwork ), lwork-nwork+1, ierr )

*

*              Generate Q in A

*              (CWorkspace: need 2*N, prefer N+N*NB)

*              (RWorkspace: 0)

*

               CALL cungbr( 'Q', m, n, n, a, lda, work( itauq ),

     $                      work( nwork ), lwork-nwork+1, ierr )

*

               IF( lwork.GE.m*n+3*n ) THEN

*

*                 WORK( IU ) is M by N

*

                  ldwrku = m

               ELSE

*

*                 WORK(IU) is LDWRKU by N

*

                  ldwrku = ( lwork-3*n ) / n

               END IF

               nwork = iu + ldwrku*n

*

*              Perform bidiagonal SVD, computing left singular vectors

*              of bidiagonal matrix in RWORK(IRU) and computing right

*              singular vectors of bidiagonal matrix in RWORK(IRVT)

*              (CWorkspace: need 0)

*              (RWorkspace: need BDSPAC)

*

               CALL sbdsdc( 'U', 'I', n, s, rwork( ie ), rwork( iru ),

     $                      n, rwork( irvt ), n, dum, idum,

     $                      rwork( nrwork ), iwork, info )

*

*              Multiply real matrix RWORK(IRVT) by P**H in VT,

*              storing the result in WORK(IU), copying to VT

*              (Cworkspace: need 0)

*              (Rworkspace: need 3*N*N)

*

               CALL clarcm( n, n, rwork( irvt ), n, vt, ldvt,

     $                      work( iu ), ldwrku, rwork( nrwork ) )

               CALL clacpy( 'F', n, n, work( iu ), ldwrku, vt, ldvt )

*

*              Multiply Q in A by real matrix RWORK(IRU), storing the

*              result in WORK(IU), copying to A

*              (CWorkspace: need N*N, prefer M*N)

*              (Rworkspace: need 3*N*N, prefer N*N+2*M*N)

*

               nrwork = irvt

               DO 20 i = 1, m, ldwrku

                  chunk = min( m-i+1, ldwrku )

                  CALL clacrm( chunk, n, a( i, 1 ), lda, rwork( iru ),

     $                         n, work( iu ), ldwrku, rwork( nrwork ) )

                  CALL clacpy( 'F', chunk, n, work( iu ), ldwrku,

     $                         a( i, 1 ), lda )

   20          continue

*

            ELSE IF( wntqs ) THEN

*

*              Copy A to VT, generate P**H

*              (Cworkspace: need 2*N, prefer N+N*NB)

*              (Rworkspace: 0)

*

               CALL clacpy( 'U', n, n, a, lda, vt, ldvt )

               CALL cungbr( 'P', n, n, n, vt, ldvt, work( itaup ),

     $                      work( nwork ), lwork-nwork+1, ierr )

*

*              Copy A to U, generate Q

*              (Cworkspace: need 2*N, prefer N+N*NB)

*              (Rworkspace: 0)

*

               CALL clacpy( 'L', m, n, a, lda, u, ldu )

               CALL cungbr( 'Q', m, n, n, u, ldu, work( itauq ),

     $                      work( nwork ), lwork-nwork+1, ierr )

*

*              Perform bidiagonal SVD, computing left singular vectors

*              of bidiagonal matrix in RWORK(IRU) and computing right

*              singular vectors of bidiagonal matrix in RWORK(IRVT)

*              (CWorkspace: need 0)

*              (RWorkspace: need BDSPAC)

*

               iru = nrwork

               irvt = iru + n*n

               nrwork = irvt + n*n

               CALL sbdsdc( 'U', 'I', n, s, rwork( ie ), rwork( iru ),

     $                      n, rwork( irvt ), n, dum, idum,

     $                      rwork( nrwork ), iwork, info )

*

*              Multiply real matrix RWORK(IRVT) by P**H in VT,

*              storing the result in A, copying to VT

*              (Cworkspace: need 0)

*              (Rworkspace: need 3*N*N)

*

               CALL clarcm( n, n, rwork( irvt ), n, vt, ldvt, a, lda,

     $                      rwork( nrwork ) )

               CALL clacpy( 'F', n, n, a, lda, vt, ldvt )

*

*              Multiply Q in U by real matrix RWORK(IRU), storing the

*              result in A, copying to U

*              (CWorkspace: need 0)

*              (Rworkspace: need N*N+2*M*N)

*

               nrwork = irvt

               CALL clacrm( m, n, u, ldu, rwork( iru ), n, a, lda,

     $                      rwork( nrwork ) )

               CALL clacpy( 'F', m, n, a, lda, u, ldu )

            ELSE

*

*              Copy A to VT, generate P**H

*              (Cworkspace: need 2*N, prefer N+N*NB)

*              (Rworkspace: 0)

*

               CALL clacpy( 'U', n, n, a, lda, vt, ldvt )

               CALL cungbr( 'P', n, n, n, vt, ldvt, work( itaup ),

     $                      work( nwork ), lwork-nwork+1, ierr )

*

*              Copy A to U, generate Q

*              (Cworkspace: need 2*N, prefer N+N*NB)

*              (Rworkspace: 0)

*

               CALL clacpy( 'L', m, n, a, lda, u, ldu )

               CALL cungbr( 'Q', m, m, n, u, ldu, work( itauq ),

     $                      work( nwork ), lwork-nwork+1, ierr )

*

*              Perform bidiagonal SVD, computing left singular vectors

*              of bidiagonal matrix in RWORK(IRU) and computing right

*              singular vectors of bidiagonal matrix in RWORK(IRVT)

*              (CWorkspace: need 0)

*              (RWorkspace: need BDSPAC)

*

               iru = nrwork

               irvt = iru + n*n

               nrwork = irvt + n*n

               CALL sbdsdc( 'U', 'I', n, s, rwork( ie ), rwork( iru ),

     $                      n, rwork( irvt ), n, dum, idum,

     $                      rwork( nrwork ), iwork, info )

*

*              Multiply real matrix RWORK(IRVT) by P**H in VT,

*              storing the result in A, copying to VT

*              (Cworkspace: need 0)

*              (Rworkspace: need 3*N*N)

*

               CALL clarcm( n, n, rwork( irvt ), n, vt, ldvt, a, lda,

     $                      rwork( nrwork ) )

               CALL clacpy( 'F', n, n, a, lda, vt, ldvt )

*

*              Multiply Q in U by real matrix RWORK(IRU), storing the

*              result in A, copying to U

*              (CWorkspace: 0)

*              (Rworkspace: need 3*N*N)

*

               nrwork = irvt

               CALL clacrm( m, n, u, ldu, rwork( iru ), n, a, lda,

     $                      rwork( nrwork ) )

               CALL clacpy( 'F', m, n, a, lda, u, ldu )

            END IF

*

         ELSE

*

*           M .LT. MNTHR2

*

*           Path 6 (M at least N, but not much larger)

*           Reduce to bidiagonal form without QR decomposition

*           Use CUNMBR to compute singular vectors

*

            ie = 1

            nrwork = ie + n

            itauq = 1

            itaup = itauq + n

            nwork = itaup + n

*

*           Bidiagonalize A

*           (CWorkspace: need 2*N+M, prefer 2*N+(M+N)*NB)

*           (RWorkspace: need N)

*

            CALL cgebrd( m, n, a, lda, s, rwork( ie ), work( itauq ),

     $                   work( itaup ), work( nwork ), lwork-nwork+1,

     $                   ierr )

            IF( wntqn ) THEN

*

*              Compute singular values only

*              (Cworkspace: 0)

*              (Rworkspace: need BDSPAN)

*

               CALL sbdsdc( 'U', 'N', n, s, rwork( ie ), dum, 1, dum, 1,

     $                      dum, idum, rwork( nrwork ), iwork, info )

            ELSE IF( wntqo ) THEN

               iu = nwork

               iru = nrwork

               irvt = iru + n*n

               nrwork = irvt + n*n

               IF( lwork.GE.m*n+3*n ) THEN

*

*                 WORK( IU ) is M by N

*

                  ldwrku = m

               ELSE

*

*                 WORK( IU ) is LDWRKU by N

*

                  ldwrku = ( lwork-3*n ) / n

               END IF

               nwork = iu + ldwrku*n

*

*              Perform bidiagonal SVD, computing left singular vectors

*              of bidiagonal matrix in RWORK(IRU) and computing right

*              singular vectors of bidiagonal matrix in RWORK(IRVT)

*              (CWorkspace: need 0)

*              (RWorkspace: need BDSPAC)

*

               CALL sbdsdc( 'U', 'I', n, s, rwork( ie ), rwork( iru ),

     $                      n, rwork( irvt ), n, dum, idum,

     $                      rwork( nrwork ), iwork, info )

*

*              Copy real matrix RWORK(IRVT) to complex matrix VT

*              Overwrite VT by right singular vectors of A

*              (Cworkspace: need 2*N, prefer N+N*NB)

*              (Rworkspace: need 0)

*

               CALL clacp2( 'F', n, n, rwork( irvt ), n, vt, ldvt )

               CALL cunmbr( 'P', 'R', 'C', n, n, n, a, lda,

     $                      work( itaup ), vt, ldvt, work( nwork ),

     $                      lwork-nwork+1, ierr )

*

               IF( lwork.GE.m*n+3*n ) THEN

*

*              Copy real matrix RWORK(IRU) to complex matrix WORK(IU)

*              Overwrite WORK(IU) by left singular vectors of A, copying

*              to A

*              (Cworkspace: need M*N+2*N, prefer M*N+N+N*NB)

*              (Rworkspace: need 0)

*

                  CALL claset( 'F', m, n, czero, czero, work( iu ),

     $                         ldwrku )

                  CALL clacp2( 'F', n, n, rwork( iru ), n, work( iu ),

     $                         ldwrku )

                  CALL cunmbr( 'Q', 'L', 'N', m, n, n, a, lda,

     $                         work( itauq ), work( iu ), ldwrku,

     $                         work( nwork ), lwork-nwork+1, ierr )

                  CALL clacpy( 'F', m, n, work( iu ), ldwrku, a, lda )

               ELSE

*

*                 Generate Q in A

*                 (Cworkspace: need 2*N, prefer N+N*NB)

*                 (Rworkspace: need 0)

*

                  CALL cungbr( 'Q', m, n, n, a, lda, work( itauq ),

     $                         work( nwork ), lwork-nwork+1, ierr )

*

*                 Multiply Q in A by real matrix RWORK(IRU), storing the

*                 result in WORK(IU), copying to A

*                 (CWorkspace: need N*N, prefer M*N)

*                 (Rworkspace: need 3*N*N, prefer N*N+2*M*N)

*

                  nrwork = irvt

                  DO 30 i = 1, m, ldwrku

                     chunk = min( m-i+1, ldwrku )

                     CALL clacrm( chunk, n, a( i, 1 ), lda,

     $                            rwork( iru ), n, work( iu ), ldwrku,

     $                            rwork( nrwork ) )

                     CALL clacpy( 'F', chunk, n, work( iu ), ldwrku,

     $                            a( i, 1 ), lda )

   30             continue

               END IF

*

            ELSE IF( wntqs ) THEN

*

*              Perform bidiagonal SVD, computing left singular vectors

*              of bidiagonal matrix in RWORK(IRU) and computing right

*              singular vectors of bidiagonal matrix in RWORK(IRVT)

*              (CWorkspace: need 0)

*              (RWorkspace: need BDSPAC)

*

               iru = nrwork

               irvt = iru + n*n

               nrwork = irvt + n*n

               CALL sbdsdc( 'U', 'I', n, s, rwork( ie ), rwork( iru ),

     $                      n, rwork( irvt ), n, dum, idum,

     $                      rwork( nrwork ), iwork, info )

*

*              Copy real matrix RWORK(IRU) to complex matrix U

*              Overwrite U by left singular vectors of A

*              (CWorkspace: need 3*N, prefer 2*N+N*NB)

*              (RWorkspace: 0)

*

               CALL claset( 'F', m, n, czero, czero, u, ldu )

               CALL clacp2( 'F', n, n, rwork( iru ), n, u, ldu )

               CALL cunmbr( 'Q', 'L', 'N', m, n, n, a, lda,

     $                      work( itauq ), u, ldu, work( nwork ),

     $                      lwork-nwork+1, ierr )

*

*              Copy real matrix RWORK(IRVT) to complex matrix VT

*              Overwrite VT by right singular vectors of A

*              (CWorkspace: need 3*N, prefer 2*N+N*NB)

*              (RWorkspace: 0)

*

               CALL clacp2( 'F', n, n, rwork( irvt ), n, vt, ldvt )

               CALL cunmbr( 'P', 'R', 'C', n, n, n, a, lda,

     $                      work( itaup ), vt, ldvt, work( nwork ),

     $                      lwork-nwork+1, ierr )

            ELSE

*

*              Perform bidiagonal SVD, computing left singular vectors

*              of bidiagonal matrix in RWORK(IRU) and computing right

*              singular vectors of bidiagonal matrix in RWORK(IRVT)

*              (CWorkspace: need 0)

*              (RWorkspace: need BDSPAC)

*

               iru = nrwork

               irvt = iru + n*n

               nrwork = irvt + n*n

               CALL sbdsdc( 'U', 'I', n, s, rwork( ie ), rwork( iru ),

     $                      n, rwork( irvt ), n, dum, idum,

     $                      rwork( nrwork ), iwork, info )

*

*              Set the right corner of U to identity matrix

*

               CALL claset( 'F', m, m, czero, czero, u, ldu )

               IF( m.GT.n ) THEN

                  CALL claset( 'F', m-n, m-n, czero, cone,

     $                         u( n+1, n+1 ), ldu )

               END IF

*

*              Copy real matrix RWORK(IRU) to complex matrix U

*              Overwrite U by left singular vectors of A

*              (CWorkspace: need 2*N+M, prefer 2*N+M*NB)

*              (RWorkspace: 0)

*

               CALL clacp2( 'F', n, n, rwork( iru ), n, u, ldu )

               CALL cunmbr( 'Q', 'L', 'N', m, m, n, a, lda,

     $                      work( itauq ), u, ldu, work( nwork ),

     $                      lwork-nwork+1, ierr )

*

*              Copy real matrix RWORK(IRVT) to complex matrix VT

*              Overwrite VT by right singular vectors of A

*              (CWorkspace: need 3*N, prefer 2*N+N*NB)

*              (RWorkspace: 0)

*

               CALL clacp2( 'F', n, n, rwork( irvt ), n, vt, ldvt )

               CALL cunmbr( 'P', 'R', 'C', n, n, n, a, lda,

     $                      work( itaup ), vt, ldvt, work( nwork ),

     $                      lwork-nwork+1, ierr )

            END IF

*

         END IF

*

      ELSE

*

*        A has more columns than rows. If A has sufficiently more

*        columns than rows, first reduce using the LQ decomposition (if

*        sufficient workspace available)

*

         IF( n.GE.mnthr1 ) THEN

*

            IF( wntqn ) THEN

*

*              Path 1t (N much larger than M, JOBZ='N')

*              No singular vectors to be computed

*

               itau = 1

               nwork = itau + m

*

*              Compute A=L*Q

*              (CWorkspace: need 2*M, prefer M+M*NB)

*              (RWorkspace: 0)

*

               CALL cgelqf( m, n, a, lda, work( itau ), work( nwork ),

     $                      lwork-nwork+1, ierr )

*

*              Zero out above L

*

               CALL claset( 'U', m-1, m-1, czero, czero, a( 1, 2 ),

     $                      lda )

               ie = 1

               itauq = 1

               itaup = itauq + m

               nwork = itaup + m

*

*              Bidiagonalize L in A

*              (CWorkspace: need 3*M, prefer 2*M+2*M*NB)

*              (RWorkspace: need M)

*

               CALL cgebrd( m, m, a, lda, s, rwork( ie ), work( itauq ),

     $                      work( itaup ), work( nwork ), lwork-nwork+1,

     $                      ierr )

               nrwork = ie + m

*

*              Perform bidiagonal SVD, compute singular values only

*              (CWorkspace: 0)

*              (RWorkspace: need BDSPAN)

*

               CALL sbdsdc( 'U', 'N', m, s, rwork( ie ), dum, 1, dum, 1,

     $                      dum, idum, rwork( nrwork ), iwork, info )

*

            ELSE IF( wntqo ) THEN

*

*              Path 2t (N much larger than M, JOBZ='O')

*              M right singular vectors to be overwritten on A and

*              M left singular vectors to be computed in U

*

               ivt = 1

               ldwkvt = m

*

*              WORK(IVT) is M by M

*

               il = ivt + ldwkvt*m

               IF( lwork.GE.m*n+m*m+3*m ) THEN

*

*                 WORK(IL) M by N

*

                  ldwrkl = m

                  chunk = n

               ELSE

*

*                 WORK(IL) is M by CHUNK

*

                  ldwrkl = m

                  chunk = ( lwork-m*m-3*m ) / m

               END IF

               itau = il + ldwrkl*chunk

               nwork = itau + m

*

*              Compute A=L*Q

*              (CWorkspace: need 2*M, prefer M+M*NB)

*              (RWorkspace: 0)

*

               CALL cgelqf( m, n, a, lda, work( itau ), work( nwork ),

     $                      lwork-nwork+1, ierr )

*

*              Copy L to WORK(IL), zeroing about above it

*

               CALL clacpy( 'L', m, m, a, lda, work( il ), ldwrkl )

               CALL claset( 'U', m-1, m-1, czero, czero,

     $                      work( il+ldwrkl ), ldwrkl )

*

*              Generate Q in A

*              (CWorkspace: need M*M+2*M, prefer M*M+M+M*NB)

*              (RWorkspace: 0)

*

               CALL cunglq( m, n, m, a, lda, work( itau ),

     $                      work( nwork ), lwork-nwork+1, ierr )

               ie = 1

               itauq = itau

               itaup = itauq + m

               nwork = itaup + m

*

*              Bidiagonalize L in WORK(IL)

*              (CWorkspace: need M*M+3*M, prefer M*M+2*M+2*M*NB)

*              (RWorkspace: need M)

*

               CALL cgebrd( m, m, work( il ), ldwrkl, s, rwork( ie ),

     $                      work( itauq ), work( itaup ), work( nwork ),

     $                      lwork-nwork+1, ierr )

*

*              Perform bidiagonal SVD, computing left singular vectors

*              of bidiagonal matrix in RWORK(IRU) and computing right

*              singular vectors of bidiagonal matrix in RWORK(IRVT)

*              (CWorkspace: need 0)

*              (RWorkspace: need BDSPAC)

*

               iru = ie + m

               irvt = iru + m*m

               nrwork = irvt + m*m

               CALL sbdsdc( 'U', 'I', m, s, rwork( ie ), rwork( iru ),

     $                      m, rwork( irvt ), m, dum, idum,

     $                      rwork( nrwork ), iwork, info )

*

*              Copy real matrix RWORK(IRU) to complex matrix WORK(IU)

*              Overwrite WORK(IU) by the left singular vectors of L

*              (CWorkspace: need N*N+3*N, prefer M*N+2*N+N*NB)

*              (RWorkspace: 0)

*

               CALL clacp2( 'F', m, m, rwork( iru ), m, u, ldu )

               CALL cunmbr( 'Q', 'L', 'N', m, m, m, work( il ), ldwrkl,

     $                      work( itauq ), u, ldu, work( nwork ),

     $                      lwork-nwork+1, ierr )

*

*              Copy real matrix RWORK(IRVT) to complex matrix WORK(IVT)

*              Overwrite WORK(IVT) by the right singular vectors of L

*              (CWorkspace: need N*N+3*N, prefer M*N+2*N+N*NB)

*              (RWorkspace: 0)

*

               CALL clacp2( 'F', m, m, rwork( irvt ), m, work( ivt ),

     $                      ldwkvt )

               CALL cunmbr( 'P', 'R', 'C', m, m, m, work( il ), ldwrkl,

     $                      work( itaup ), work( ivt ), ldwkvt,

     $                      work( nwork ), lwork-nwork+1, ierr )

*

*              Multiply right singular vectors of L in WORK(IL) by Q

*              in A, storing result in WORK(IL) and copying to A

*              (CWorkspace: need 2*M*M, prefer M*M+M*N))

*              (RWorkspace: 0)

*

               DO 40 i = 1, n, chunk

                  blk = min( n-i+1, chunk )

                  CALL cgemm( 'N', 'N', m, blk, m, cone, work( ivt ), m,

     $                        a( 1, i ), lda, czero, work( il ),

     $                        ldwrkl )

                  CALL clacpy( 'F', m, blk, work( il ), ldwrkl,

     $                         a( 1, i ), lda )

   40          continue

*

            ELSE IF( wntqs ) THEN

*

*             Path 3t (N much larger than M, JOBZ='S')

*             M right singular vectors to be computed in VT and

*             M left singular vectors to be computed in U

*

               il = 1

*

*              WORK(IL) is M by M

*

               ldwrkl = m

               itau = il + ldwrkl*m

               nwork = itau + m

*

*              Compute A=L*Q

*              (CWorkspace: need 2*M, prefer M+M*NB)

*              (RWorkspace: 0)

*

               CALL cgelqf( m, n, a, lda, work( itau ), work( nwork ),

     $                      lwork-nwork+1, ierr )

*

*              Copy L to WORK(IL), zeroing out above it

*

               CALL clacpy( 'L', m, m, a, lda, work( il ), ldwrkl )

               CALL claset( 'U', m-1, m-1, czero, czero,

     $                      work( il+ldwrkl ), ldwrkl )

*

*              Generate Q in A

*              (CWorkspace: need M*M+2*M, prefer M*M+M+M*NB)

*              (RWorkspace: 0)

*

               CALL cunglq( m, n, m, a, lda, work( itau ),

     $                      work( nwork ), lwork-nwork+1, ierr )

               ie = 1

               itauq = itau

               itaup = itauq + m

               nwork = itaup + m

*

*              Bidiagonalize L in WORK(IL)

*              (CWorkspace: need M*M+3*M, prefer M*M+2*M+2*M*NB)

*              (RWorkspace: need M)

*

               CALL cgebrd( m, m, work( il ), ldwrkl, s, rwork( ie ),

     $                      work( itauq ), work( itaup ), work( nwork ),

     $                      lwork-nwork+1, ierr )

*

*              Perform bidiagonal SVD, computing left singular vectors

*              of bidiagonal matrix in RWORK(IRU) and computing right

*              singular vectors of bidiagonal matrix in RWORK(IRVT)

*              (CWorkspace: need 0)

*              (RWorkspace: need BDSPAC)

*

               iru = ie + m

               irvt = iru + m*m

               nrwork = irvt + m*m

               CALL sbdsdc( 'U', 'I', m, s, rwork( ie ), rwork( iru ),

     $                      m, rwork( irvt ), m, dum, idum,

     $                      rwork( nrwork ), iwork, info )

*

*              Copy real matrix RWORK(IRU) to complex matrix U

*              Overwrite U by left singular vectors of L

*              (CWorkspace: need M*M+3*M, prefer M*M+2*M+M*NB)

*              (RWorkspace: 0)

*

               CALL clacp2( 'F', m, m, rwork( iru ), m, u, ldu )

               CALL cunmbr( 'Q', 'L', 'N', m, m, m, work( il ), ldwrkl,

     $                      work( itauq ), u, ldu, work( nwork ),

     $                      lwork-nwork+1, ierr )

*

*              Copy real matrix RWORK(IRVT) to complex matrix VT

*              Overwrite VT by left singular vectors of L

*              (CWorkspace: need M*M+3*M, prefer M*M+2*M+M*NB)

*              (RWorkspace: 0)

*

               CALL clacp2( 'F', m, m, rwork( irvt ), m, vt, ldvt )

               CALL cunmbr( 'P', 'R', 'C', m, m, m, work( il ), ldwrkl,

     $                      work( itaup ), vt, ldvt, work( nwork ),

     $                      lwork-nwork+1, ierr )

*

*              Copy VT to WORK(IL), multiply right singular vectors of L

*              in WORK(IL) by Q in A, storing result in VT

*              (CWorkspace: need M*M)

*              (RWorkspace: 0)

*

               CALL clacpy( 'F', m, m, vt, ldvt, work( il ), ldwrkl )

               CALL cgemm( 'N', 'N', m, n, m, cone, work( il ), ldwrkl,

     $                     a, lda, czero, vt, ldvt )

*

            ELSE IF( wntqa ) THEN

*

*              Path 9t (N much larger than M, JOBZ='A')

*              N right singular vectors to be computed in VT and

*              M left singular vectors to be computed in U

*

               ivt = 1

*

*              WORK(IVT) is M by M

*

               ldwkvt = m

               itau = ivt + ldwkvt*m

               nwork = itau + m

*

*              Compute A=L*Q, copying result to VT

*              (CWorkspace: need 2*M, prefer M+M*NB)

*              (RWorkspace: 0)

*

               CALL cgelqf( m, n, a, lda, work( itau ), work( nwork ),

     $                      lwork-nwork+1, ierr )

               CALL clacpy( 'U', m, n, a, lda, vt, ldvt )

*

*              Generate Q in VT

*              (CWorkspace: need M+N, prefer M+N*NB)

*              (RWorkspace: 0)

*

               CALL cunglq( n, n, m, vt, ldvt, work( itau ),

     $                      work( nwork ), lwork-nwork+1, ierr )

*

*              Produce L in A, zeroing out above it

*

               CALL claset( 'U', m-1, m-1, czero, czero, a( 1, 2 ),

     $                      lda )

               ie = 1

               itauq = itau

               itaup = itauq + m

               nwork = itaup + m

*

*              Bidiagonalize L in A

*              (CWorkspace: need M*M+3*M, prefer M*M+2*M+2*M*NB)

*              (RWorkspace: need M)

*

               CALL cgebrd( m, m, a, lda, s, rwork( ie ), work( itauq ),

     $                      work( itaup ), work( nwork ), lwork-nwork+1,

     $                      ierr )

*

*              Perform bidiagonal SVD, computing left singular vectors

*              of bidiagonal matrix in RWORK(IRU) and computing right

*              singular vectors of bidiagonal matrix in RWORK(IRVT)

*              (CWorkspace: need 0)

*              (RWorkspace: need BDSPAC)

*

               iru = ie + m

               irvt = iru + m*m

               nrwork = irvt + m*m

               CALL sbdsdc( 'U', 'I', m, s, rwork( ie ), rwork( iru ),

     $                      m, rwork( irvt ), m, dum, idum,

     $                      rwork( nrwork ), iwork, info )

*

*              Copy real matrix RWORK(IRU) to complex matrix U

*              Overwrite U by left singular vectors of L

*              (CWorkspace: need 3*M, prefer 2*M+M*NB)

*              (RWorkspace: 0)

*

               CALL clacp2( 'F', m, m, rwork( iru ), m, u, ldu )

               CALL cunmbr( 'Q', 'L', 'N', m, m, m, a, lda,

     $                      work( itauq ), u, ldu, work( nwork ),

     $                      lwork-nwork+1, ierr )

*

*              Copy real matrix RWORK(IRVT) to complex matrix WORK(IVT)

*              Overwrite WORK(IVT) by right singular vectors of L

*              (CWorkspace: need M*M+3*M, prefer M*M+2*M+M*NB)

*              (RWorkspace: 0)

*

               CALL clacp2( 'F', m, m, rwork( irvt ), m, work( ivt ),

     $                      ldwkvt )

               CALL cunmbr( 'P', 'R', 'C', m, m, m, a, lda,

     $                      work( itaup ), work( ivt ), ldwkvt,

     $                      work( nwork ), lwork-nwork+1, ierr )

*

*              Multiply right singular vectors of L in WORK(IVT) by

*              Q in VT, storing result in A

*              (CWorkspace: need M*M)

*              (RWorkspace: 0)

*

               CALL cgemm( 'N', 'N', m, n, m, cone, work( ivt ),

     $                     ldwkvt, vt, ldvt, czero, a, lda )

*

*              Copy right singular vectors of A from A to VT

*

               CALL clacpy( 'F', m, n, a, lda, vt, ldvt )

*

            END IF

*

         ELSE IF( n.GE.mnthr2 ) THEN

*

*           MNTHR2 <= N < MNTHR1

*

*           Path 5t (N much larger than M, but not as much as MNTHR1)

*           Reduce to bidiagonal form without QR decomposition, use

*           CUNGBR and matrix multiplication to compute singular vectors

*

*

            ie = 1

            nrwork = ie + m

            itauq = 1

            itaup = itauq + m

            nwork = itaup + m

*

*           Bidiagonalize A

*           (CWorkspace: need 2*M+N, prefer 2*M+(M+N)*NB)

*           (RWorkspace: M)

*

            CALL cgebrd( m, n, a, lda, s, rwork( ie ), work( itauq ),

     $                   work( itaup ), work( nwork ), lwork-nwork+1,

     $                   ierr )

*

            IF( wntqn ) THEN

*

*              Compute singular values only

*              (Cworkspace: 0)

*              (Rworkspace: need BDSPAN)

*

               CALL sbdsdc( 'L', 'N', m, s, rwork( ie ), dum, 1, dum, 1,

     $                      dum, idum, rwork( nrwork ), iwork, info )

            ELSE IF( wntqo ) THEN

               irvt = nrwork

               iru = irvt + m*m

               nrwork = iru + m*m

               ivt = nwork

*

*              Copy A to U, generate Q

*              (Cworkspace: need 2*M, prefer M+M*NB)

*              (Rworkspace: 0)

*

               CALL clacpy( 'L', m, m, a, lda, u, ldu )

               CALL cungbr( 'Q', m, m, n, u, ldu, work( itauq ),

     $                      work( nwork ), lwork-nwork+1, ierr )

*

*              Generate P**H in A

*              (Cworkspace: need 2*M, prefer M+M*NB)

*              (Rworkspace: 0)

*

               CALL cungbr( 'P', m, n, m, a, lda, work( itaup ),

     $                      work( nwork ), lwork-nwork+1, ierr )

*

               ldwkvt = m

               IF( lwork.GE.m*n+3*m ) THEN

*

*                 WORK( IVT ) is M by N

*

                  nwork = ivt + ldwkvt*n

                  chunk = n

               ELSE

*

*                 WORK( IVT ) is M by CHUNK

*

                  chunk = ( lwork-3*m ) / m

                  nwork = ivt + ldwkvt*chunk

               END IF

*

*              Perform bidiagonal SVD, computing left singular vectors

*              of bidiagonal matrix in RWORK(IRU) and computing right

*              singular vectors of bidiagonal matrix in RWORK(IRVT)

*              (CWorkspace: need 0)

*              (RWorkspace: need BDSPAC)

*

               CALL sbdsdc( 'L', 'I', m, s, rwork( ie ), rwork( iru ),

     $                      m, rwork( irvt ), m, dum, idum,

     $                      rwork( nrwork ), iwork, info )

*

*              Multiply Q in U by real matrix RWORK(IRVT)

*              storing the result in WORK(IVT), copying to U

*              (Cworkspace: need 0)

*              (Rworkspace: need 2*M*M)

*

               CALL clacrm( m, m, u, ldu, rwork( iru ), m, work( ivt ),

     $                      ldwkvt, rwork( nrwork ) )

               CALL clacpy( 'F', m, m, work( ivt ), ldwkvt, u, ldu )

*

*              Multiply RWORK(IRVT) by P**H in A, storing the

*              result in WORK(IVT), copying to A

*              (CWorkspace: need M*M, prefer M*N)

*              (Rworkspace: need 2*M*M, prefer 2*M*N)

*

               nrwork = iru

               DO 50 i = 1, n, chunk

                  blk = min( n-i+1, chunk )

                  CALL clarcm( m, blk, rwork( irvt ), m, a( 1, i ), lda,

     $                         work( ivt ), ldwkvt, rwork( nrwork ) )

                  CALL clacpy( 'F', m, blk, work( ivt ), ldwkvt,

     $                         a( 1, i ), lda )

   50          continue

            ELSE IF( wntqs ) THEN

*

*              Copy A to U, generate Q

*              (Cworkspace: need 2*M, prefer M+M*NB)

*              (Rworkspace: 0)

*

               CALL clacpy( 'L', m, m, a, lda, u, ldu )

               CALL cungbr( 'Q', m, m, n, u, ldu, work( itauq ),

     $                      work( nwork ), lwork-nwork+1, ierr )

*

*              Copy A to VT, generate P**H

*              (Cworkspace: need 2*M, prefer M+M*NB)

*              (Rworkspace: 0)

*

               CALL clacpy( 'U', m, n, a, lda, vt, ldvt )

               CALL cungbr( 'P', m, n, m, vt, ldvt, work( itaup ),

     $                      work( nwork ), lwork-nwork+1, ierr )

*

*              Perform bidiagonal SVD, computing left singular vectors

*              of bidiagonal matrix in RWORK(IRU) and computing right

*              singular vectors of bidiagonal matrix in RWORK(IRVT)

*              (CWorkspace: need 0)

*              (RWorkspace: need BDSPAC)

*

               irvt = nrwork

               iru = irvt + m*m

               nrwork = iru + m*m

               CALL sbdsdc( 'L', 'I', m, s, rwork( ie ), rwork( iru ),

     $                      m, rwork( irvt ), m, dum, idum,

     $                      rwork( nrwork ), iwork, info )

*

*              Multiply Q in U by real matrix RWORK(IRU), storing the

*              result in A, copying to U

*              (CWorkspace: need 0)

*              (Rworkspace: need 3*M*M)

*

               CALL clacrm( m, m, u, ldu, rwork( iru ), m, a, lda,

     $                      rwork( nrwork ) )

               CALL clacpy( 'F', m, m, a, lda, u, ldu )

*

*              Multiply real matrix RWORK(IRVT) by P**H in VT,

*              storing the result in A, copying to VT

*              (Cworkspace: need 0)

*              (Rworkspace: need M*M+2*M*N)

*

               nrwork = iru

               CALL clarcm( m, n, rwork( irvt ), m, vt, ldvt, a, lda,

     $                      rwork( nrwork ) )

               CALL clacpy( 'F', m, n, a, lda, vt, ldvt )

            ELSE

*

*              Copy A to U, generate Q

*              (Cworkspace: need 2*M, prefer M+M*NB)

*              (Rworkspace: 0)

*

               CALL clacpy( 'L', m, m, a, lda, u, ldu )

               CALL cungbr( 'Q', m, m, n, u, ldu, work( itauq ),

     $                      work( nwork ), lwork-nwork+1, ierr )

*

*              Copy A to VT, generate P**H

*              (Cworkspace: need 2*M, prefer M+M*NB)

*              (Rworkspace: 0)

*

               CALL clacpy( 'U', m, n, a, lda, vt, ldvt )

               CALL cungbr( 'P', n, n, m, vt, ldvt, work( itaup ),

     $                      work( nwork ), lwork-nwork+1, ierr )

*

*              Perform bidiagonal SVD, computing left singular vectors

*              of bidiagonal matrix in RWORK(IRU) and computing right

*              singular vectors of bidiagonal matrix in RWORK(IRVT)

*              (CWorkspace: need 0)

*              (RWorkspace: need BDSPAC)

*

               irvt = nrwork

               iru = irvt + m*m

               nrwork = iru + m*m

               CALL sbdsdc( 'L', 'I', m, s, rwork( ie ), rwork( iru ),

     $                      m, rwork( irvt ), m, dum, idum,

     $                      rwork( nrwork ), iwork, info )

*

*              Multiply Q in U by real matrix RWORK(IRU), storing the

*              result in A, copying to U

*              (CWorkspace: need 0)

*              (Rworkspace: need 3*M*M)

*

               CALL clacrm( m, m, u, ldu, rwork( iru ), m, a, lda,

     $                      rwork( nrwork ) )

               CALL clacpy( 'F', m, m, a, lda, u, ldu )

*

*              Multiply real matrix RWORK(IRVT) by P**H in VT,

*              storing the result in A, copying to VT

*              (Cworkspace: need 0)

*              (Rworkspace: need M*M+2*M*N)

*

               CALL clarcm( m, n, rwork( irvt ), m, vt, ldvt, a, lda,

     $                      rwork( nrwork ) )

               CALL clacpy( 'F', m, n, a, lda, vt, ldvt )

            END IF

*

         ELSE

*

*           N .LT. MNTHR2

*

*           Path 6t (N greater than M, but not much larger)

*           Reduce to bidiagonal form without LQ decomposition

*           Use CUNMBR to compute singular vectors

*

            ie = 1

            nrwork = ie + m

            itauq = 1

            itaup = itauq + m

            nwork = itaup + m

*

*           Bidiagonalize A

*           (CWorkspace: need 2*M+N, prefer 2*M+(M+N)*NB)

*           (RWorkspace: M)

*

            CALL cgebrd( m, n, a, lda, s, rwork( ie ), work( itauq ),

     $                   work( itaup ), work( nwork ), lwork-nwork+1,

     $                   ierr )

            IF( wntqn ) THEN

*

*              Compute singular values only

*              (Cworkspace: 0)

*              (Rworkspace: need BDSPAN)

*

               CALL sbdsdc( 'L', 'N', m, s, rwork( ie ), dum, 1, dum, 1,

     $                      dum, idum, rwork( nrwork ), iwork, info )

            ELSE IF( wntqo ) THEN

               ldwkvt = m

               ivt = nwork

               IF( lwork.GE.m*n+3*m ) THEN

*

*                 WORK( IVT ) is M by N

*

                  CALL claset( 'F', m, n, czero, czero, work( ivt ),

     $                         ldwkvt )

                  nwork = ivt + ldwkvt*n

               ELSE

*

*                 WORK( IVT ) is M by CHUNK

*

                  chunk = ( lwork-3*m ) / m

                  nwork = ivt + ldwkvt*chunk

               END IF

*

*              Perform bidiagonal SVD, computing left singular vectors

*              of bidiagonal matrix in RWORK(IRU) and computing right

*              singular vectors of bidiagonal matrix in RWORK(IRVT)

*              (CWorkspace: need 0)

*              (RWorkspace: need BDSPAC)

*

               irvt = nrwork

               iru = irvt + m*m

               nrwork = iru + m*m

               CALL sbdsdc( 'L', 'I', m, s, rwork( ie ), rwork( iru ),

     $                      m, rwork( irvt ), m, dum, idum,

     $                      rwork( nrwork ), iwork, info )

*

*              Copy real matrix RWORK(IRU) to complex matrix U

*              Overwrite U by left singular vectors of A

*              (Cworkspace: need 2*M, prefer M+M*NB)

*              (Rworkspace: need 0)

*

               CALL clacp2( 'F', m, m, rwork( iru ), m, u, ldu )

               CALL cunmbr( 'Q', 'L', 'N', m, m, n, a, lda,

     $                      work( itauq ), u, ldu, work( nwork ),

     $                      lwork-nwork+1, ierr )

*

               IF( lwork.GE.m*n+3*m ) THEN

*

*              Copy real matrix RWORK(IRVT) to complex matrix WORK(IVT)

*              Overwrite WORK(IVT) by right singular vectors of A,

*              copying to A

*              (Cworkspace: need M*N+2*M, prefer M*N+M+M*NB)

*              (Rworkspace: need 0)

*

                  CALL clacp2( 'F', m, m, rwork( irvt ), m, work( ivt ),

     $                         ldwkvt )

                  CALL cunmbr( 'P', 'R', 'C', m, n, m, a, lda,

     $                         work( itaup ), work( ivt ), ldwkvt,

     $                         work( nwork ), lwork-nwork+1, ierr )

                  CALL clacpy( 'F', m, n, work( ivt ), ldwkvt, a, lda )

               ELSE

*

*                 Generate P**H in A

*                 (Cworkspace: need 2*M, prefer M+M*NB)

*                 (Rworkspace: need 0)

*

                  CALL cungbr( 'P', m, n, m, a, lda, work( itaup ),

     $                         work( nwork ), lwork-nwork+1, ierr )

*

*                 Multiply Q in A by real matrix RWORK(IRU), storing the

*                 result in WORK(IU), copying to A

*                 (CWorkspace: need M*M, prefer M*N)

*                 (Rworkspace: need 3*M*M, prefer M*M+2*M*N)

*

                  nrwork = iru

                  DO 60 i = 1, n, chunk

                     blk = min( n-i+1, chunk )

                     CALL clarcm( m, blk, rwork( irvt ), m, a( 1, i ),

     $                            lda, work( ivt ), ldwkvt,

     $                            rwork( nrwork ) )

                     CALL clacpy( 'F', m, blk, work( ivt ), ldwkvt,

     $                            a( 1, i ), lda )

   60             continue

               END IF

            ELSE IF( wntqs ) THEN

*

*              Perform bidiagonal SVD, computing left singular vectors

*              of bidiagonal matrix in RWORK(IRU) and computing right

*              singular vectors of bidiagonal matrix in RWORK(IRVT)

*              (CWorkspace: need 0)

*              (RWorkspace: need BDSPAC)

*

               irvt = nrwork

               iru = irvt + m*m

               nrwork = iru + m*m

               CALL sbdsdc( 'L', 'I', m, s, rwork( ie ), rwork( iru ),

     $                      m, rwork( irvt ), m, dum, idum,

     $                      rwork( nrwork ), iwork, info )

*

*              Copy real matrix RWORK(IRU) to complex matrix U

*              Overwrite U by left singular vectors of A

*              (CWorkspace: need 3*M, prefer 2*M+M*NB)

*              (RWorkspace: M*M)

*

               CALL clacp2( 'F', m, m, rwork( iru ), m, u, ldu )

               CALL cunmbr( 'Q', 'L', 'N', m, m, n, a, lda,

     $                      work( itauq ), u, ldu, work( nwork ),

     $                      lwork-nwork+1, ierr )

*

*              Copy real matrix RWORK(IRVT) to complex matrix VT

*              Overwrite VT by right singular vectors of A

*              (CWorkspace: need 3*M, prefer 2*M+M*NB)

*              (RWorkspace: M*M)

*

               CALL claset( 'F', m, n, czero, czero, vt, ldvt )

               CALL clacp2( 'F', m, m, rwork( irvt ), m, vt, ldvt )

               CALL cunmbr( 'P', 'R', 'C', m, n, m, a, lda,

     $                      work( itaup ), vt, ldvt, work( nwork ),

     $                      lwork-nwork+1, ierr )

            ELSE

*

*              Perform bidiagonal SVD, computing left singular vectors

*              of bidiagonal matrix in RWORK(IRU) and computing right

*              singular vectors of bidiagonal matrix in RWORK(IRVT)

*              (CWorkspace: need 0)

*              (RWorkspace: need BDSPAC)

*

               irvt = nrwork

               iru = irvt + m*m

               nrwork = iru + m*m

*

               CALL sbdsdc( 'L', 'I', m, s, rwork( ie ), rwork( iru ),

     $                      m, rwork( irvt ), m, dum, idum,

     $                      rwork( nrwork ), iwork, info )

*

*              Copy real matrix RWORK(IRU) to complex matrix U

*              Overwrite U by left singular vectors of A

*              (CWorkspace: need 3*M, prefer 2*M+M*NB)

*              (RWorkspace: M*M)

*

               CALL clacp2( 'F', m, m, rwork( iru ), m, u, ldu )

               CALL cunmbr( 'Q', 'L', 'N', m, m, n, a, lda,

     $                      work( itauq ), u, ldu, work( nwork ),

     $                      lwork-nwork+1, ierr )

*

*              Set all of VT to identity matrix

*

               CALL claset( 'F', n, n, czero, cone, vt, ldvt )

*

*              Copy real matrix RWORK(IRVT) to complex matrix VT

*              Overwrite VT by right singular vectors of A

*              (CWorkspace: need 2*M+N, prefer 2*M+N*NB)

*              (RWorkspace: M*M)

*

               CALL clacp2( 'F', m, m, rwork( irvt ), m, vt, ldvt )

               CALL cunmbr( 'P', 'R', 'C', n, n, m, a, lda,

     $                      work( itaup ), vt, ldvt, work( nwork ),

     $                      lwork-nwork+1, ierr )

            END IF

*

         END IF

*

      END IF

*

*     Undo scaling if necessary

*

      IF( iscl.EQ.1 ) THEN

         IF( anrm.GT.bignum )

     $      CALL slascl( 'G', 0, 0, bignum, anrm, minmn, 1, s, minmn,

     $                   ierr )

         IF( info.NE.0 .AND. anrm.GT.bignum )

     $      CALL slascl( 'G', 0, 0, bignum, anrm, minmn-1, 1,

     $                   rwork( ie ), minmn, ierr )

         IF( anrm.LT.smlnum )

     $      CALL slascl( 'G', 0, 0, smlnum, anrm, minmn, 1, s, minmn,

     $                   ierr )

         IF( info.NE.0 .AND. anrm.LT.smlnum )

     $      CALL slascl( 'G', 0, 0, smlnum, anrm, minmn-1, 1,

     $                   rwork( ie ), minmn, ierr )

      END IF

*

*     Return optimal workspace in WORK(1)

*

      work( 1 ) = maxwrk

*

      return

*

*     End of CGESDD

*

      END