dftfeDevelopers
diff --git a/‎CMakeLists.txt
Lines changed: 9 additions & 3 deletions b/‎CMakeLists.txt
Lines changed: 9 additions & 3 deletions
diff --git a/‎doc/manual/parameters.tex
Lines changed: 3 additions & 3 deletions b/‎doc/manual/parameters.tex
Lines changed: 3 additions & 3 deletions
diff --git a/‎helpers/MATRIXcluster/setupDevelopPetsc_MATRIX.sh
Lines changed: 4 additions & 3 deletions b/‎helpers/MATRIXcluster/setupDevelopPetsc_MATRIX.sh
Lines changed: 4 additions & 3 deletions
diff --git a/‎helpers/NERSCPerlmutter/setupUserPerlmutter.sh
Lines changed: 4 additions & 3 deletions b/‎helpers/NERSCPerlmutter/setupUserPerlmutter.sh
Lines changed: 4 additions & 3 deletions
diff --git a/‎helpers/NERSCPerlmutter/setupUserPerlmutterNoPetsc.sh
Lines changed: 7 additions & 6 deletions b/‎helpers/NERSCPerlmutter/setupUserPerlmutterNoPetsc.sh
Lines changed: 7 additions & 6 deletions
diff --git a/‎helpers/UMGreatLakes/setupDevelopPetscMDIInstall.sh
Lines changed: 4 additions & 2 deletions b/‎helpers/UMGreatLakes/setupDevelopPetscMDIInstall.sh
Lines changed: 4 additions & 2 deletions
diff --git a/‎include/AtomCenteredPseudoWavefunctionSpline.h
Lines changed: 4 additions & 4 deletions b/‎include/AtomCenteredPseudoWavefunctionSpline.h
Lines changed: 4 additions & 4 deletions
diff --git a/‎include/AtomCenteredSphericalFunctionBase.h
Lines changed: 6 additions & 4 deletions b/‎include/AtomCenteredSphericalFunctionBase.h
Lines changed: 6 additions & 4 deletions
diff --git a/‎include/AtomCenteredSphericalFunctionBessel.h
Lines changed: 4 additions & 4 deletions b/‎include/AtomCenteredSphericalFunctionBessel.h
Lines changed: 4 additions & 4 deletions
@@ -2,7 +2,8 @@
 #  CMakeList file for DFT-FE
 ##
 CMAKE_MINIMUM_REQUIRED(VERSION 3.17)
-set(CMAKE_CXX_STANDARD 17)
+set(CMAKE_CXX_STANDARD 17
+    CACHE STRING "Minimum required C++ standard (default is 17)")
 set(CMAKE_CXX_STANDARD_REQUIRED ON)
 set(CMAKE_INSTALL_RPATH_USE_LINK_PATH TRUE)
 # Set the name of the project and target:
@@ -88,6 +89,7 @@ SET(TARGET_SRC
   ./src/excManager/excDensityLDAClass.cpp
   ./src/excManager/excDensityGGAClass.cpp
   ./src/excManager/excDensityLLMGGAClass.cpp
+  ./src/excManager/excTauMGGAClass.cpp
   ./src/excManager/excManager.cpp
   ./src/excManager/AuxDensityMatrixFE.cpp
   ./src/excManager/ExcDFTPlusU.cpp
@@ -245,7 +247,7 @@ SET(DEVICE_SRC
   ./src/force/forceWfcContractionsDeviceKernels.cc
   ./utils/constraintMatrixInfoDeviceKernels.cc
   ./utils/DeviceAPICalls.cu.cc
-  ./utils/BLASWrapperDevice.cu.cc
+  ./utils/BLASWrapperDevice.cc
   ./utils/MPICommunicatorP2PKernelsDevice.cc
   ./src/solvers/linearSolverCGDeviceKernels.cc
   ./utils/matrixFreeDeviceKernels.cc
@@ -265,7 +267,7 @@ SET(DEVICE_SRC
   ./src/force/forceWfcContractionsDeviceKernels.cc
   ./utils/constraintMatrixInfoDeviceKernels.cc
   ./utils/DeviceAPICalls.hip.cc
-  ./utils/BLASWrapperDevice.hip.cc
+  ./utils/BLASWrapperDevice.cc
   ./utils/MPICommunicatorP2PKernelsDevice.cc
   ./src/solvers/linearSolverCGDeviceKernels.cc
   ./utils/matrixFreeDeviceKernels.cc
@@ -353,6 +355,10 @@ IF (HIGHERQUAD_PSP)
   ADD_DEFINITIONS(-DDFTFE_WITH_HIGHERQUAD_PSP)
 ENDIF()
 
+IF (USE_64BIT_INT)
+  ADD_DEFINITIONS(-DDFTFE_WITH_64BIT_INT)
+ENDIF()
+
 #
 #Set use complex/use real flag
 #
 
@@ -3067,13 +3067,13 @@ \subsection{Parameters in section \tt SCF parameters/Eigen-solver parameters}
 
 \index[prmindex]{SUBSPACE PROJ SHEP GPU}
 \index[prmindexfull]{SCF parameters!Eigen-solver parameters!SUBSPACE PROJ SHEP GPU}
-{\it Value:} true
+{\it Value:} false
 
 
-{\it Default:} true
+{\it Default:} false
 
 
-{\it Description:} [Advanced] Solve a standard hermitian eigenvalue problem in the Rayleigh Ritz step instead of a generalized hermitian eigenvalue problem on GPUs. Default setting is true.
+{\it Description:} [Advanced] Solve a standard hermitian eigenvalue problem in the Rayleigh Ritz step instead of a generalized hermitian eigenvalue problem on GPUs. Default setting is false.
 
 
 {\it Possible values:} A boolean value (true or false)
 
@@ -69,6 +69,7 @@ build_type=Release
 
 testing=ON
 minimal_compile=ON
+useInt64=$withGPU
 ###########################################################################
 #Usually, no changes are needed below this line
 #
@@ -94,7 +95,7 @@ function cmake_configure() {
     -DWITH_DCCL=$withDCCL -DCMAKE_PREFIX_PATH="$ELPA_PATH;$DCCL_PATH;$dftdpath;$numdiffdir"\
     -DWITH_COMPLEX=$withComplex -DWITH_GPU=$withGPU -DGPU_LANG=$gpuLang -DGPU_VENDOR=$gpuVendor -DWITH_GPU_AWARE_MPI=$withGPUAwareMPI -DCMAKE_CUDA_FLAGS="$device_flags" -DCMAKE_CUDA_ARCHITECTURES="$device_architectures"\
     -DWITH_TESTING=$testing -DMINIMAL_COMPILE=$minimal_compile\
-    -DHIGHERQUAD_PSP=$withHigherQuadPSP -DBUILD_SHARED_LIBS=ON $1
+    -DHIGHERQUAD_PSP=$withHigherQuadPSP -DBUILD_SHARED_LIBS=ON -DUSE_64BIT_INT=$useInt64 $1
   elif [ "$gpuLang" = "hip" ]; then
     cmake -DCMAKE_EXPORT_COMPILE_COMMANDS=TRUE -DCMAKE_CXX_STANDARD=17 -DCMAKE_CXX_COMPILER=$cxx_compiler\
     -DCMAKE_CXX_FLAGS="$cxx_flags"\
@@ -108,7 +109,7 @@ function cmake_configure() {
     -DWITH_DCCL=$withDCCL -DCMAKE_PREFIX_PATH="$ELPA_PATH;$DCCL_PATH;$dftdpath;$numdiffdir"\
     -DWITH_COMPLEX=$withComplex -DWITH_GPU=$withGPU -DGPU_LANG=$gpuLang -DGPU_VENDOR=$gpuVendor -DWITH_GPU_AWARE_MPI=$withGPUAwareMPI -DCMAKE_HIP_FLAGS="$device_flags" -DCMAKE_HIP_ARCHITECTURES="$device_architectures"\
     -DWITH_TESTING=$testing -DMINIMAL_COMPILE=$minimal_compile\
-    -DHIGHERQUAD_PSP=$withHigherQuadPSP -DBUILD_SHARED_LIBS=ON $1
+    -DHIGHERQUAD_PSP=$withHigherQuadPSP -DBUILD_SHARED_LIBS=ON -DUSE_64BIT_INT=$useInt64 $1
   else
     cmake -DCMAKE_EXPORT_COMPILE_COMMANDS=TRUE -DCMAKE_CXX_STANDARD=17 -DCMAKE_CXX_COMPILER=$cxx_compiler\
     -DCMAKE_CXX_FLAGS="$cxx_flags"\
@@ -122,7 +123,7 @@ function cmake_configure() {
     -DWITH_DCCL=$withDCCL -DCMAKE_PREFIX_PATH="$ELPA_PATH;$DCCL_PATH;$dftdpath;$numdiffdir"\
     -DWITH_COMPLEX=$withComplex \
     -DWITH_TESTING=$testing -DMINIMAL_COMPILE=$minimal_compile\
-    -DHIGHERQUAD_PSP=$withHigherQuadPSP -DBUILD_SHARED_LIBS=ON $1    
+    -DHIGHERQUAD_PSP=$withHigherQuadPSP -DBUILD_SHARED_LIBS=ON -DUSE_64BIT_INT=$useInt64 $1    
   fi
 }
 
 
@@ -63,6 +63,7 @@ build_type=Release
 
 testing=OFF
 minimal_compile=ON
+useInt64=$withGPU
 ###########################################################################
 #Usually, no changes are needed below this line
 #
@@ -89,7 +90,7 @@ function cmake_real() {
     -DWITH_COMPLEX=OFF -DWITH_GPU=$withGPU -DGPU_LANG=$gpuLang -DGPU_VENDOR=$gpuVendor -DWITH_GPU_AWARE_MPI=$withGPUAwareMPI -DCMAKE_CUDA_FLAGS="$device_flags" -DCMAKE_CUDA_ARCHITECTURES="$device_architectures"\
     -DCMAKE_SHARED_LINKER_FLAGS="-L$MPICH_DIR/lib -lmpich"\
     -DWITH_TESTING=$testing -DMINIMAL_COMPILE=$minimal_compile\
-    -DHIGHERQUAD_PSP=$withHigherQuadPSP $1
+    -DHIGHERQUAD_PSP=$withHigherQuadPSP -DUSE_64BIT_INT=$useInt64 $1
   elif [ "$gpuLang" = "hip" ]; then
     cmake -DCMAKE_CXX_STANDARD=14 -DCMAKE_CXX_COMPILER=$cxx_compiler\
     -DCMAKE_CXX_FLAGS="$cxx_flags"\
@@ -102,7 +103,7 @@ function cmake_real() {
     -DWITH_DCCL=$withDCCL -DCMAKE_PREFIX_PATH="$ELPA_PATH;$DCCL_PATH"\
     -DWITH_COMPLEX=OFF -DWITH_GPU=$withGPU -DGPU_LANG=$gpuLang -DGPU_VENDOR=$gpuVendor -DWITH_GPU_AWARE_MPI=$withGPUAwareMPI -DCMAKE_HIP_FLAGS="$device_flags" -DCMAKE_HIP_ARCHITECTURES="$device_architectures"\
     -DWITH_TESTING=$testing -DMINIMAL_COMPILE=$minimal_compile\
-    -DHIGHERQUAD_PSP=$withHigherQuadPSP $1
+    -DHIGHERQUAD_PSP=$withHigherQuadPSP -DUSE_64BIT_INT=$useInt64 $1
   else
     cmake -DCMAKE_CXX_STANDARD=14 -DCMAKE_CXX_COMPILER=$cxx_compiler\
     -DCMAKE_CXX_FLAGS="$cxx_flags"\
@@ -115,7 +116,7 @@ function cmake_real() {
     -DWITH_DCCL=$withDCCL -DCMAKE_PREFIX_PATH="$ELPA_PATH;$DCCL_PATH"\
     -DWITH_COMPLEX=OFF\
     -DWITH_TESTING=$testing -DMINIMAL_COMPILE=$minimal_compile\
-    -DHIGHERQUAD_PSP=$withHigherQuadPSP $1    
+    -DHIGHERQUAD_PSP=$withHigherQuadPSP -DUSE_64BIT_INT=$useInt64 $1    
   fi
 }
 
 
@@ -62,6 +62,7 @@ build_type=Release
 
 testing=OFF
 minimal_compile=OFF
+useInt64=$withGPU
 ###########################################################################
 #Usually, no changes are needed below this line
 #
@@ -88,7 +89,7 @@ function cmake_real() {
     -DWITH_COMPLEX=OFF -DWITH_GPU=$withGPU -DGPU_LANG=$gpuLang -DGPU_VENDOR=$gpuVendor -DWITH_GPU_AWARE_MPI=$withGPUAwareMPI -DCMAKE_CUDA_FLAGS="$device_flags" -DCMAKE_CUDA_ARCHITECTURES="$device_architectures"\
     -DCMAKE_SHARED_LINKER_FLAGS="-L$MPICH_DIR/lib -lmpich"\
     -DWITH_TESTING=$testing -DMINIMAL_COMPILE=$minimal_compile\
-    -DHIGHERQUAD_PSP=$withHigherQuadPSP $1
+    -DHIGHERQUAD_PSP=$withHigherQuadPSP -DUSE_64BIT_INT=$useInt64  $1
   elif [ "$gpuLang" = "hip" ]; then
     cmake -DCMAKE_CXX_STANDARD=14 -DCMAKE_CXX_COMPILER=$cxx_compiler\
     -DCMAKE_CXX_FLAGS="$cxx_flags"\
@@ -101,7 +102,7 @@ function cmake_real() {
     -DWITH_DCCL=$withDCCL -DCMAKE_PREFIX_PATH="$ELPA_PATH;$DCCL_PATH"\
     -DWITH_COMPLEX=OFF -DWITH_GPU=$withGPU -DGPU_LANG=$gpuLang -DGPU_VENDOR=$gpuVendor -DWITH_GPU_AWARE_MPI=$withGPUAwareMPI -DCMAKE_HIP_FLAGS="$device_flags" -DCMAKE_HIP_ARCHITECTURES="$device_architectures"\
     -DWITH_TESTING=$testing -DMINIMAL_COMPILE=$minimal_compile\
-    -DHIGHERQUAD_PSP=$withHigherQuadPSP $1
+    -DHIGHERQUAD_PSP=$withHigherQuadPSP -DUSE_64BIT_INT=$useInt64  $1
   else
     cmake -DCMAKE_CXX_STANDARD=14 -DCMAKE_CXX_COMPILER=$cxx_compiler\
     -DCMAKE_CXX_FLAGS="$cxx_flags"\
@@ -114,7 +115,7 @@ function cmake_real() {
     -DWITH_DCCL=$withDCCL -DCMAKE_PREFIX_PATH="$ELPA_PATH;$DCCL_PATH"\
     -DWITH_COMPLEX=OFF\
     -DWITH_TESTING=$testing -DMINIMAL_COMPILE=$minimal_compile\
-    -DHIGHERQUAD_PSP=$withHigherQuadPSP $1    
+    -DHIGHERQUAD_PSP=$withHigherQuadPSP -DUSE_64BIT_INT=$useInt64  $1    
   fi
 }
 
@@ -133,7 +134,7 @@ function cmake_cplx() {
     -DWITH_COMPLEX=ON -DWITH_GPU=$withGPU -DGPU_LANG=$gpuLang -DGPU_VENDOR=$gpuVendor -DWITH_GPU_AWARE_MPI=$withGPUAwareMPI -DCMAKE_CUDA_FLAGS="$device_flags" -DCMAKE_CUDA_ARCHITECTURES="$device_architectures"\
     -DCMAKE_SHARED_LINKER_FLAGS="-L$MPICH_DIR/lib -lmpich"\
     -DWITH_TESTING=$testing -DMINIMAL_COMPILE=$minimal_compile\
-    -DHIGHERQUAD_PSP=$withHigherQuadPSP $1
+    -DHIGHERQUAD_PSP=$withHigherQuadPSP -DUSE_64BIT_INT=$useInt64 $1
   elif [ "$gpuLang" = "hip" ]; then
     cmake -DCMAKE_CXX_STANDARD=14 -DCMAKE_CXX_COMPILER=$cxx_compiler\
     -DCMAKE_CXX_FLAGS="$cxx_flags"\
@@ -146,7 +147,7 @@ function cmake_cplx() {
     -DWITH_DCCL=$withDCCL -DCMAKE_PREFIX_PATH="$ELPA_PATH;$DCCL_PATH"\
     -DWITH_COMPLEX=ON -DWITH_GPU=$withGPU -DGPU_LANG=$gpuLang -DGPU_VENDOR=$gpuVendor -DWITH_GPU_AWARE_MPI=$withGPUAwareMPI -DCMAKE_HIP_FLAGS="$device_flags" -DCMAKE_HIP_ARCHITECTURES="$device_architectures"\
     -DWITH_TESTING=$testing -DMINIMAL_COMPILE=$minimal_compile\
-    -DHIGHERQUAD_PSP=$withHigherQuadPSP $1
+    -DHIGHERQUAD_PSP=$withHigherQuadPSP -DUSE_64BIT_INT=$useInt64 $1
   else
     cmake -DCMAKE_CXX_STANDARD=14 -DCMAKE_CXX_COMPILER=$cxx_compiler\
     -DCMAKE_CXX_FLAGS="$cxx_flags"\
@@ -159,7 +160,7 @@ function cmake_cplx() {
     -DWITH_DCCL=$withDCCL -DCMAKE_PREFIX_PATH="$ELPA_PATH;$DCCL_PATH"\
     -DWITH_COMPLEX=ON \
     -DWITH_TESTING=$testing -DMINIMAL_COMPILE=$minimal_compile\
-    -DHIGHERQUAD_PSP=$withHigherQuadPSP $1    
+    -DHIGHERQUAD_PSP=$withHigherQuadPSP -DUSE_64BIT_INT=$useInt64 $1    
   fi
 }
 
 
@@ -51,6 +51,8 @@ build_type=Release
 
 testing=ON
 minimal_compile=ON
+useInt64=$withGPU
+
 ###########################################################################
 #Usually, no changes are needed below this line
 #
@@ -74,7 +76,7 @@ function cmake_real() {
 	-DWITH_NCCL=$withNCCL -DCMAKE_PREFIX_PATH="$ELPA_PATH;$NCCL_PATH"\
 	-DWITH_COMPLEX=OFF -DWITH_GPU=$withGPU -DCMAKE_CUDA_FLAGS="$cuda_flags"\
 	-DWITH_TESTING=$testing -DMINIMAL_COMPILE=$minimal_compile \
-  -DHIGHERQUAD_PSP=$withHigherQuadPSP\
+  -DHIGHERQUAD_PSP=$withHigherQuadPSP -DUSE_64BIT_INT=$useInt64 \
 	  $1
 }
 
@@ -90,7 +92,7 @@ function cmake_cplx() {
   -DWITH_NCCL=$withNCCL -DCMAKE_PREFIX_PATH="$ELPA_PATH;$NCCL_PATH" \
 	-DWITH_COMPLEX=ON \
 	-DWITH_TESTING=$testing -DMINIMAL_COMPILE=$minimal_compile \
-  -DHIGHERQUAD_PSP=$withHigherQuadPSP\
+  -DHIGHERQUAD_PSP=$withHigherQuadPSP -DUSE_64BIT_INT=$useInt64 \
 	  $1
 }
 
 
@@ -50,10 +50,10 @@ namespace dftfe
      * @param[in] truncationTol the minimum function value after which the
      * function is truncated.
      */
-    AtomCenteredPseudoWavefunctionSpline(std::string  filename,
-                                         unsigned int l,
-                                         double       cutoff,
-                                         double       truncationTol = 1E-10);
+    AtomCenteredPseudoWavefunctionSpline(std::string filename,
+                                         dftfe::uInt l,
+                                         double      cutoff,
+                                         double      truncationTol = 1E-10);
   };
 
 } // end of namespace dftfe
 
@@ -22,6 +22,8 @@
 
 #include <vector>
 #include <boost/math/quadrature/gauss_kronrod.hpp>
+#include <TypeConfig.h>
+
 namespace dftfe
 {
   class AtomCenteredSphericalFunctionBase
@@ -41,7 +43,7 @@ namespace dftfe
      * @brief returns the l-quantum number associated with the spherical function
      * @return Quantum number l
      */
-    unsigned int
+    dftfe::uInt
     getQuantumNumberl() const;
 
     /**
@@ -72,9 +74,9 @@ namespace dftfe
     getDerivativeValue(double r) const = 0;
 
   protected:
-    double       d_cutOff;
-    unsigned int d_lQuantumNumber;
-    bool         d_DataPresent;
+    double      d_cutOff;
+    dftfe::uInt d_lQuantumNumber;
+    bool        d_DataPresent;
 
 
   }; // end of class AtomCenteredSphericalFunctionBase
 
@@ -38,14 +38,14 @@ namespace dftfe
      * @param[in] RcParameter coefficent for the bessel function
      * @param[in] RmaxParameter the maximum R afterwhich the function returns 0.
      */
-    AtomCenteredSphericalFunctionBessel(double       RcParameter,
-                                        double       RmaxParameter,
-                                        unsigned int lParameter);
+    AtomCenteredSphericalFunctionBessel(double      RcParameter,
+                                        double      RmaxParameter,
+                                        dftfe::uInt lParameter);
 
     double
     getRadialValue(double r) const override;
 
-    unsigned int
+    dftfe::uInt
     getQuantumNumbern() const;
 
     double