CyTA
 

Ficha - Artículo

   

 

Título:

Medición de rendimiento del algoritmo spmv utilizando contadores de hardware para GP GPU en arquitecturas no homogéneas

Title:

.

Resumen

En la presente investigación se busca analizar diferentes contadores de hardware durante la ejecución del algoritmo SPMV (multiplicación vector por matriz dispersa), a través del uso de herramientas de profiling utilizadas en placas gráficas de los fabricantes ATI y NVIDIA. Utilizando como base tres bibliotecas que hacen uso del procesador gráfico, se busca inferir a partir del estudio de los diferentes indicadores, las optimizaciones aplicables en el contexto planteado que mejoren el desempeño. Para analizar los resultados, se propuso una división de los tres principales eventos de la arquitectura (escritura, ejecución y lectura). Se trabajó en el análisis de las notorias diferencias detectadas en los tiempos de respuestas debido al volumen de las transferencias de datos, para luego analizar la implementación de una biblioteca en particular para cada arquitectura hardware. Finalmente se propone una pequeña modificación que logra mejorar el rendimiento de ambas arquitecturas.

Abstract

Palabras Clave:

GPU, CUDA, OpenCL

Keyword:

Contadores de hardware, ,

 
 
 
   
 

Bibliografía - Bibliography

Blas, 2015. BLAS (Basic Linear Algebra Subprograms)

Boost, 2015. Biblioteca Boost lenguaje C++

Cise, 2015. Repositorio de Matrices Dispersas

De Luca et al, 2015. Análisis de rendimiento de algoritmos de resolución de problemas de matrices dispersas para GP-GPU Computing mediante el uso de profiling de hardware. Universidad Nacional de la Matanza, WICC 2015, pp2-3.

Duff et al, 1997. The Rutherford-Boening Sparse Matrix Collection. Atlas Centre, Departament for Computation and Information, pp19-29.

Golub y Van Loan, 2013. Matrix computation. The Johns Hopkins University, Fourth Edition, pp 33-42.

Khronos, 2015. OpenCL: Spec, OpenCL 1.2 API and C Language Specification. Khronos OpenCL Working Group,Document Revision: 19, pp 22-30. 

Haque, 2002. A Computational Study Of Sparse Matrix Storage Schemes. Bachelor of Science, Islamic University of Technology, pp. 197–204.

Kaltofen, 2014. The Seven Dwarfs of Symbolic Computation. Dept. of Mathematics, North Carolina State University, pp 2,3.

Lien, 2012. Auto-tunable GPU BLAS. Norwegian University of Science and Technology, Department of Computer and Information Science, pp 6-22.

Liu y Vinter, 2014. An Efficient GPU General Sparse Matrix-Matrix Multiplication for Irregular Data. IEEE 28th International Parallel y Distributed Processing Symposium, pp 370-381.

Neelima y Raghavendra, 2012. Effective Sparse Matrix Representation for the GPU Architectures. National Institute of Technology, Karnataka, pp 3-6.

Magma, 2014. Biblioteca BLAS Magma

Market, 2013. Formato Matrix Market

Matlab, 2015. Formato Matlab

Nvidia, 2015. “CUDA™ C Programming Guide version 5.0”: NVIDIA Corporation, pp 7-80.

Paralution, 2015. Biblioteca BLAS Paralution

ViennaCL, 2015. Biblioteca BLAS ViennaCL

 
 
 
 

Publicación - Publisher: Técnica Administrativa - ISSN: 1666-1680

Volumen: 15, Número - Number: 2; [ISSUE:66]

Fecha de publicación - Publication date: 15-04-2016

URL: www.cyta.com.ar/ta1502/v15n2a4.htm

URI: http://www.cyta.com.ar:80/ta/art_ficha.php?id=150204

XML: Registro en XML

Presentado - Received: 28-01-2016

Aprovado - Approved : 24-02-2016

 
 

Citas de este Artículo en: Google Scholar

 
 
 
 


Ver Ficha de Autores:
[ Waldo, Valiente ]
[ Díaz, Federico ]
[ De Luca, Graciela ]
[ Giulianelli, Daniel A. ]

 
 
 
 

Revista: Técnica Administrativa - ISSN 1666-1680

Editorial: Ciencia y Técnica Administrativa - CyTA

email: cyta@cyta.com.ar

Ciudad: Buenos Aires, Argentina