Aquest Treball Final de Grau investiga l’ús de models de llenguatge (LLMs) per a la generació automàtica de consultes SQL en entorns de processament de dades basats en Apache Spark. El treball se centra en l’anàlisi sistemàtica dels errors produïts pels models, classificant-los segons una taxonomia d’errors que inclou problemes sintàctics, inconsistències semàntiques i violacions de les especificacions de valors de la base de dades. A més, s’estudia l’efecte de diferents estratègies de few-shot prompting per millorar la qualitat de les consultes generades, incloent la selecció d’exemples basada en mesures de similitud en espais d’embeddings. Finalment, el projecte avalua el rendiment de l’enfocament en escenaris reals de consulta amb Spark, analitzant com el disseny dels prompts i la selecció d’exemples influeixen en la precisió i robustesa de les consultes SQL generades.
Grau d'Enginyeria Informàtica, Doble Titulació de Grau d'Enginyeria Informàtica i Biotecnologia (GEI)
Processament distribuït de dades
Proposat
2026-03-09
Marc Sánchez Artigas
Alta
No
No
No
No