Treball de Fi de Grau / Treball de Fi de Màster

Generació i anàlisi d’errors en consultes SQL amb LLMs sobre Apache Spark mitjançant few-shot prompting.

Descripció

Aquest Treball Final de Grau investiga l’ús de models de llenguatge (LLMs) per a la generació automàtica de consultes SQL en entorns de processament de dades basats en Apache Spark. El treball se centra en l’anàlisi sistemàtica dels errors produïts pels models, classificant-los segons una taxonomia d’errors que inclou problemes sintàctics, inconsistències semàntiques i violacions de les especificacions de valors de la base de dades. A més, s’estudia l’efecte de diferents estratègies de few-shot prompting per millorar la qualitat de les consultes generades, incloent la selecció d’exemples basada en mesures de similitud en espais d’embeddings. Finalment, el projecte avalua el rendiment de l’enfocament en escenaris reals de consulta amb Spark, analitzant com el disseny dels prompts i la selecció d’exemples influeixen en la precisió i robustesa de les consultes SQL generades.

Ensenyaments

Grau d'Enginyeria Informàtica, Doble Titulació de Grau d'Enginyeria Informàtica i Biotecnologia (GEI)

Tema

Processament distribuït de dades

Estat

Proposat

Data Proposta

2026-03-09

Directors

Marc Sánchez Artigas

Alumnes

Recomanacions

Dificultat

Alta

Empresa

Confidencial

Anglès

Aprenentatge Servei