Quale assistente AI scegliere per lo studio: una griglia per commercialisti
Cinque criteri concreti — non opinioni — per scegliere un assistente AI per il tuo studio. Con esempi presi dal contenzioso tributario reale e una checklist per il pilota di 30 giorni.
di Lorenzo Marchetti
Un commercialista ci scrive: "Ho provato ChatGPT su un quesito di impatriati post-riforma. Risposta lunga, ben scritta, con due citazioni a un decreto che non esiste. Le ho cercate per quindici minuti su Normattiva prima di capire che erano inventate. Mai più."
È la frase con cui vorremmo iniziare ogni conversazione sull'AI per lo studio. Perché il problema non è scegliere fra dieci tool, è capire secondo quali criteri un tool è defensibile davanti a un cliente, a un collega di studio, e — quando arriva il momento — a un giudice tributario.
Questa è una griglia di valutazione, non una classifica. Le classifiche invecchiano in tre mesi. I criteri restano.
Il vincolo che governa tutto
Un assistente AI per il commercialista non è valutabile per la qualità della prosa o per la velocità di risposta. È valutabile per quanto è strutturalmente difficile farlo allucinare su materia giuridica.
Una citazione inventata non è un errore "di forma" — è il cliente che ti chiede "è scritto da qualche parte?" e tu che non puoi rispondere. È il ricorso che cita una sentenza fantasma. È l'Albo professionale che, su queste cose, non perdona.
I cinque criteri che seguono sono ordinati per peso. Se il primo cade, gli altri non contano.
1. Verifica delle citazioni contro il testo originale
La domanda discriminante: quando lo strumento cita una norma, una sentenza o una circolare AdE, da dove prende quel testo?
Tre regimi possibili, in ordine crescente di robustezza:
- Generazione libera dal training. Il modello "ricorda" il testo. La citazione è plausibile, spesso giusta sulle norme molto note (art. 36-bis DPR 600/73, art. 1 L. 190/2014), ma può essere parzialmente o totalmente inventata sulle norme di nicchia (regime impatriati post-riforma, ravvedimento operoso speciale, definizione agevolata triennale). Inverificabile a meno di controllare a mano, ogni volta — il che annulla il guadagno di tempo.
- Retrieval su corpus generico. Il modello cita ciò che ha trovato in un corpus indicizzato che include anche commenti, blog, pareri di studio. Il rischio: citare un'opinione come fosse fonte primaria. Per il contenzioso, è il rischio più sottile — e il più costoso.
- Retrieval verificato su fonti primarie. Il modello può citare solo testo presente in un corpus curato di fonti ufficiali (Normattiva, AdE, GU, Cassazione). La citazione è linkata a un riferimento controllabile, e — questo è il punto — se il testo non è ricercabile nella fonte, il modello non lo cita.
Per il contenzioso tributario solo il terzo regime regge il peso di un atto. È il regime in cui lavora Quesito: ogni citazione viene cercata come testo letterale dentro la fonte ufficiale prima di apparire. Se non si trova, non appare.
2. Specializzazione del corpus
"AI per professionisti" è un'etichetta vuota. AI per commercialisti italiani che fanno contenzioso tributario è un'etichetta valutabile.
Domande utili da porre al fornitore — e su cui pretendere risposte numeriche:
- Quante fonti tributarie italiane sono indicizzate? Norme attive su Normattiva, prassi AdE 1990–oggi, sentenze CGT primo e secondo grado, Cassazione tributaria.
- Con che latenza si aggiorna il corpus dopo la pubblicazione di una nuova circolare AdE? Ore? Giorni? Settimane?
- Cosa è escluso e perché. L'esclusione è una scelta editoriale, non un limite — o almeno dovrebbe esserlo. Manualistica, dottrina, forum: dentro o fuori, e con quale criterio.
La risposta corretta non è "tutto". È "tutto ciò che serve per il contenzioso, e niente che lo inquini".
3. Trasparenza del retrieval
Quando lo strumento risponde, mostra cosa ha cercato e cosa ha trovato, oppure produce solo l'output finale?
La trasparenza del retrieval — la trace: la lista delle query interne e dei documenti recuperati — non è un dettaglio da power user. È il meccanismo con cui il commercialista può:
- Capire perché quella risposta e non un'altra.
- Vedere se il modello ha pescato dalla fonte giusta, o ha mancato un atto rilevante.
- Rifare la stessa ricerca a mano in 30 secondi, quando serve confermare.
Strumenti che nascondono il retrieval chiedono fiducia cieca. Per il fiscale, è la concessione sbagliata da fare.
4. Aggiornamento — con latenza dichiarata
Il diritto tributario italiano cambia in continuazione. Decreto attuativo a marzo, circolare interpretativa ad aprile, ordinanza di Cassazione a maggio che rovescia un orientamento di tre anni. Un assistente AI con corpus "fermo a un anno fa" è inutile sui temi caldi — concordato preventivo biennale, definizione agevolata, impatriati post-riforma — che sono esattamente i temi su cui i clienti pagano per avere una risposta.
Cosa controllare:
- Data dell'ultimo aggiornamento del corpus: il fornitore deve saperla rispondere senza esitare.
- Latenza dichiarata fra pubblicazione di una nuova fonte ufficiale e disponibilità nel tool.
- Comportamento sui temi appena modificati: lo strumento avvisa che la materia è in evoluzione, oppure risponde come se nulla fosse cambiato?
5. Trattamento dei dati e portabilità
Punto meno tecnico, decisivo a tre mesi.
- I tuoi prompt finiscono nel training del modello? L'unica risposta accettabile è no.
- Data residency UE, da contratto, non da blog post.
- Cancellazione completa su richiesta in tempi definiti.
- Portabilità delle conversazioni: se domani vuoi cambiare fornitore, recuperi la cronologia e in che formato?
Il prezzo è secondario rispetto a queste quattro voci. Uno strumento sbagliato costa molto più dell'eventuale risparmio sul listino.
Come Quesito risponde alla griglia
Coerentemente con i criteri sopra, ecco una lettura diretta — senza marketing — di come Quesito si posiziona oggi.
Verifica delle citazioni. Ogni citazione è cercata come testo letterale nelle fonti ufficiali (Normattiva, AdE, sezione tributaria della Cassazione) prima di essere mostrata. Se non si trova, Quesito lo dice. L'estratto verificato è visibile accanto alla citazione, con link diretto alla fonte.
Specializzazione. Il corpus è curato per il contenzioso tributario e i regimi complessi: forfettario, impatriati, ravvedimento, accertamenti, ricorsi CGT, definizione agevolata. È una scelta verticale: se ti serve un assistente per buste paga o per diritto societario puro, Quesito non è il tool. La verticalità è il punto, non un limite da nascondere.
Trasparenza del retrieval. La trace è visibile per ogni risposta. Si vedono le query, i documenti recuperati, e l'estratto da cui ogni citazione è stata ancorata. Niente scatole nere.
Aggiornamento. Il corpus segue la pubblicazione delle fonti ufficiali con latenza definita: una circolare AdE pubblicata oggi entra entro 24 ore, una sentenza di Cassazione tributaria entro 48. Sui temi in evoluzione (concordato preventivo biennale, definizione agevolata) Quesito segnala esplicitamente la natura in fieri della materia.
Dati. Prompt e documenti caricati non vengono usati per training. Data residency UE. Cancellazione su richiesta. Le conversazioni sono esportabili in PDF e Markdown.
Cose che Quesito non fa, e dichiara apertamente:
- Non genera l'atto completo del ricorso. Costruisce la base normativa, di prassi e giurisprudenziale; la redazione strategica resta del professionista.
- Non copre la giurisprudenza di merito ante 2010 con la stessa profondità del periodo recente: per ricostruzioni storiche serve affiancare le banche dati tradizionali.
- Non sostituisce la lettura critica. Su un ricorso che vale cinque cifre, la prima ora di ricerca scompare; l'ora finale di valutazione resta dove deve restare.
Gli altri tool, in breve
Per onestà intellettuale, qualche annotazione sugli altri strumenti della categoria — basata su descrizioni pubbliche, da verificare in prima persona prima di acquistare.
Normo. Assistente AI per professionisti italiani con corpus normativo strutturato e citazioni verificate. È l'altro tool verticale serio del mercato. Va valutato sulla stessa griglia: chiedi numeri sul corpus tributario, esempi di trace, risposte sul trattamento dati. Se i criteri sono rispettati, è una scelta valida.
ChatGPT, Claude, Gemini in modalità default. Potenza di ragionamento elevatissima. Ottimi per riassumere documenti, fare brainstorming, produrre prime stesure, riformulare in italiano professionale. Cadono al criterio 1: senza retrieval verificato, ogni citazione richiede controllo manuale, e il guadagno di tempo svanisce. Vanno usati come copilot di scrittura, non come fonte giuridica.
Copilot integrati nei gestionali (Wolters Kluwer, TeamSystem, Zucchetti). Valore principale: integrazione con i dati che già hai nel gestionale. Limite: la qualità della risposta giuridica dipende dal corpus che il gestionale ha scelto di indicizzare e dalla profondità del suo retrieval. Vanno valutati gestionale per gestionale, non in blocco.
Una checklist per il pilota di 30 giorni
Se hai ristretto la scelta a due tool, ecco come farli combattere onestamente.
- Stessa lista di 10 quesiti reali presi dal lavoro del mese precedente. Non quesiti "di test": quelli su cui i clienti aspettano una risposta.
- Stessa persona li lancia su entrambi gli strumenti, nello stesso giorno.
- Per ogni risposta, valuta su quattro voci con scala 1-5:
- Accuratezza giuridica — le citazioni esistono e sono pertinenti?
- Completezza — coperti tutti gli aspetti del quesito?
- Verificabilità — controlli le fonti in meno di 60 secondi?
- Tempo risparmiato rispetto alla ricerca a mano.
- Una colonna per gli errori critici. Ogni citazione inventata o sbagliata pesa il triplo di un'imprecisione lessicale. Una citazione errata in un parere è un parere da rifare.
- Niente comparazione di pancia. A fine 30 giorni, leggi i numeri.
Il pilota costa due-tre ore di lavoro a settimana. Una scelta sbagliata costa molto di più nei dodici mesi successivi.
In sintesi
Cinque criteri, in ordine di peso:
- Verifica delle citazioni contro il testo originale — non negoziabile.
- Specializzazione del corpus sulla nicchia che ti interessa davvero.
- Trasparenza del retrieval — vedi cosa cerca e cosa trova.
- Aggiornamento del corpus, con latenza dichiarata.
- Trattamento dei dati e portabilità, in chiaro, da contratto.
Se cade il primo, passa al tool successivo. Se cadono i criteri 4 o 5, si negozia. Se non cade nessuno, fai il pilota.
Quesito è l'assistente AI per commercialisti specializzato sul contenzioso tributario e i regimi complessi. Citazioni verificate contro il testo originale, retrieval trasparente, italiano di mestiere. Provalo o leggi gli altri articoli del blog.
Le informazioni sui tool diversi da Quesito sono basate su descrizioni pubbliche dei rispettivi fornitori e possono cambiare nel tempo. Verifica sempre direttamente con il fornitore prima di assumere decisioni di acquisto. Aggiornato al 25 aprile 2026.