Creare un ambiente GPT proprio: privateGPT

ChatGPT è uno strumento eccezionale, ma ha alcune caratteristiche che potrebbero non piacere:

  • è fortemente sconsigliato inserire nei prompt informazioni riservate perché queste alimentano il modello, con seri risvolti sulla privacy
  • il suo utilizzo professionale ha un costo
  • la base di informazioni utilizzata potrebbe essere sovrabbondante rispetto alle proprie necessità, oppure non adatta

Sarebbe essere utile poter avere una versione ridotta di questo strumento, da poter addestrare con i propri documenti, che funzioni localmente in modo da non diffondere informazioni riservate.

Sappiate che adesso è possibile grazie al progetto open source privateGPT di Ivàn Martìnez, che permette, utilizzando Python e l’ambiente Conda, di creare un proprio ambiente chatGPT che risponda alle necessità prima esposte.

Le istruzioni per l’installazione le trovate qui.

Il tool, scritto in Python, utilizza un modello LLM pre-addestrato, di cui trovate il link nella procedura, che costituisce il corpo della base di conoscenza dell’ambiente privateGPT (la lingua supportata è l’inglese).

Io l’ho addestrato utilizzando alcuni documenti su KNIME e l’ho interrogato su aspetti del linguaggio, con risultati interessanti.

Unico neo, al momento, è che privateGPT utilizza solo la CPU e quindi è piuttosto lento durante l’addestramento e nella risposta alle query, ma probabilmente, nel futuro, questa limitazione potrebbe scomparire.

Trovo il progetto molto interessante perché, oltre a salvaguardare la privacy, fornisce uno strumento stand alone, istruito sul proprio contesto di riferimento, che può essere adoperato senza una connessione Internet e con la possibilità di farlo scalare, di volta in volta, aggiungendo ulteriori documenti che riguardano il nostro business o contesto di riferimento.

È sicuramente da tenere d’occhio 😉

"KNIME Analytics Platform per Data Scientists, corso base o intermedio" su Udemy a 12.99€