Cerca
Close this search box.

Open ma non troppo

Che l’open source possa essere uno strumento delle corporation di Silicon Valley lo sapevamo già dall’operazione Android di Google.

Quindi non possiamo stupirci se Meta abbia recentemente rilasciato una nuova versione di LLM, Llama 2, come open source, fornendo agli utenti l’accesso ai pesi, al codice di valutazione e alla documentazione del modello. La retorica di Meta è renderlo “accessibile a individui, creatori, ricercatori e aziende in modo che possano sperimentare, innovare e ridimensionare le loro idee in modo responsabile”.

Llama 2 non è molto aperto. Meta ha reso disponibile il modello addestrato, ma non condivide i dati di addestramento del modello, che costituiscono un elemento importantissimo, né il codice utilizzato per addestrarlo.
Forse non è neanche giusto definirlo open source. Meta lo definisce tale solo per scopi retorici? O ha altri fini?

Nella tabella sotto una comparazione fra il grado di apertura dei diversi LLM. ChaTGPT è quello più chiuso.

Anche se modelli più piccoli e focalizzati sulla ricerca erano molto più aperti di Llama 2 o ChatGPT, sono chiusi da un punto di vista: pochi modelli hanno fornito dettagli sufficienti del importante processo di perfezionamento chiamato “apprendimento per rinforzo con feedback umano” (RLHF), il passaggio che sintonizza i LLM dopo il preaddestramento del modello: il processo è laborioso e richiede una valutazione umana nel ciclo degli output del modello durante l’addestramento.

L’analisi completa la trovate su IEEE Spectrum: Llama and ChatGPT Are Not Open-Source Few ostensibly open-source LLMs live up to the openness claim

Accedi per vedere questi contenuti

registrati se non lo ha ancora fatto