Cerca
Close this search box.

Google rivoluziona gli LLM con Infini-attention, che introduce il contesto infinito

Immagine di una CPU con un viso robotico rappresentato sopra. Immagine generata tramite DALL-E 3 da Marta Baronio.

Google introduce una rivoluzionaria tecnica che offre ai grandi modelli linguistici un contesto infinito.  Questa tecnica si chiama Infini-attention, amplia la “finestra di contesto” dei modelli consentendo la gestione di testi di lunghezza illimitata, senza aumentare i requisiti di memoria e calcolo. Questo significa che gli LLM possono ora lavorare su input estesi senza compromettere […]

L’Analisi dell’Ufficio Federale Tedesco per la Sicurezza delle Informazioni sui modelli IA generativi

Immagine di un lucchetto composto da connessioni elettriche ad indicare una tecnologia AI probabilmente degli LLM. Vuole simboleggiare la sicurezza sui modelli di ia generatrivi.

Il rapporto dell’Ufficio Federale Tedesco per la Sicurezza delle Informazioni, intitolato “Modelli IA Generativi – Opportunità e Rischi per l’Industria e le Autorità”, mette in luce le sfide e le opportunità nell’addestramento di modelli IA generativi, come gli LLM. Basandosi su grandi corpus di testo, questi modelli possono incorporare dati non verificati, compresi contenuti personali […]

MGE, la chiave per un allineamento morale efficace nei modelli linguistici

PC portatile aperto su una pagina di programmazione.

Un nuovo studio finanziato da OpenAI propone un approccio innovativo all’allineamento morale per i modelli linguistici LLM. L’allineamento morale, cruciale nell’era dell’IA, sta diventando un problema il cui peso aumenta sempre di più nel tempo.  Il processo introdotto da quest’approccio innovativo si chiama MGE, “Moral Graph Elicitation” (Elicitazione del Grafo Morale), i cui risultati, secondo […]

Rapporto AI Index 2023, un anno cruciale per l’IA 

Immagine di un grosso volume intitolato "AI Index". Immagine generata artificialmente con DALL-E 3 da Marta Baronio.

Il “Rapporto AI Index 2023” è atterrato rumorosamente sulla scena con le sue 393 pagine cariche di informazioni che testimoniano l’uscita dell’IA da un anno cruciale.  Pubblicato dall’Istituto Stanford per l’Intelligenza Artificiale Centrata sull’Uomo (HAI), il rapporto offre uno sguardo dettagliato sul panorama attuale dell’IA, esaminandone diversi aspetti chiave, tra cui l’espansione dell’IA generativa, i […]

I dubbi etici dietro l’uso dei dati: OpenAI e il caso YouTube

immagine dello schermo di un pc portatile aperto, sulla pagina di YouTube.

OpenAI, alla ricerca di dati per addestrare ChatGPT, ha trascritto oltre un milione di ore di video di YouTube partecipando così alla corsa all’accesso ai dati nel mondo dell’IA.  OpenAI avrebbe attinto alla popolare piattaforma video senza aver mai informato Alphabet, la società che controlla sia YouTube sia Google. Sembrerebbe però che OpenAI, e in particolare […]

Come fanno OpenAI, Google e Meta a superare le barriere per raccogliere dati online?

Immagine generata tramite DALL-E 3 da Marta Baronio (autrice articolo) che rappresenta astrattamente i vari loghi dei social Meta, logo di google e altri in una nuvola, frutto della polvere generata da una corsa rapida di vari soggetti (che vanno talmente in fretta che si vedono solo scie, e la nuvola di polvere).

I giganti della tecnologia stanno affrontando una corsa al recupero dei dati per alimentare i loro sistemi di intelligenza artificiale, capita sempre più spesso che tentino di superare le politiche aziendali o che discutano di come aggirare le leggi sul copyright per ottenere le informazioni necessarie. OpenAI, Google e Meta hanno esaurito le risorse di […]

Gli studiosi di Anthropic scoprono come manipolare le risposte dell’IA

Immagina di schermata cellulare iPhone con varie app di AI tra cui copilot e OpenAI

Gli studiosi di Anthropic hanno scoperto un nuovo metodo, chiamato “many-shot jailbreaking”, per indurre un modello linguistico AI a rispondere a domande inappropriate dopo essere stato esposto a numerose domande meno dannose.  Questo approccio sfrutta la capacità dei modelli LLM con ampie “finestre di contesto”, che tendono a performare meglio su molte attività se ci […]

Mistral, una startup francese che mette in discussione il dominio di OpenAI

M di Mistral, pixelata stile cartoon, dai toni che sfumano dall'arancione al giallo chiaro.

La startup francese Mistral sta mettendo in discussione il dominio di OpenAI nel campo dei grandi modelli linguistici (LLM). Nonostante sia più piccola e giovane rispetto al gigante americano, Mistral ha lanciato con successo il suo modello Mistral-Large, che si avvicina quasi alle prestazioni del potente GPT-4 di OpenAI. Inoltre, Mistral ha presentato Le Chat, […]

LLM: dalla complessità alla semplicità nel recupero delle conoscenze

Immagine astratta che vuole rappresentare la complessità dei sistemi LLM

I modelli linguistici di grandi dimensioni utilizzano una tecnica sorprendentemente semplice per recuperare informazioni memorizzate e i ricercatori hanno scoperto un metodo per esplorare ciò che questi modelli sanno su nuovi argomenti.  Questi modelli (come ChatGPT) sono complessi, ma l’uso di funzioni lineari per decodificare le informazioni suggerisce che ci sono meccanismi più semplici al […]

Accedi per vedere questi contenuti

registrati se non lo ha ancora fatto