January 29, 2025

Open-R1_ Replica di un modello AI _a scatola nera

12 minutes

Con l'ausilio di NotebookLM, ho realizzato questo podcast. ecco la Timeline degli Eventi Principali

DeepSeek rilascia il suo modello di intelligenza artificiale (IA) "R1", un modello di ragionamento che ottiene ottimi risultati nei benchmark, e lo rende accessibile attraverso una chatbot app che scala rapidamente le classifiche dell'App Store di Apple.
Poco dopo il rilascio di R1: Ricercatori di Hugging Face avviano il progetto "Open-R1", con l'obiettivo di replicare il modello R1 da zero, rendendone tutti i componenti open source, inclusi i dati di training.
In corso (al momento della stesura dell'articolo): Il progetto Open-R1 raccoglie 10.000 "stelle" su GitHub in soli tre giorni. Il team di Hugging Face utilizza il proprio cluster di ricerca "Science Cluster" (768 GPU Nvidia H100) per generare dataset simili a quelli usati da DeepSeek. Il team sta anche sollecitando la partecipazione della community di IA e tech per la costruzione della pipeline di training.
Futuro (prossime settimane): L'obiettivo del progetto Open-R1 è di replicare completamente R1 in poche settimane.
Futuro (se il progetto ha successo): I ricercatori IA potranno usare la pipeline di training per sviluppare la prossima generazione di modelli di ragionamento open source. La replica di R1 permetterà a chiunque con accesso a GPU di creare la propria versione di R1 con i propri dati.
17 luglio 2025: TechCrunch All Stage si terrà a Boston, MA.

Cast dei Personaggi Principali

Leandro von Werra: Capo della ricerca presso Hugging Face. È uno dei leader del progetto Open-R1 e sottolinea l'importanza del lavoro di comunità per replicare R1.
Elie Bakouch: Ingegnere di Hugging Face che lavora al progetto Open-R1. Sottolinea la necessità di trasparenza e controllo nel training dei modelli, evidenziando come sia fondamentale "aprire la scatola nera" di R1. Crede nei benefici dell'open source in ambito IA, nonostante i potenziali rischi.
Team di Ingegneri di Hugging Face: Insieme a von Werra e Bakouch, partecipano attivamente al progetto Open-R1. Il loro obiettivo è replicare R1 e renderlo open source.
DeepSeek: Laboratorio di IA cinese supportato da un hedge fund quantitativo. Ha sviluppato e rilasciato il modello di ragionamento R1, che ha ottenuto ottimi risultati. Sono criticate per la poca trasparenza sul processo di creazione di R1.
OpenAI: Azienda che ha rilasciato il modello di ragionamento "o1", utilizzato come termine di paragone per la valutazione delle prestazioni di R1.

...more

By Fabio Musicco

January 29, 2025

12 minutes

Con l'ausilio di NotebookLM, ho realizzato questo podcast. ecco la Timeline degli Eventi Principali

DeepSeek rilascia il suo modello di intelligenza artificiale (IA) "R1", un modello di ragionamento che ottiene ottimi risultati nei benchmark, e lo rende accessibile attraverso una chatbot app che scala rapidamente le classifiche dell'App Store di Apple.
Poco dopo il rilascio di R1: Ricercatori di Hugging Face avviano il progetto "Open-R1", con l'obiettivo di replicare il modello R1 da zero, rendendone tutti i componenti open source, inclusi i dati di training.
In corso (al momento della stesura dell'articolo): Il progetto Open-R1 raccoglie 10.000 "stelle" su GitHub in soli tre giorni. Il team di Hugging Face utilizza il proprio cluster di ricerca "Science Cluster" (768 GPU Nvidia H100) per generare dataset simili a quelli usati da DeepSeek. Il team sta anche sollecitando la partecipazione della community di IA e tech per la costruzione della pipeline di training.
Futuro (prossime settimane): L'obiettivo del progetto Open-R1 è di replicare completamente R1 in poche settimane.
Futuro (se il progetto ha successo): I ricercatori IA potranno usare la pipeline di training per sviluppare la prossima generazione di modelli di ragionamento open source. La replica di R1 permetterà a chiunque con accesso a GPU di creare la propria versione di R1 con i propri dati.
17 luglio 2025: TechCrunch All Stage si terrà a Boston, MA.

Cast dei Personaggi Principali

Leandro von Werra: Capo della ricerca presso Hugging Face. È uno dei leader del progetto Open-R1 e sottolinea l'importanza del lavoro di comunità per replicare R1.
Elie Bakouch: Ingegnere di Hugging Face che lavora al progetto Open-R1. Sottolinea la necessità di trasparenza e controllo nel training dei modelli, evidenziando come sia fondamentale "aprire la scatola nera" di R1. Crede nei benefici dell'open source in ambito IA, nonostante i potenziali rischi.
Team di Ingegneri di Hugging Face: Insieme a von Werra e Bakouch, partecipano attivamente al progetto Open-R1. Il loro obiettivo è replicare R1 e renderlo open source.
DeepSeek: Laboratorio di IA cinese supportato da un hedge fund quantitativo. Ha sviluppato e rilasciato il modello di ragionamento R1, che ha ottenuto ottimi risultati. Sono criticate per la poca trasparenza sul processo di creazione di R1.
OpenAI: Azienda che ha rilasciato il modello di ragionamento "o1", utilizzato come termine di paragone per la valutazione delle prestazioni di R1.

...more

Share Open-R1_ Replica di un modello AI _a scatola nera