Il record di velocità dell'intelligenza artificiale di Groq è stato battuto da Cerebras!
Paul Grieselhuber
Nel mondo dell'IA, la velocità è importante. Proprio come la potenza di un'auto determina la velocità con cui può andare, la velocità di un modello di IA indica quanto velocemente può elaborare le informazioni e fornire risposte. Nel 2023, l'azienda di hardware per l'IA Groq ha stabilito un notevole record di velocità raggiungendo oltre 300 token al secondo con il modello Llama-2 70B di Meta.
Questo record è stato una grande notizia perché significava che la tecnologia di Groq poteva aiutare le applicazioni di IA a rispondere più velocemente alle domande, a gestire più utenti contemporaneamente e ad alimentare esperienze in tempo reale, come traduzioni istantanee o chatbot di assistenza clienti, in modo più fluido.
Perché il record di velocità è importante?
Per chiunque utilizzi piattaforme alimentate dall'intelligenza artificiale, la velocità di risposta ha un impatto diretto sulla qualità dell'esperienza. Velocità più elevate significano che un sistema di IA può pensare più velocemente, gestire compiti più complessi in tempo reale e servire molte persone contemporaneamente senza rallentamenti. Per le aziende, un'IA più veloce può migliorare l'esperienza dei clienti, snellire le attività e persino sbloccare nuovi usi dell'IA che i modelli più lenti non potrebbero gestire.
Come sono le velocità di Groq rispetto a ChatGPT?
Quando Groq ha raggiunto i 300 token al secondo con Llama-2 70B, ha fatto un grande balzo in avanti rispetto a molte piattaforme popolari, tra cui ChatGPT. ChatGPT è progettato per conversazioni generiche e fornisce risposte a una velocità impressionante, ma l'hardware di Groq è stato specificamente ottimizzato per massimizzare la velocità per compiti di IA grandi e complessi. La configurazione di Groq ha permesso ai modelli di intelligenza artificiale di operare a una velocità superiore a quella attualmente disponibile attraverso le velocità standard di ChatGPT, che non sono state concepite per stabilire record di velocità.
L'ultimo detentore di record
Se il risultato di Groq nel 2023 ha fissato un limite elevato, non ci è voluto molto perché altri lo superassero. Nell'ottobre 2024, un'azienda chiamata Cerebras Systems ha rivendicato il nuovo record, raggiungendo la sorprendente velocità di 2.100 gettoni al secondo con il nuovo modello Llama 3.2 70B di Meta. Cerebras ha raggiunto questo traguardo grazie al suo Wafer-Scale Engine, un pezzo unico di hardware costruito per fornire velocità e potenza ai più recenti modelli di IA. Questo salto da 300 a 2.100 token al secondo dimostra quanto sia rapida l'evoluzione della tecnologia AI, con aziende che si spingono costantemente oltre i limiti del possibile.
La corsa continua
La corsa all'IA più veloce non rallenta. Ogni nuovo record avvicina l'IA alla capacità di alimentare applicazioni più complesse e in tempo reale, migliorando il modo in cui interagiamo quotidianamente con la tecnologia. Grazie alla continua innovazione di aziende come Groq e Cerebras, in futuro potremo aspettarci sistemi di IA ancora più veloci e capaci, per esperienze tecnologiche più fluide, veloci e impressionanti che mai.
Riferimenti
-
Groq raggiunge una velocità di inferenza di oltre 500 tokens/sec con il modello Llama 7B. Geeky Gadgets (2024). Available online. Accesso: 4 novembre 2024.
-
Cerebras stabilisce un nuovo record di velocità dell'intelligenza artificiale con 2.100 token al secondo su Llama 3.2. Business Wire (2024). Available online. Accesso: 4 novembre 2024.