Modelli LLM e IA (2026) | GPT, Claude, Gemini e modelli linguistici di grandi dimensioni

Anteprima Hy3 di Tencent: Una svolta nell'IA del mondo reale in termini di agenti, codifica e ragionamento

Just now, Yao Shunyu led the team to “rebuild” Hunyuan, and the first large model has gone live. Just now, Tencent Hy3 preview has arrived. This is the first version of Hy3 released after Tencent’s Hunyuan team restarted from architecture and infrastructure. The initial batch of models is relatively small in size, positioned toward practicality. […]

Anteprima Hy3 di Tencent: Una svolta nell'IA del mondo reale in termini di agenti, codifica e ragionamento Leggi tutto »

Qwen 3.6 non è solo l’ennesimo modello aperto: è la prima volta che l’IA locale sembra davvero utilizzabile

Notizie sull'AI, LLM / Claude Carter

Nelle ultime settimane, Reddit è diventato silenziosamente il miglior indicatore precoce delle prestazioni di Qwen 3.6 nel mondo reale — non i benchmark, né i blog di lancio, ma un utilizzo disordinato, vincolato dall’hardware e dipendente dalla toolchain. Nei subreddit r/LocalLLaMA, r/LocalLLM e r/Qwen_AI emerge chiaramente un trend: le persone non si chiedono più “È intelligente?”, ma piuttosto: “Posso davvero usarlo?»

Qwen 3.6 non è solo l’ennesimo modello aperto: è la prima volta che l’IA locale sembra davvero utilizzabile Leggi tutto »

Spiegazione della fuga di notizie sul mito antropico

Spiegazione della fuga di dati su Anthropic Mythos: violazione della sicurezza, rischi legati all’IA e cosa significa

Notizie sull'AI, LLM / Claude Carter

La fuga di dati “Mythos” di Anthropic non è stata una tradizionale violazione dei dati, bensì un incidente di accesso non autorizzato che ha coinvolto un modello di IA altamente riservato e incentrato sulla sicurezza informatica. Sulla base delle discussioni aggregate su Reddit, delle segnalazioni verificate e dei modelli di sicurezza osservati nel mondo reale, l’evento mette in luce un problema più profondo: i sistemi di IA dotati di capacità offensive stanno evolvendo più rapidamente delle infrastrutture progettate per controllarli. Cosa

Spiegazione della fuga di dati su Anthropic Mythos: violazione della sicurezza, rischi legati all’IA e cosa significa Leggi tutto »

La fuga di notizie sul modello Codex di OpenAI: cosa rivela su GPT 5.5 e sui modelli nascosti

Fuga di informazioni sul modello Codex di OpenAI: cosa rivela su GPT-5.5 e sui modelli nascosti

Notizie sull'AI, LLM / Claude Carter

La recente fuga di informazioni sul modello Codex di OpenAI non ha comportato una violazione dei pesi del modello o dei dati: si è trattato piuttosto di un’esposizione a livello di interfaccia utente che ha rivelato per un breve periodo nomi di modelli interni come GPT-5.5, Arcanine e Glacier-alpha. Sulla base delle discussioni aggregate su Reddit e delle osservazioni degli utenti reali, questo incidente suggerisce fortemente che OpenAI stia testando attivamente dietro le quinte diversi modelli di nuova generazione, in particolare

Fuga di informazioni sul modello Codex di OpenAI: cosa rivela su GPT-5.5 e sui modelli nascosti Leggi tutto »

Claude Opus 4.7: il pensiero adattivo – cos’è, come funziona e perché gli utenti sono divisi

Claude Opus 4.7 Pensiero adattivo: cos’è, come funziona e perché gli utenti sono divisi

Notizie sull'AI, LLM / Claude Carter

Claude Opus 4.7 Adaptive Thinking is a system where the model automatically decides how much reasoning effort to use based on task complexity. It replaces manual “extended thinking” controls with dynamic allocation, aiming to balance speed, cost, and accuracy. While this improves efficiency in structured tasks like coding, it reduces user control and can lead

Claude Opus 4.7 Pensiero adattivo: cos’è, come funziona e perché gli utenti sono divisi Leggi tutto »

Prezzi di Claude Opus 4.7: è davvero più costoso?

Notizie sull'AI, LLM / Claude Carter

Short answer:Claude Opus 4.7 is not officially more expensive per token, but in real-world usage it often costs more because it generates and consumes significantly more tokens—especially on complex tasks. The result is a higher effective cost per task, not a higher listed price. Claude Opus 4.7 Pricing at a Glance Claude Opus 4.7 keeps

Prezzi di Claude Opus 4.7: è davvero più costoso? Leggi tutto »

Claude Opus 4.7 vs Opus 4.6: Quale modello è migliore per il lavoro reale?

Notizie sull'AI, LLM / Claude Carter

Short answer:Opus 4.6 currently delivers higher reliability, lower cost, and better one-shot success rates in real-world coding workflows, while Opus 4.7 shows potential in open-ended tasks but requires more tuning, higher token budgets, and more retries to reach similar outcomes. Opus 4.7 vs Opus 4.6: Real-World Performance vs Benchmarks Most comparisons between Opus 4.7 and

Claude Opus 4.7 vs Opus 4.6: Quale modello è migliore per il lavoro reale? Leggi tutto »

Recensione di Claude Opus 4.7: Cosa è cambiato e perché è importante

Lascia un commento / Notizie sull'AI, LLM / Claude Carter

Claude Opus 4.7 riconquista i primi posti nelle classifiche dei benchmark sull’IA Questa settimana, Anthropic ha rilasciato Claude Opus 4.7, che è tornato in testa in due dei benchmark pubblici più seguiti. Nella classifica generale di intelligenza di Artificial Analysis, Opus 4.7 ha totalizzato 57 punti, in crescita rispetto ai 53 di Opus 4.6, posizionandosi saldamente nella fascia più alta.

Recensione di Claude Opus 4.7: Cosa è cambiato e perché è importante Leggi tutto »