{"id":2564,"date":"2026-04-23T18:22:10","date_gmt":"2026-04-23T18:22:10","guid":{"rendered":"https:\/\/deepinsightai.io\/?p=2564"},"modified":"2026-04-23T18:22:12","modified_gmt":"2026-04-23T18:22:12","slug":"deepseek-starts-updating-frequently","status":"publish","type":"post","link":"https:\/\/deepinsightai.io\/it\/deepseek-starts-updating-frequently\/","title":{"rendered":"DeepSeek inizia ad aggiornarsi frequentemente: Kernel di piastrelle e DeepEP V2"},"content":{"rendered":"<p>Proprio ora, DeepSeek's <a href=\"https:\/\/deepinsightai.io\/it\/the-fake-star-economy-on-github\/\">GitHub<\/a> ha iniziato ad aggiornarsi frequentemente. Ha lanciato e reso disponibile un nuovo repository, <strong>Gherigli di piastrelle<\/strong>, e allo stesso tempo ha aggiornato il <strong>ProfondoEP<\/strong> repository, portando <strong>DeepEP V2<\/strong> online. \u00c8 passata meno di una settimana da quando DeepSeek ha aggiornato in modo silenzioso <strong>Mega MoE<\/strong> e <strong>Indicizzatore FP4<\/strong> l'ultima volta.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Kernel di piastrelle DeepSeek<\/h2>\n\n\n\n<figure data-spectra-id=\"spectra-mobt4mso-77si3j\" class=\"wp-block-image aligncenter size-full\"><img fetchpriority=\"high\" decoding=\"async\" width=\"889\" height=\"471\" src=\"https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/image-59.png\" alt=\"Kernel di piastrelle DeepSeek\" class=\"wp-image-2568\" srcset=\"https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/image-59.png 889w, https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/image-59-300x159.png 300w, https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/image-59-768x407.png 768w, https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/image-59-18x10.png 18w\" sizes=\"(max-width: 889px) 100vw, 889px\" \/><\/figure>\n\n\n\n<p>Link: <code>https:\/\/github.com\/deepseek-ai\/TileKernels<\/code><\/p>\n\n\n\n<p>Secondo l'introduzione, <strong>Gherigli di piastrelle<\/strong> sono kernel per GPU ottimizzati per le operazioni LLM, costruiti con <strong>PiastrellaLang<\/strong>. TileLang \u00e8 un linguaggio specifico per il dominio per esprimere kernel di GPU ad alte prestazioni in Python, con caratteristiche quali la facile portabilit\u00e0, lo sviluppo agile e l'ottimizzazione automatica.<\/p>\n\n\n\n<p>Le prestazioni dei kernel Tile sono estremamente elevate. Come ha scritto la stessa DeepSeek: \u201cLa maggior parte dei kernel di questo progetto sono gi\u00e0 vicini al limite delle prestazioni hardware in termini di intensit\u00e0 di calcolo e larghezza di banda della memoria. Alcuni di essi sono gi\u00e0 stati utilizzati internamente in scenari di addestramento e inferenza. Tuttavia, non rappresentano ancora le migliori pratiche e stiamo continuando a migliorare la qualit\u00e0 del codice e la documentazione\u201d.\u201d<\/p>\n\n\n\n<p>Non ci sono molte informazioni introduttive nel repository, eppure tra le righe si \u201cspoetizza\u201d gi\u00e0 il percorso di innovazione architettonica di fondo dei modelli di prossima generazione di DeepSeek, segnalando un salto paragonabile al recente <a target=\"_blank\" rel=\"noreferrer noopener\" href=\"https:\/\/deepinsightai.io\/it\/hy3-preview-launch\/\">Lancio in anteprima di Hy3<\/a>.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Caratteristiche dei kernel di piastrelle DeepSeek<\/h3>\n\n\n\n<p>Ecco alcune caratteristiche specifiche di Tile Kernel:<\/p>\n\n\n\n<p><strong>Meccanismo di regolazione:<\/strong> Selezione degli esperti top-k e punteggio per il routing MoE<\/p>\n\n\n\n<p><strong>Instradamento del Ministero dell'Ambiente:<\/strong> Mappatura dei token agli esperti, fused expand\/reduce e normalizzazione dei pesi<\/p>\n\n\n\n<p><strong>Quantizzazione:<\/strong> Supporta la conversione FP8\/FP4\/E5M6 in modalit\u00e0 per-token, per-blocco e per-canale e fonde SwiGLU + operazioni di quantizzazione<\/p>\n\n\n\n<p><strong>Trasposizione:<\/strong> Operazioni di trasposizione in batch<\/p>\n\n\n\n<p><strong>Engram:<\/strong> Engram gating kernel, fusione di RMSNorm, propagazione avanti\/indietro e riduzione del peso-gradiente<\/p>\n\n\n\n<p><strong>Collettore HyperConnection:<\/strong> Kernel di iperconnessione, compresa la normalizzazione Sinkhorn e la suddivisione\/applicazione per il mix<\/p>\n\n\n\n<p><strong>Modellazione:<\/strong> Alto livello <code>torcia.autograd.funzione<\/code> wrapper che combinano i kernel sottostanti in strati addestrabili (engram gate, mHC pipeline)<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">DeepSeek EPv2: EP pi\u00f9 veloce con supporto per Engram, PP e CP<\/h2>\n\n\n\n<figure data-spectra-id=\"spectra-mobt54cl-th2xp4\" class=\"wp-block-image aligncenter size-large\"><img decoding=\"async\" width=\"1024\" height=\"656\" data-src=\"https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/image-60-1024x656.png\" alt=\"DeepSeek EPv2: EP pi\u00f9 veloce con supporto per Engram, PP e CP\" class=\"wp-image-2569 lazyload\" data-srcset=\"https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/image-60-1024x656.png 1024w, https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/image-60-300x192.png 300w, https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/image-60-768x492.png 768w, https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/image-60-18x12.png 18w, https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/image-60.png 1069w\" data-sizes=\"(max-width: 1024px) 100vw, 1024px\" src=\"data:image\/svg+xml;base64,PHN2ZyB3aWR0aD0iMSIgaGVpZ2h0PSIxIiB4bWxucz0iaHR0cDovL3d3dy53My5vcmcvMjAwMC9zdmciPjwvc3ZnPg==\" style=\"--smush-placeholder-width: 1024px; --smush-placeholder-aspect-ratio: 1024\/656;\" \/><\/figure>\n\n\n\n<p>Collegamento EPv2: <code>https:\/\/github.com\/deepseek-ai\/DeepEP\/pull\/605<\/code><\/p>\n\n\n\n<p>All'inizio della giornata, DeepSeek ha rilasciato anche l'ultima versione di <strong>EPv2<\/strong>, consegnando pi\u00f9 velocemente <strong>parallelismo esperto (EP)<\/strong> e il supporto per <strong>Engram \/ parallelismo della pipeline (PP) \/ parallelismo del contesto (CP)<\/strong>.<\/p>\n\n\n\n<p>L'evoluzione dell'hardware, delle reti e delle architetture dei modelli \u00e8 avvenuta di pari passo con le rapide release del settore, come ad esempio <a href=\"https:\/\/deepinsightai.io\/it\/qwen-3-6\/\" target=\"_blank\" rel=\"noreferrer noopener\">Qwen 3.6<\/a>, Il precedente DeepEP V1 di DeepSeek aveva gi\u00e0 accumulato troppo bagaglio storico e troppi problemi di prestazioni.<\/p>\n\n\n\n<p>Questo aggiornamento ristruttura completamente <strong>Parallelismo esperto<\/strong>. Rispetto alla V1, ha bisogno solo di una frazione delle risorse SM per raggiungere prestazioni estreme, supportando al tempo stesso una scala pi\u00f9 ampia. <strong>scalabilit\u00e0<\/strong> (all'interno di una singola macchina) e <strong>scalare<\/strong> (tra le macchine).<\/p>\n\n\n\n<p>Inoltre, DeepSeek ha introdotto un sistema sperimentale di <strong>0 SM<\/strong> in questo aggiornamento, tra cui <strong>0 SM Engram<\/strong>, <strong>0 Parallelismo della pipeline SM (PP)<\/strong>, e <strong>0 Parallelismo contestuale SM (CP)<\/strong> Operatori di raccolta. Allo stesso tempo, il backend \u00e8 passato da <strong>NVSHMEM<\/strong> all'accendino <strong>NCCL Gin<\/strong> backend.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Nuove funzionalit\u00e0 in DeepSeek DeepEP V2<\/h3>\n\n\n\n<p>Ecco alcune delle nuove funzioni di DeepEP V2:<\/p>\n\n\n\n<p><strong>Completamente JIT<\/strong><\/p>\n\n\n\n<p><strong>Backend NCCL Gin:<\/strong><\/p>\n\n\n\n<p>Solo testata, estremamente leggero<\/p>\n\n\n\n<p>Possibilit\u00e0 di riutilizzare i comunicatori NCCL esistenti<\/p>\n\n\n\n<p><strong>EPv2:<\/strong><\/p>\n\n\n\n<p>Unifica le API ad alta velocit\u00e0 e a bassa latenza in un'unica interfaccia e adotta un nuovissimo layout GEMM.<\/p>\n\n\n\n<p>Supporta domini di scala pi\u00f9 grandi, fino a <strong>EP2048<\/strong><\/p>\n\n\n\n<p>Introduce il calcolo analitico del conteggio di SM e QP, per cui non \u00e8 pi\u00f9 necessario l'autotuning.<\/p>\n\n\n\n<p>Continua a sostenere sia <strong>Ibrido<\/strong> e <strong>Diretto<\/strong> modalit\u00e0<\/p>\n\n\n\n<p>Per i compiti di formazione pi\u00f9 vecchi, simili a quelli della V3, l'uso dell'SM scende da <strong>24<\/strong> a <strong>4-6<\/strong>, mantenendo le stesse prestazioni, se non addirittura migliori<\/p>\n\n\n\n<p><strong>0 SM Engram<\/strong> (con RDMA)<\/p>\n\n\n\n<p><strong>0 SM PP<\/strong> (con RDMA)<\/p>\n\n\n\n<p><strong>0 SM CP<\/strong> (con Copy Engine)<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Prestazioni di DeepSeek DeepEP V2<\/h2>\n\n\n\n<p>Seguendo la configurazione di <strong>DeepSeek-V3<\/strong>, I test sono stati eseguiti nella nuova versione con le impostazioni di <strong>8K gettoni per lotto<\/strong>, <strong>7168 dimensione nascosta<\/strong>, <strong>Top-8 degli esperti<\/strong>, <strong>Spedizione FP8<\/strong>, e <strong>Combinazione BF16<\/strong>. I risultati sono i seguenti:<\/p>\n\n\n\n<figure data-spectra-id=\"spectra-mobt5q25-blwgn9\" class=\"wp-block-image aligncenter size-full\"><img decoding=\"async\" width=\"650\" height=\"289\" data-src=\"https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/image-61.png\" alt=\"Prestazioni di DeepSeek DeepEP V2\" class=\"wp-image-2570 lazyload\" data-srcset=\"https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/image-61.png 650w, https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/image-61-300x133.png 300w, https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/image-61-18x8.png 18w\" data-sizes=\"(max-width: 650px) 100vw, 650px\" src=\"data:image\/svg+xml;base64,PHN2ZyB3aWR0aD0iMSIgaGVpZ2h0PSIxIiB4bWxucz0iaHR0cDovL3d3dy53My5vcmcvMjAwMC9zdmciPjwvc3ZnPg==\" style=\"--smush-placeholder-width: 650px; --smush-placeholder-aspect-ratio: 650\/289;\" \/><\/figure>\n\n\n\n<p>Nota: i risultati mostrati si riferiscono alla larghezza di banda logica. Ad esempio, nel caso di <strong>EP 8 x 2<\/strong>, il <strong>90 GB\/s<\/strong> La larghezza di banda include in realt\u00e0 il traffico tra le GPU locali (ranghi locali).<\/p>\n\n\n\n<p>Rispetto a V1, V2 raggiunge fino a <strong>1,3 volte le prestazioni di picco<\/strong>, risparmiando fino a <strong>Utilizzo delle risorse SM 4\u00d7 <\/strong>-Un'ottimizzazione cruciale per rimanere competitivi in un panorama dominato da pesi massimi quali <a href=\"https:\/\/deepinsightai.io\/it\/claude-opus-4-7\/\" target=\"_blank\" rel=\"noreferrer noopener\">Claude Opus 4.7<\/a>.<\/p>\n\n\n\n<p>Infine, un piccolo consiglio per DeepSeek: sbrigatevi a rilasciare <strong>V4<\/strong> gi\u00e0. Tutti stanno diventando impazienti.<\/p>\n\n\n\n<p><\/p>","protected":false},"excerpt":{"rendered":"<p>Just now, DeepSeek\u2019s GitHub started updating frequently. It launched and open-sourced a new repository, Tile Kernels, and at the same time updated the DeepEP repository, bringing DeepEP V2 online. It has been less than a week since DeepSeek quietly updated Mega MoE and FP4 Indexer last time. DeepSeek Tile Kernels Link: https:\/\/github.com\/deepseek-ai\/TileKernels According to the [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":2567,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_seopress_robots_primary_cat":"none","_seopress_titles_title":"%%post_title%%","_seopress_titles_desc":"DeepSeek releases Tile Kernels and DeepEP V2 with faster expert parallelism, 1.3\u00d7 performance boost, and major GPU efficiency gains.","_seopress_robots_index":"","_uag_custom_page_level_css":"","site-sidebar-layout":"default","site-content-layout":"","ast-site-content-layout":"default","site-content-style":"default","site-sidebar-style":"default","ast-global-header-display":"","ast-banner-title-visibility":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","ast-disable-related-posts":"","theme-transparent-header-meta":"","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","astra-migrate-meta-layouts":"set","ast-page-background-enabled":"default","ast-page-background-meta":{"desktop":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"ast-content-background-meta":{"desktop":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"footnotes":""},"categories":[2,10],"tags":[],"class_list":["post-2564","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-ai-news","category-llm"],"uagb_featured_image_src":{"full":["https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/deepseek.png",786,520,false],"thumbnail":["https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/deepseek-150x150.png",150,150,true],"medium":["https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/deepseek-300x198.png",300,198,true],"medium_large":["https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/deepseek-768x508.png",768,508,true],"large":["https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/deepseek.png",786,520,false],"1536x1536":["https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/deepseek.png",786,520,false],"2048x2048":["https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/deepseek.png",786,520,false],"trp-custom-language-flag":["https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/deepseek-18x12.png",18,12,true]},"uagb_author_info":{"display_name":"Claude Carter","author_link":"https:\/\/deepinsightai.io\/it\/author\/cloud-han03gmail-com\/"},"uagb_comment_info":0,"uagb_excerpt":"Just now, DeepSeek\u2019s GitHub started updating frequently. It launched and open-sourced a new repository, Tile Kernels, and at the same time updated the DeepEP repository, bringing DeepEP V2 online. It has been less than a week since DeepSeek quietly updated Mega MoE and FP4 Indexer last time. DeepSeek Tile Kernels Link: https:\/\/github.com\/deepseek-ai\/TileKernels According to the&hellip;","_links":{"self":[{"href":"https:\/\/deepinsightai.io\/it\/wp-json\/wp\/v2\/posts\/2564","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/deepinsightai.io\/it\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/deepinsightai.io\/it\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/deepinsightai.io\/it\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/deepinsightai.io\/it\/wp-json\/wp\/v2\/comments?post=2564"}],"version-history":[{"count":1,"href":"https:\/\/deepinsightai.io\/it\/wp-json\/wp\/v2\/posts\/2564\/revisions"}],"predecessor-version":[{"id":2571,"href":"https:\/\/deepinsightai.io\/it\/wp-json\/wp\/v2\/posts\/2564\/revisions\/2571"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/deepinsightai.io\/it\/wp-json\/wp\/v2\/media\/2567"}],"wp:attachment":[{"href":"https:\/\/deepinsightai.io\/it\/wp-json\/wp\/v2\/media?parent=2564"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/deepinsightai.io\/it\/wp-json\/wp\/v2\/categories?post=2564"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/deepinsightai.io\/it\/wp-json\/wp\/v2\/tags?post=2564"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}