Rywalizacja na rynku sztucznej inteligencji nie zwalnia tempa. Google DeepMind oficjalnie zaprezentowało DiffusionGemma, nowy otwarty model AI zaprojektowany z myślą o bardzo szybkim generowaniu treści. Chwilę po premierze NVIDIA ogłosiła pełne wsparcie dla rozwiązania na swoich platformach RTX oraz DGX. Producent przekonuje, że dzięki odpowiednim optymalizacjom użytkownicy mogą liczyć na znacznie wyższą wydajność i lokalne uruchamianie modelu bez konieczności korzystania z usług chmurowych.
DiffusionGemma ma przyspieszyć generowanie tekstu
Nowy model opracowany przez Google bazuje na architekturze Gemma 4 i wykorzystuje inne podejście niż klasyczne modele autoregresyjne. Zamiast generować pojedyncze tokeny krok po kroku, DiffusionGemma może przetwarzać ich większe partie jednocześnie. W praktyce pozwala to znacząco skrócić czas potrzebny na tworzenie odpowiedzi. Model dysponuje ponad 25 miliardami parametrów, jednak podczas działania aktywna jest tylko część z nich, co poprawia efektywność obliczeń. Google podkreśla również otwarty charakter projektu. DiffusionGemma udostępniono na licencji Apache 2.0, dzięki czemu deweloperzy i firmy mogą swobodnie korzystać z rozwiązania oraz rozwijać własne projekty bazujące na tej technologii. Model obsługuje zarówno tekst, jak i obrazy, a jego maksymalny kontekst sięga 256 tysięcy tokenów. To sprawia, że może być wykorzystywany w wielu zaawansowanych zastosowaniach związanych z analizą danych, tworzeniem treści czy budową agentów AI. Według twórców największą zaletą pozostaje jednak szybkość działania. W niektórych scenariuszach model ma być nawet czterokrotnie szybszy od tradycyjnych rozwiązań opartych na generowaniu sekwencyjnym.
NVIDIA przygotowała wsparcie już w dniu premiery
NVIDIA szybko wykorzystała premierę nowego modelu, prezentując gotowe środowiska do jego uruchamiania na własnym sprzęcie. Wsparcie obejmuje zarówno karty GeForce RTX dla użytkowników domowych, jak i profesjonalne platformy RTX PRO oraz komputery AI z rodziny DGX. Firma twierdzi, że dzięki wykorzystaniu rdzeni Tensor i technologii CUDA możliwe jest osiągnięcie bardzo wysokiej wydajności bez konieczności dodatkowej konfiguracji. Szczególnie interesująco prezentują się wyniki osiągane przez systemy DGX. Według danych producenta DGX Spark może generować około 150 tokenów na sekundę, natomiast bardziej zaawansowane konfiguracje osiągają nawet kilkaset tokenów na sekundę podczas lokalnego działania modelu. NVIDIA podkreśla również, że użytkownicy nie muszą korzystać z usług chmurowych ani płacić za każde wygenerowane zapytanie. Całość może działać bezpośrednio na komputerze wyposażonym w odpowiedni sprzęt. To ważny argument dla osób zajmujących się rozwojem sztucznej inteligencji, które coraz częściej poszukują lokalnych rozwiązań zapewniających większą kontrolę nad danymi. Już teraz DiffusionGemma można uruchomić między innymi na karcie GeForce RTX 5090 oraz platformach DGX wyposażonych w najnowsze układy NVIDIA.
DiffusionGemma to nowy otwarty model AI od Google DeepMind, który stawia na bardzo szybkie generowanie treści i lokalne działanie. NVIDIA od pierwszego dnia zapewniła pełne wsparcie dla swoich kart RTX oraz systemów DGX, oferując dodatkowe optymalizacje zwiększające wydajność. Wszystko wskazuje na to, że nowy model może stać się ciekawą alternatywą dla popularnych rozwiązań wykorzystywanych obecnie przez deweloperów i entuzjastów sztucznej inteligencji.
źródło; wccftech
Redakcja Choose TV












