Skip to content

#llm

28 bài viết
· 6 phút đọc

DiffusionGemma-26B: 1.000 Token/Giây Có Ý Nghĩa Gì Với Developer Tooling

Google vừa open-source model text diffusion đầu tiên đáng tin cậy từ major lab — DiffusionGemma-26B generate 1.000+ token/giây bằng cách từ bỏ hoàn toàn autoregressive token generation. Đây là cách Uniform State Diffusion thực sự hoạt động, khi nào kiến trúc này quan trọng, và ý nghĩa với việc build với open-weights model.

· 16 phút đọc

Sự Tiến Hóa của AI Agentic Patterns: Từ Prompt Đến Production System

Câu hỏi trung tâm của việc xây dựng hệ thống AI đã thay đổi ba lần trong bốn năm — từ 'nói gì với model?' đến 'xây hệ thống gì?'. Deep dive về prompt engineering, context engineering, và harness engineering với architecture diagrams, decision frameworks, và production lessons cho engineering leaders.