Cuộc Chiến Chi Phí LLM: Qwen3.6-Plus, Gemini Flash-Lite và Kỷ Nguyên AI Commodity
Alibaba vừa ra mắt model thứ ba trong vài ngày. Gemini Flash-Lite chỉ 0,25 USD mỗi triệu token. NVIDIA Nemotron chạy nhanh gấp 2,2 lần GPT-OSS-120B. Cuộc chiến chi phí LLM đã đến — đây là những gì các kiến trúc sư và tech lead cần biết khi chọn AI infrastructure năm 2026.