GPT-5.4 Mini & Nano — Hiệu Năng Gần Flagship Cho Tất Cả Mọi Người

OpenAI ra mắt GPT-5.4 mini và nano ngày 17/3/2026 — các mô hình nhỏ mạnh nhất từ trước đến nay, chạy nhanh gấp 2 lần và mang hiệu năng gần flagship đến người dùng free và khối lượng công việc lớn.
Công Cụ Đúng Cho Đúng Việc
Ngày 17/3/2026, OpenAI ra mắt GPT-5.4 mini và GPT-5.4 nano — các mô hình nhỏ mạnh mẽ nhất trong dòng sản phẩm của họ cho đến nay. Chúng được xây dựng có mục đích cho một thực tế cụ thể: trong các hệ thống AI tác nhân, không phải mọi tác vụ đều cần toàn bộ sức mạnh của mô hình flagship. Một số tác vụ cần nhanh, rẻ và chạy song song. Đó chính xác là những gì mini và nano dành cho.
Điểm Mới Của Từng Mô Hình
GPT-5.4 mini cải thiện đáng kể so với GPT-5 mini về lập trình, suy luận, hiểu đa phương thức và sử dụng công cụ — trong khi chạy nhanh hơn hơn 2 lần. Nó tiếp cận hiệu năng của GPT-5.4 đầy đủ trên các bài đánh giá quan trọng bao gồm SWE-Bench Pro và OSWorld-Verified. Trên benchmark GPQA Diamond, đạt 88,01% — chỉ kém flagship 93% một khoảng nhỏ đáng ngạc nhiên.
GPT-5.4 nano là phiên bản nhỏ nhất, rẻ nhất cho các tác vụ nơi tốc độ và chi phí quan trọng nhất. OpenAI khuyến nghị dùng cho phân loại, trích xuất dữ liệu, xếp hạng và các subagent lập trình xử lý tác vụ hỗ trợ đơn giản. Với giá chỉ 0,20 USD / triệu token đầu vào — so với 2,50 USD cho GPT-5.4 đầy đủ — hiệu quả chi phí là rất lớn.
Bước Chuyển Kiến Trúc Subagent
Thay đổi khái niệm quan trọng nhất không phải là con số benchmark — mà là cách đặt vấn đề rõ ràng về kết hợp đa mô hình. Trong Codex, một mô hình lớn hơn như GPT-5.4 xử lý lập kế hoạch, điều phối và phán đoán cuối cùng, trong khi ủy thác cho các subagent GPT-5.4 mini xử lý subtask hẹp hơn song song — tìm kiếm codebase, xem xét file lớn hoặc xử lý tài liệu hỗ trợ.
Thay vì dùng một mô hình cho mọi thứ, các nhà phát triển có thể tạo ra hệ thống nơi các mô hình lớn hơn quyết định phải làm gì và các mô hình nhỏ hơn thực thi nhanh chóng ở quy mô lớn. Đó là nguyên tắc tương tự khiến kiến trúc microservices chiếm ưu thế trong kỹ thuật phần mềm — được áp dụng cho AI.
Được Xây Dựng Cho Quy Trình Nhạy Cảm Với Độ Trễ
GPT-5.4 mini và nano xuất sắc trong các môi trường nơi tốc độ phản hồi trực tiếp định hình trải nghiệm sản phẩm:
- Trợ lý lập trình cần cảm giác tức thì trong quá trình chỉnh sửa và debug
- Hệ thống sử dụng máy tính diễn giải ảnh chụp màn hình UI phức tạp theo thời gian thực
- Pipeline tác nhân chạy nhiều subtask song song đồng thời
- Tạo front-end và điều hướng codebase với thông lượng cao
Khả Năng Truy Cập & Giá Cả
GPT-5.4 mini có sẵn cho người dùng Free và Go trong ChatGPT qua tính năng "Thinking". Với người dùng trả phí, nó là phương án dự phòng tốc độ cao khi đạt giới hạn GPT-5.4 Thinking. GPT-5.4 nano chỉ có sẵn qua OpenAI API.
- GPT-5.4 mini: 0,80 USD / 1 triệu token đầu vào, 3,20 USD / 1 triệu token đầu ra
- GPT-5.4 nano: 0,20 USD / 1 triệu token đầu vào, 0,80 USD / 1 triệu token đầu ra
So sánh, GPT-5.4 đầy đủ có giá 2,50 USD / triệu token — khiến nano rẻ hơn khoảng 12 lần cho các trường hợp phù hợp.
Ý Nghĩa Với Hệ Sinh Thái
Lần phát hành này báo hiệu ý định rõ ràng của OpenAI: tương lai của AI không phải là một mô hình mạnh mẽ duy nhất làm tất cả — mà là kiến trúc phân tầng nơi các mô hình kích thước khác nhau cộng tác. Flagship suy nghĩ. Mini thực thi. Nano xử lý ở quy mô lớn. Với nhà phát triển, câu hỏi không còn là "mô hình nào thông minh nhất?" mà là "sự kết hợp nào mang lại kết quả tốt nhất trên mỗi đô la mỗi mili giây?"