OpenAI5 phút đọc

GPT-5.4 Mini & Nano — Hiệu Năng Gần Flagship Cho Tất Cả Mọi Người

Bởi AI Guide News·Thứ Ba, 17 tháng 3, 2026

OpenAI ra mắt GPT-5.4 mini và nano ngày 17/3/2026 — các mô hình nhỏ mạnh nhất từ trước đến nay, chạy nhanh gấp 2 lần và mang hiệu năng gần flagship đến người dùng free và khối lượng công việc lớn.

[AD] Rectangle 300×250 / In-article

Công Cụ Đúng Cho Đúng Việc

Ngày 17/3/2026, OpenAI ra mắt GPT-5.4 mini và GPT-5.4 nano — các mô hình nhỏ mạnh mẽ nhất trong dòng sản phẩm của họ cho đến nay. Chúng được xây dựng có mục đích cho một thực tế cụ thể: trong các hệ thống AI tác nhân, không phải mọi tác vụ đều cần toàn bộ sức mạnh của mô hình flagship. Một số tác vụ cần nhanh, rẻ và chạy song song. Đó chính xác là những gì mini và nano dành cho.

Điểm Mới Của Từng Mô Hình

GPT-5.4 mini cải thiện đáng kể so với GPT-5 mini về lập trình, suy luận, hiểu đa phương thức và sử dụng công cụ — trong khi chạy nhanh hơn hơn 2 lần. Nó tiếp cận hiệu năng của GPT-5.4 đầy đủ trên các bài đánh giá quan trọng bao gồm SWE-Bench Pro và OSWorld-Verified. Trên benchmark GPQA Diamond, đạt 88,01% — chỉ kém flagship 93% một khoảng nhỏ đáng ngạc nhiên.

GPT-5.4 nano là phiên bản nhỏ nhất, rẻ nhất cho các tác vụ nơi tốc độ và chi phí quan trọng nhất. OpenAI khuyến nghị dùng cho phân loại, trích xuất dữ liệu, xếp hạng và các subagent lập trình xử lý tác vụ hỗ trợ đơn giản. Với giá chỉ 0,20 USD / triệu token đầu vào — so với 2,50 USD cho GPT-5.4 đầy đủ — hiệu quả chi phí là rất lớn.

Bước Chuyển Kiến Trúc Subagent

Thay đổi khái niệm quan trọng nhất không phải là con số benchmark — mà là cách đặt vấn đề rõ ràng về kết hợp đa mô hình. Trong Codex, một mô hình lớn hơn như GPT-5.4 xử lý lập kế hoạch, điều phối và phán đoán cuối cùng, trong khi ủy thác cho các subagent GPT-5.4 mini xử lý subtask hẹp hơn song song — tìm kiếm codebase, xem xét file lớn hoặc xử lý tài liệu hỗ trợ.

Thay vì dùng một mô hình cho mọi thứ, các nhà phát triển có thể tạo ra hệ thống nơi các mô hình lớn hơn quyết định phải làm gì và các mô hình nhỏ hơn thực thi nhanh chóng ở quy mô lớn. Đó là nguyên tắc tương tự khiến kiến trúc microservices chiếm ưu thế trong kỹ thuật phần mềm — được áp dụng cho AI.

Được Xây Dựng Cho Quy Trình Nhạy Cảm Với Độ Trễ

GPT-5.4 mini và nano xuất sắc trong các môi trường nơi tốc độ phản hồi trực tiếp định hình trải nghiệm sản phẩm:

Trợ lý lập trình cần cảm giác tức thì trong quá trình chỉnh sửa và debug
Hệ thống sử dụng máy tính diễn giải ảnh chụp màn hình UI phức tạp theo thời gian thực
Pipeline tác nhân chạy nhiều subtask song song đồng thời
Tạo front-end và điều hướng codebase với thông lượng cao

Khả Năng Truy Cập & Giá Cả

GPT-5.4 mini có sẵn cho người dùng Free và Go trong ChatGPT qua tính năng "Thinking". Với người dùng trả phí, nó là phương án dự phòng tốc độ cao khi đạt giới hạn GPT-5.4 Thinking. GPT-5.4 nano chỉ có sẵn qua OpenAI API.

GPT-5.4 mini: 0,80 USD / 1 triệu token đầu vào, 3,20 USD / 1 triệu token đầu ra
GPT-5.4 nano: 0,20 USD / 1 triệu token đầu vào, 0,80 USD / 1 triệu token đầu ra

So sánh, GPT-5.4 đầy đủ có giá 2,50 USD / triệu token — khiến nano rẻ hơn khoảng 12 lần cho các trường hợp phù hợp.

Ý Nghĩa Với Hệ Sinh Thái

Lần phát hành này báo hiệu ý định rõ ràng của OpenAI: tương lai của AI không phải là một mô hình mạnh mẽ duy nhất làm tất cả — mà là kiến trúc phân tầng nơi các mô hình kích thước khác nhau cộng tác. Flagship suy nghĩ. Mini thực thi. Nano xử lý ở quy mô lớn. Với nhà phát triển, câu hỏi không còn là "mô hình nào thông minh nhất?" mà là "sự kết hợp nào mang lại kết quả tốt nhất trên mỗi đô la mỗi mili giây?"

Nguồn: openai.com — Introducing GPT-5.4 mini and nano

openaigpt-5.4mininanoapisubagentlập-trìnhđộ-trễ