OpenAI6 phút đọc

GPT-5.4 — Mô Hình Frontier Mạnh Nhất Của OpenAI Cho Công Việc Chuyên Nghiệp

Bởi AI Guide News·Thứ Năm, 5 tháng 3, 2026

OpenAI vừa ra mắt GPT-5.4 — mô hình reasoning mạnh nhất và hiệu quả nhất từ trước đến nay, kết hợp sức mạnh lập trình, khả năng sử dụng máy tính gốc, context 1M token, và lần đầu tiên có biện pháp bảo vệ an ninh mạng tích hợp.

[AD] Rectangle 300×250 / In-article

Mô Hình Frontier Mới Cho Công Việc Chuyên Nghiệp

Ngày 5 tháng 3 năm 2026, OpenAI phát hành GPT-5.4 — được mô tả là "mô hình frontier có khả năng cao nhất và hiệu quả nhất của chúng tôi cho công việc chuyên nghiệp." Mô hình được triển khai đồng thời trên ChatGPT, Codex và API, với ba phiên bản: GPT-5.4 tiêu chuẩn, GPT-5.4 Thinking tập trung vào suy luận, và GPT-5.4 Pro cho hiệu suất tối đa trên các tác vụ phức tạp.

Mô hình hợp nhất những tiến bộ tốt nhất gần đây của OpenAI trong suy luận, lập trình và quy trình agentic vào một hệ thống duy nhất — tích hợp khả năng lập trình dẫn đầu ngành của GPT-5.3 Codex trong khi cải thiện đáng kể cách mô hình hoạt động trên các công cụ, môi trường phần mềm và các tác vụ chuyên nghiệp liên quan đến bảng tính, trình chiếu và tài liệu.

Điểm Mới Thực Sự

Một số khả năng nổi bật là những tiến bộ thực sự so với các mô hình trước:

Sử dụng máy tính gốc trong API: GPT-5.4 là mô hình đa năng đầu tiên của OpenAI được phát hành với khả năng sử dụng máy tính gốc, cho phép agent vận hành máy tính và thực hiện các quy trình làm việc phức tạp trên các ứng dụng. Trong thử nghiệm trên ~30.000 cổng thông tin bất động sản và thuế, GPT-5.4 đạt tỷ lệ thành công 95% ở lần thử đầu tiên và 100% trong ba lần thử — so với 73–79% với các mô hình trước — trong khi hoàn thành phiên làm việc nhanh hơn 3 lần và sử dụng ít hơn 70% token.
Cửa sổ ngữ cảnh 1M token: Phiên bản API hỗ trợ lên đến 1 triệu token, cho phép agent lên kế hoạch, thực thi và xác minh tác vụ qua các khoảng thời gian dài — cửa sổ ngữ cảnh lớn nhất hiện có từ OpenAI.
Tool search: Cơ chế mới cung cấp cho mô hình danh sách nhẹ các công cụ có sẵn thay vì tải tất cả định nghĩa từ trước. Với các hệ thống có hàng trăm công cụ, điều này có thể loại bỏ hàng chục nghìn token không cần thiết mỗi yêu cầu.
Tư duy minh bạch với GPT-5.4 Thinking: Mô hình có thể cung cấp kế hoạch suy nghĩ trước khi thực thi, để người dùng có thể điều chỉnh hướng đi giữa chừng. Nó cũng có thể suy nghĩ lâu hơn trên các tác vụ khó trong khi duy trì nhận thức mạnh mẽ hơn về các bước trò chuyện trước đó.
Hiểu hình ảnh nâng cao: Mức chi tiết đầu vào hình ảnh "gốc" mới hỗ trợ nhận thức độ trung thực đầy đủ lên đến 10,24 triệu pixel, với khả năng định vị và độ chính xác click được cải thiện đáng kể.
Hiệu quả token: GPT-5.4 sử dụng ít token hơn đáng kể so với GPT-5.2 để giải quyết cùng một vấn đề, dẫn đến chi phí API thấp hơn cho nhà phát triển.

Kết Quả Benchmark Đáng Chú Ý

GPT-5.4 đặt kỷ lục mới trên một số benchmark phản ánh công việc chuyên nghiệp thực tế:

OSWorld-Verified: Điểm kỷ lục cho các tác vụ sử dụng máy tính
WebArena Verified: Điểm kỷ lục cho agent điều hướng web
GDPval: 83% — bài kiểm tra cho các tác vụ công việc tri thức
APEX-Agents: Hiệu suất hàng đầu trên benchmark kỹ năng chuyên nghiệp trong luật và tài chính
SWE-Bench: 80,8% — đo khả năng kỹ thuật phần mềm thực tế

Câu Chuyện An Toàn: Lần Đầu Tiên Với An Ninh Mạng

Cùng với việc ra mắt sản phẩm, OpenAI công bố GPT-5.4 Thinking System Card — và phát hiện nổi bật là quan trọng: GPT-5.4 Thinking là mô hình đa năng đầu tiên của OpenAI triển khai các biện pháp giảm thiểu tích cực cho Khả năng cao trong An ninh mạng theo Preparedness Framework của OpenAI.

Các mô hình trước đã đánh dấu khả năng an ninh mạng là khu vực rủi ro. GPT-5.4 là mô hình đầu tiên OpenAI thực sự xây dựng các biện pháp bảo vệ. Điều này bao gồm: hệ thống giám sát, kiểm soát truy cập đáng tin cậy, và chặn bất đồng bộ cho các yêu cầu rủi ro cao hơn trên các bề mặt Zero Data Retention (ZDR).

Tại sao điều này quan trọng ngay bây giờ? Vì GPT-5.4 đạt 75% trên OSWorld — trên hiệu suất của con người — và 80,8% trên SWE-Bench. Một mô hình có thể tự động vận hành máy tính và viết code chất lượng production có tiềm năng tấn công mạng thực sự. Thừa nhận điều này công khai và triển khai các biện pháp giảm thiểu tích cực là sự thay đổi có ý nghĩa so với cách tiếp cận "chúng tôi đã đánh giá rủi ro" của các lần phát hành mô hình trước.

Tính Minh Bạch Của Chain-of-Thought

System card cũng giới thiệu một đánh giá mã nguồn mở mới: CoT controllability — đo lường liệu các mô hình có thể cố ý che giấu lý luận để tránh giám sát hay không. Kết quả đáng yên tâm: khả năng kiểm soát chain-of-thought của GPT-5.4 Thinking thấp, nghĩa là mô hình không thể che giấu lý luận một cách hiệu quả. OpenAI coi đây là thuộc tính an toàn tích cực: giám sát CoT vẫn là công cụ giám sát đáng tin cậy.

Mô hình cũng cho thấy cải tiến có ý nghĩa thống kê trên các đánh giá về hoạt động phi bạo lực bất hợp pháp và nội dung tự làm hại, đồng thời vượt trội so với tất cả các mô hình GPT-5 trước đó trên các đánh giá sức khỏe tâm thần.

Khả Dụng

GPT-5.4 Thinking có sẵn ngay hôm nay cho người dùng ChatGPT Plus, Team và Pro, thay thế GPT-5.2 Thinking làm mô hình reasoning mặc định. GPT-5.2 Thinking sẽ vẫn có sẵn trong phần Legacy Models trong ba tháng, trước khi bị ngừng vào ngày 5 tháng 6 năm 2026. Trong API, GPT-5.4 có sẵn ngay với tên gpt-5.4, và GPT-5.4 Pro với tên gpt-5.4-pro.

Bức Tranh Lớn Hơn

GPT-5.4 là mô hình mà OpenAI ngừng nói về agent như khả năng tương lai và triển khai chúng như thực tế hiện tại. Sử dụng máy tính gốc, context 1M token, tool search và lý luận minh bạch cùng nhau tạo thành hạ tầng cho các quy trình agentic thực sự — không phải demo, mà là hệ thống production. Câu chuyện an toàn cũng quan trọng không kém: khi các mô hình này trở nên thực sự có khả năng hoạt động tự chủ, sự nghiêm túc của đầu tư an toàn phải mở rộng cùng với khả năng. GPT-5.4 là tín hiệu rõ ràng nhất từ trước đến nay của OpenAI rằng họ hiểu phương trình này.

Nguồn:
Giới thiệu GPT-5.4 — OpenAI
GPT-5.4 Thinking System Card — OpenAI

openaigpt-5.4reasoningcomputer-usean-toànapicodex