AI
[AD] Leaderboard 728×90 / 320×50
Về trang chính
OpenAI6 phút đọc

GPT-5.3-Codex — Mô Hình AI Đã Tự Giúp Tạo Ra Chính Mình

Bởi AI Guide News·Thứ Năm, 5 tháng 2, 2026
GPT-5.3-Codex — Mô Hình AI Đã Tự Giúp Tạo Ra Chính Mình

OpenAI ra mắt GPT-5.3-Codex — mô hình lập trình tác nhân mạnh nhất từ trước đến nay, nhanh hơn 25%, dẫn đầu mọi benchmark lớn, và đặc biệt là mô hình đầu tiên tham gia vào quá trình tạo ra chính nó.

[AD] Rectangle 300×250 / In-article

Mô Hình Đã Tự Giúp Tạo Ra Chính Mình

OpenAI vừa ra mắt GPT-5.3-Codex — mô hình lập trình tác nhân mạnh nhất từ trước đến nay — và đi kèm với một chi tiết khiến người ta phải dừng lại giữa câu: các phiên bản đầu của mô hình này đã được dùng để debug quá trình huấn luyện của chính nó, quản lý việc triển khai của chính nó, và phân tích kết quả kiểm thử của chính nó. Nhóm Codex mô tả họ "sửng sốt" trước mức độ Codex có thể đẩy nhanh quá trình phát triển bản thân. Đây là một cột mốc đặt ra những câu hỏi sâu sắc về nơi quỹ đạo này sẽ kết thúc.

Điểm Mới Thực Sự Là Gì?

GPT-5.3-Codex không phải chỉ là bản cập nhật tăng dần. Nó kết hợp hai thứ trước đây còn tách biệt:

  • Hiệu suất lập trình tiên phong của GPT-5.2-Codex
  • Khả năng lý luận và kiến thức chuyên môn của GPT-5.2

Kết quả là một mô hình duy nhất cũng nhanh hơn 25% so với phiên bản tiền nhiệm — sự kết hợp giữa mạnh hơn và hiệu quả hơn hiếm khi xảy ra cùng lúc. Điều này cho phép mô hình đảm nhận các tác vụ chạy dài liên quan đến nghiên cứu, sử dụng công cụ và thực thi nhiều bước phức tạp kéo dài ngày, không chỉ vài phút.

Dẫn Đầu Benchmark Toàn Diện

GPT-5.3-Codex thiết lập mức cao mới trong ngành trên bốn benchmark chính:

  • SWE-Bench Pro — đánh giá nghiêm ngặt trải rộng bốn ngôn ngữ lập trình (không chỉ Python), được thiết kế để chống ô nhiễm dữ liệu và gần hơn với kỹ thuật phần mềm thực tế
  • Terminal-Bench 2.0 — đo lường kỹ năng terminal mà tác nhân lập trình cần, GPT-5.3-Codex vượt trội đáng kể, sử dụng ít token hơn bất kỳ mô hình nào trước đây
  • OSWorld — sử dụng máy tính trong môi trường hệ điều hành thực
  • GDPval — công việc tri thức chuyên nghiệp trên 44 nghề nghiệp

Điểm hiệu quả token đáng được nhấn mạnh: làm nhiều hơn với ít token hơn nghĩa là chi phí thấp hơn và thông lượng thực tế cao hơn cho các nhà phát triển xây dựng trên nền tảng mô hình.

Từ Trợ Lý Code Đến Tác Nhân Máy Tính Toàn Diện

Định vị ở đây là có chủ đích. Với GPT-5.3-Codex, Codex chuyển từ tác nhân có thể viết và xem xét code sang tác nhân có thể làm hầu hết mọi thứ mà nhà phát triển và chuyên gia có thể làm trên máy tính. Điều đó bao gồm phát triển web, tài liệu, phân tích dữ liệu, xây dựng game và ứng dụng từ đầu qua các phiên làm việc nhiều ngày, và công việc tri thức chuyên nghiệp như thuyết trình và bảng tính.

Quan trọng hơn, bạn có thể hướng dẫn và tương tác với nó trong khi nó đang làm việc, mà không mất ngữ cảnh — giống như một đồng nghiệp bạn có thể kiểm tra giữa chừng. Chất lượng tương tác đó là điều phân biệt nó với các công cụ tạo code theo kiểu hàng loạt.

Cảnh Báo An Ninh Mạng

Đây là nơi sự thành thật của OpenAI xứng đáng được ghi nhận. GPT-5.3-Codex là mô hình đầu tiên OpenAI xếp loại "Khả năng Cao" theo Khung Chuẩn bị về an ninh mạng — nghĩa là nó có khả năng tự động hóa các hoạt động tấn công mạng từ đầu đến cuối nhắm vào các mục tiêu được bảo vệ, hoặc phát hiện và khai thác các lỗ hổng liên quan đến hoạt động.

OpenAI thừa nhận không thể xác nhận chắc chắn điều này vượt ngưỡng, nhưng đang thực hiện cách tiếp cận phòng ngừa. Kết quả: quyền truy cập API đầy đủ bị trì hoãn, các sử dụng rủi ro cao bị kiểm soát bằng các biện pháp bảo vệ, và có chương trình truy cập đáng tin cậy cho các chuyên gia bảo mật. Đó là con đường có trách nhiệm — nhưng cũng báo hiệu mô hình này đã trở nên mạnh mẽ đến mức nào.

Hiện Đang Có Mặt Ở Đâu?

GPT-5.3-Codex ra mắt ngày 5/2/2026, có sẵn cho người dùng ChatGPT trả phí trên tất cả các giao diện Codex: ứng dụng Codex, CLI, tiện ích mở rộng IDE (VS Code, JetBrains) và web. Quyền truy cập API sẽ sớm có mặt. Thời điểm ra mắt — được phát hành trong vài phút sau khi Anthropic ra mắt Claude Opus 4.6 — nhấn mạnh cuộc đua khốc liệt ở đỉnh cao của AI lập trình.

Bức Tranh Lớn Hơn

Điều làm cho GPT-5.3-Codex có ý nghĩa không chỉ là các con số benchmark. Đó là thực tế rằng một mô hình đủ mạnh để hỗ trợ quá trình phát triển của chính nó đã được đưa vào sản xuất. Vòng lặp đang khép lại: AI cải thiện AI, chạy trong môi trường thực tế, giúp các nhóm thực sự phát hành phần mềm thực sự. Vòng lặp đó thắt chặt nhanh như thế nào từ đây là câu hỏi mở quan trọng nhất trong ngành hiện nay.

openaicodexgpt-5lập-trìnhai-tác-nhânkỹ-thuật-phần-mềmswe-bench
[AD] Leaderboard 728×90 / end of article