ChatGPT Lockdown Mode — Lá Chắn Mạnh Nhất Của OpenAI Trước Tấn Công Prompt Injection

OpenAI vừa ra mắt Lockdown Mode và nhãn Elevated Risk trong ChatGPT — đánh dấu bước chuyển quan trọng từ năng lực AI sang bảo mật AI. Khi các mô hình trở nên tự chủ hơn, bối cảnh mối đe dọa đòi hỏi kiểm soát xác định, không chỉ là đầu ra thông minh hơn.
Mối Đe Dọa Buộc Phải Có Phản Ứng Này
Khi các hệ thống AI phát triển từ chatbot thụ động thành tác nhân chủ động có khả năng thực hiện các quy trình phức tạp — duyệt web, đọc email, truy vấn cơ sở dữ liệu, triển khai code — một loại tấn công mới đã xuất hiện: prompt injection. Một đoạn lệnh độc hại nhúng trong trang web hoặc tài liệu có thể đánh lừa AI bỏ qua các biện pháp bảo mật, rò rỉ dữ liệu nhạy cảm hoặc thực hiện các hành động trái phép thay mặt kẻ tấn công. Phản ứng của OpenAI, được công bố vào tháng 2/2026, là hai công cụ bảo mật mới giải quyết mối đe dọa này ở cấp độ cơ sở hạ tầng — không chỉ ở cấp độ mô hình.
Lockdown Mode: Lá Chắn Xác Định
Lockdown Mode là cài đặt bảo mật nâng cao tùy chọn, được thiết kế cho một nhóm người dùng cụ thể: giám đốc điều hành, nhóm bảo mật và các vai trò rủi ro cao tại các tổ chức nổi bật cần bảo vệ trước các mối đe dọa tinh vi. Đây không phải dành cho mọi người — và OpenAI cố tình định khung như vậy.
Điều khác biệt so với các tính năng bảo mật khác là từ xác định. Thay vì dựa vào mô hình để "từ chối" các lệnh độc hại — vốn có thể bị vượt qua bằng cách đặt câu hỏi khéo léo — Lockdown Mode hoạt động ở cấp độ cơ sở hạ tầng, cắt bỏ hoàn toàn bề mặt tấn công:
- Duyệt web bị giới hạn chỉ với nội dung được cache — không có yêu cầu mạng trực tiếp nào rời khỏi mạng kiểm soát của OpenAI, ngăn chặn rò rỉ dữ liệu qua duyệt web
- Các công cụ rủi ro cao bị vô hiệu hóa hoàn toàn khi không thể đảm bảo an toàn dữ liệu chắc chắn
- Tương tác ứng dụng kết nối bị hạn chế chặt chẽ chỉ với các hành động được quản trị viên phê duyệt
Điểm mấu chốt ở đây là các tổ chức bảo mật không muốn AI cố gắng an toàn — họ muốn AI không thể mất an toàn, bất kể nhận được lệnh gì. Lockdown Mode là câu trả lời của OpenAI cho yêu cầu đó.
Nhãn Elevated Risk: Minh Bạch Tại Điểm Hành Động
Không phải mọi hành động rủi ro đều cần phong tỏa hoàn toàn. Với đại đa số trường hợp sử dụng, tính năng thứ hai của OpenAI tiếp cận có mục tiêu hơn: các nhãn "Elevated Risk" được chuẩn hóa xuất hiện trên ChatGPT, ChatGPT Atlas và Codex bất cứ khi nào người dùng sắp sử dụng một tính năng có hàm ý bảo mật cao.
Các nhãn này xuất hiện trong các ngữ cảnh như:
- Cấp quyền truy cập mạng cho Codex để tra cứu tài liệu hoặc thực hiện hành động web
- Kết nối ChatGPT với cơ sở dữ liệu nội bộ hoặc codebase độc quyền
- Ủy quyền các hành động tự chủ như gửi email hoặc triển khai code
- Mở các liên kết bên ngoài mà OpenAI không thể xác minh độ an toàn
Quan trọng là, các nhãn này không cố định. Khi khả năng bảo mật của OpenAI cải thiện và một hành động từng rủi ro có thể được đảm bảo an toàn, nhãn sẽ được gỡ bỏ. Điều này tạo ra một hệ thống bảo mật sống — phát triển cùng với bối cảnh mối đe dọa thay vì cố định tư thế bảo mật tại một thời điểm nhất định.
Tại Sao Điều Này Quan Trọng Ngay Lúc Này
Thời điểm ra mắt này phản ánh sự trưởng thành rộng lớn hơn của ngành AI. Năm 2025, trọng tâm là năng lực thô — mô hình có thể làm gì? Năm 2026, câu hỏi các doanh nghiệp đặt ra là: mô hình không thể làm gì, và chúng ta có thể tin tưởng đảm bảo đó không? Đánh giá an ninh mạng tháng 12/2025 của OpenAI cảnh báo rằng các mô hình sắp tới đặt ra rủi ro "cao", có khả năng phát triển zero-day exploits hoặc hỗ trợ các hoạt động xâm nhập phức tạp. Lockdown Mode và Elevated Risk labels là phản ứng trực tiếp trước đánh giá trung thực đó.
Một bộ phận tài chính hiện có thể giữ tóm tắt ngôn ngữ tự nhiên hoạt động trong khi vô hiệu hóa các công cụ duyệt web trực tiếp và tạo code có thể làm lộ dữ liệu độc quyền. Một bệnh viện có thể sử dụng ChatGPT for Healthcare với Lockdown Mode và tự tin rằng ngay cả một cuộc tấn công prompt injection tinh vi cũng không thể rò rỉ hồ sơ bệnh nhân. Sự kiểm soát cụ thể đó — duy trì tiện ích trong khi loại bỏ các bề mặt tấn công cụ thể — chính xác là những gì các triển khai AI doanh nghiệp đã đòi hỏi từ khi công nghệ ra đời.
Phạm Vi Áp Dụng
Cả hai tính năng ra mắt vào tháng 2/2026. Lockdown Mode có sẵn cho các gói ChatGPT Enterprise, Edu, Healthcare và Teachers, được quản trị viên không gian làm việc bật thông qua kiểm soát truy cập theo vai trò. Nhãn Elevated Risk đang hoạt động trên ChatGPT, ChatGPT Atlas và Codex cho tất cả các cấp độ áp dụng. OpenAI đã cho biết kế hoạch mở rộng Lockdown Mode cho người dùng cá nhân trong những tháng tới.
Thời đại bảo mật AI như một suy nghĩ sau cùng đang kết thúc. OpenAI đang phát tín hiệu — rõ ràng — rằng giai đoạn tiếp theo của việc áp dụng AI đòi hỏi không chỉ các mô hình thông minh hơn, mà là các mô hình có thể chứng minh được là an toàn hơn.