ChatGPT & Sức Khỏe Tâm Thần — Thách Thức Nhạy Cảm Nhất của OpenAI

Với 900 triệu người dùng mỗi tuần, ChatGPT đã trở thành điểm tiếp xúc sức khỏe tâm thần ngoài ý muốn. OpenAI đang phản ứng bằng cải tiến mô hình, tính năng Trusted Contact, 2 triệu USD tài trợ nghiên cứu — và áp lực pháp lý thực sự.
Quy Mô Của Vấn Đề
Hơn 900 triệu người dùng ChatGPT mỗi tuần. Ở quy mô đó, ngay cả những sự kiện hiếm gặp cũng trở thành những con số lớn. OpenAI ước tính khoảng 0,15% người dùng hoạt động hàng tuần — tức khoảng 1,2 triệu người — có các cuộc trò chuyện liên quan đến dấu hiệu rõ ràng của tự làm hại bản thân. Thêm 0,07% khác cho thấy dấu hiệu có thể của loạn thần hoặc hưng cảm. Đây không còn là trường hợp ngoại lệ nữa — đây là một nhóm người thực sự đòi hỏi những phản hồi có cấu trúc và được hướng dẫn bởi chuyên gia.
Thách thức là điều mà không công ty AI nào giải quyết được hoàn toàn: làm thế nào để xây dựng một AI trò chuyện đa năng thực sự hữu ích qua hàng tỷ tương tác — bao gồm cả những khoảnh khắc ai đó đang thực sự đau khổ?
OpenAI Đã Xây Dựng Gì Cho Đến Nay
Phối hợp với hơn 170 chuyên gia sức khỏe tâm thần lâm sàng và Mạng lưới Bác sĩ Toàn cầu gồm 300 chuyên gia, OpenAI đã huấn luyện ChatGPT nhận biết tốt hơn các dấu hiệu đau khổ và phản hồi cẩn thận hơn. Kết quả: giảm 65–80% phản hồi không mong muốn trong các tình huống sức khỏe tâm thần nhạy cảm kể từ bản cập nhật mô hình tháng 10/2025. Các cải thiện tập trung vào ba lĩnh vực:
- Khủng hoảng sức khỏe tâm thần — loạn thần, hưng cảm và khủng hoảng không tự sát
- Tự làm hại và tự tử — phát hiện tốt hơn các tín hiệu gián tiếp, không chỉ các tuyên bố rõ ràng
- Phụ thuộc cảm xúc vào AI — ngăn ngừa các mô hình gắn bó không lành mạnh hình thành
OpenAI cũng đã cập nhật Model Spec để làm rõ hơn các mục tiêu này: mô hình phải hỗ trợ các mối quan hệ thực sự của người dùng, tránh xác nhận các niềm tin không có cơ sở có thể liên quan đến đau khổ cảm xúc, và chú ý hơn đến các tín hiệu gián tiếp của rủi ro.
Tính Năng Trusted Contact
Tính năng sản phẩm mới quan trọng nhất là Trusted Contact — đang triển khai toàn cầu. Cách hoạt động: người dùng vào cài đặt ChatGPT và chỉ định một người họ tin tưởng — bạn bè, thành viên gia đình hoặc người chăm sóc. Người đó có một tuần để chấp nhận. Sau khi chấp nhận, nếu hệ thống tự động của ChatGPT gắn cờ một cuộc trò chuyện có nguy cơ tự làm hại, một nhóm nhỏ người đánh giá được đào tạo sẽ đánh giá tình huống — với mục tiêu thời gian đánh giá dưới một giờ. Nếu người đánh giá xác định có mối lo ngại thực sự, người liên hệ tin cậy sẽ nhận thông báo ngắn qua email, tin nhắn hoặc cảnh báo trong ứng dụng.
Đây là tính năng chu đáo, nhưng không đơn giản. Một số người dùng tìm đến AI chính xác vì họ muốn riêng tư với những người trong cuộc sống của họ. Tính năng thông báo là một sự đánh đổi thực sự — và OpenAI đã thẳng thắn về sự căng thẳng đó.
Phương Pháp Đánh Giá Mới
Ngoài các tính năng sản phẩm, OpenAI đang củng cố cơ sở hạ tầng an toàn. Các phương pháp đánh giá mới hiện mô phỏng các cuộc trò chuyện liên quan đến sức khỏe tâm thần kéo dài — loại có thể bắt đầu vô hại nhưng chỉ bộc lộ các mô hình đau khổ sau nhiều trao đổi. Điều này giải quyết một hạn chế đã biết: các rào cản an toàn hoạt động tốt trong các cuộc trò chuyện ngắn có thể suy giảm qua các cuộc trò chuyện dài.
Phụ thuộc cảm xúc và khủng hoảng sức khỏe tâm thần không tự sát cũng đã được thêm vào bộ kiểm tra an toàn baseline tiêu chuẩn cho tất cả các phiên bản mô hình trong tương lai — nghĩa là đây không phải sửa chữa một lần, mà là vĩnh viễn trở thành cách các mô hình mới được đánh giá trước khi ra mắt.
2 Triệu USD Tài Trợ Nghiên Cứu
Nhận ra rằng công việc an toàn nội bộ một mình là không đủ, OpenAI đã mở lời kêu gọi đề xuất nghiên cứu bên ngoài tập trung vào AI và sức khỏe tâm thần. Các khoản tài trợ từ 5.000 đến 100.000 USD, với tổng quỹ lên đến 2 triệu USD. Chương trình ưu tiên các nhóm liên ngành kết hợp chuyên môn kỹ thuật AI với kinh nghiệm sức khỏe tâm thần và kinh nghiệm sống — sự công nhận rằng những người bị ảnh hưởng nhiều nhất bởi các tương tác này nên có tiếng nói trong việc định hình chúng.
Áp Lực Pháp Lý
Công việc này không tồn tại trong chân không. Một số vụ kiện liên quan đến sức khỏe tâm thần liên quan đến ChatGPT đã được nộp, và một tòa án California gần đây đã phối hợp một số trường hợp này thành một thủ tục duy nhất. OpenAI cam kết xử lý các vụ kiện này một cách cẩn thận và minh bạch, trong khi duy trì rằng công việc an toàn đang diễn ra của họ tiếp tục độc lập với tranh tụng.
Sự giám sát pháp lý thật không thoải mái, nhưng cũng làm rõ ràng hơn. Nó buộc một công ty xây dựng ở quy mô chưa từng có phải có trách nhiệm — không chỉ với người dùng, mà với các gia đình và cộng đồng có thể gánh chịu hậu quả của các quyết định được đưa ra trong các cuộc họp kỹ thuật và sản phẩm.
Đánh Giá Trung Thực
OpenAI xứng đáng được ghi nhận về sự nghiêm túc mà họ đang tiếp cận vấn đề này. Sự hợp tác với các bác sĩ lâm sàng, báo cáo công khai các chỉ số an toàn, chương trình tài trợ nghiên cứu và tính năng Trusted Contact đều phản ánh nỗ lực thực sự. Nhưng cải thiện 65–80% trong đánh giá thực nghiệm không giống với cải thiện 65–80% trong kết quả thực tế — và các kiểm toán lâm sàng độc lập chưa tồn tại để thu hẹp khoảng cách đó. Công việc là thực; công việc cũng chưa hoàn chỉnh. Và ở 900 triệu người dùng mỗi tuần, những rủi ro của khoảng cách đó rất cao.