OpenAI5 phút đọc

OpenAI GABRIEL — Biến Nghiên Cứu Định Tính Thành Dữ Liệu Ở Quy Mô Lớn

Bởi AI Guide News·Thứ Sáu, 13 tháng 2, 2026

Nhóm Nghiên cứu Kinh tế của OpenAI vừa phát hành GABRIEL — bộ công cụ mã nguồn mở miễn phí dùng GPT để chuyển đổi văn bản và hình ảnh phi cấu trúc thành các phép đo định lượng, mở ra cách mới mạnh mẽ cho các nhà khoa học xã hội phân tích thế giới ở quy mô lớn.

[AD] Rectangle 300×250 / In-article

Vấn Đề Với Dữ Liệu Định Tính

Dữ liệu định tính kể những câu chuyện phong phú nhất về thế giới — những gì con người nói, viết, dạy, tranh luận và trải nghiệm. Nó bao gồm mọi thứ từ giáo trình và phỏng vấn đến bài đăng mạng xã hội và hình ảnh. Có một lượng khổng lồ dữ liệu như vậy. Nhưng việc chuyển đổi loại dữ liệu đó thành bằng chứng có thể phân tích nghiêm ngặt là cực kỳ tốn thời gian. Một nhà nghiên cứu nghiên cứu diễn ngôn chính trị có thể mất nhiều tháng để phân loại thủ công hàng ngàn bài phát biểu — và các nhà xã hội học phân tích phản hồi khảo sát đối mặt với cùng nút thắt ở mọi quy mô.

Đây là khoảng trống mà OpenAI đang giải quyết với GABRIEL.

GABRIEL Là Gì?

Nhóm Nghiên cứu Kinh tế của OpenAI đã phát hành GABRIEL — bộ công cụ mã nguồn mở sử dụng GPT để chuyển đổi văn bản và hình ảnh phi cấu trúc thành các phép đo định lượng. Được thiết kế cho các nhà kinh tế học, khoa học xã hội và khoa học dữ liệu để nghiên cứu dữ liệu định tính ở quy mô lớn. Ra mắt ngày 13 tháng 2 năm 2026, công cụ này miễn phí và mở cho cộng đồng nghiên cứu.

Bộ công cụ này lấp đầy một trong những khoảng trống dai dẳng nhất trong phương pháp khoa học xã hội: khả năng trích xuất các tín hiệu có cấu trúc, có thể so sánh và phân tích thống kê từ dữ liệu phức tạp, giàu ngữ cảnh định nghĩa trải nghiệm của con người.

GABRIEL Có Thể Làm Gì?

GABRIEL cho phép các nhà nghiên cứu:

Chuyển đổi văn bản thành số liệu — biến các phản hồi khảo sát mở, phỏng vấn, bài báo hay mạng xã hội thành các biến số có thể mã hóa và định lượng
Phân tích hình ảnh ở quy mô lớn — trích xuất các đặc điểm có thể đo lường từ ảnh, sơ đồ hoặc nội dung trực quan vốn đòi hỏi xem xét thủ công
Nghiên cứu dữ liệu định tính một cách nghiêm ngặt — áp dụng khả năng hiểu ngôn ngữ của GPT để tạo ra các phép đo có thể so sánh trên hàng ngàn hoặc hàng triệu điểm dữ liệu
Làm việc đa lĩnh vực — áp dụng cho khoa học chính trị, xã hội học, kinh tế, nghiên cứu giáo dục, truyền thông y tế công cộng và nhiều hơn nữa

Theo truyền thống, công việc mã hóa này được thực hiện thủ công — bởi các nhóm trợ lý nghiên cứu áp dụng các khung xác định trước cho từng tài liệu, từng cái một. GABRIEL rút ngắn quá trình đó từ nhiều tháng xuống còn vài giờ.

Tại Sao Điều Này Quan Trọng Với Khoa Học Xã Hội?

Khoa học xã hội luôn giàu dữ liệu nhưng nghèo phân tích khi nói đến tài liệu định tính. Khoảng trống không phải là thiếu câu hỏi thú vị — mà là chi phí trả lời chúng ở quy mô cần thiết cho sức mạnh thống kê. Một nghiên cứu xem xét giáo trình đại học đã thay đổi như thế nào trong một thập kỷ trên hàng trăm tổ chức trước đây đòi hỏi một đội ngũ đông đảo người mã hóa. GABRIEL làm cho loại dự án đó khả thi cho một nhà nghiên cứu đơn lẻ hoặc nhóm nhỏ.

GPT-5.2 đạt 92% trong bài kiểm tra GPQA — bài kiểm tra kiến thức khoa học cấp tiến sĩ mà các chuyên gia con người trung bình khoảng 70%. Ở mức độ hiểu đó, mô hình có thể áp dụng các khung mã hóa tinh tế, nhận thức ngữ cảnh cho tài liệu định tính phức tạp theo những cách đơn giản là không thể với các công cụ NLP trước đó.

Mã Nguồn Mở Theo Thiết Kế

Phát hành GABRIEL dưới dạng bộ công cụ mã nguồn mở là lựa chọn có chủ đích. Sứ mệnh rộng lớn hơn của OpenAI bao gồm việc cho phép các nhà khoa học di chuyển nhanh hơn và giải quyết các vấn đề khó hơn — và khóa một công cụ nghiên cứu đằng sau một khoản phí sẽ mâu thuẫn trực tiếp với điều đó. Bằng việc cung cấp GABRIEL miễn phí, nhóm Nghiên cứu Kinh tế đang cược rằng việc áp dụng rộng rãi bởi cộng đồng nghiên cứu sẽ tạo ra nhiều giá trị hơn — thông qua phát triển phương pháp, đánh giá đồng nghiệp và ứng dụng thực tế.

Điều này cũng định vị OpenAI như một đối tác thực sự của giới học thuật thay vì chỉ là nhà cung cấp — điều quan trọng khi các trường đại học và tổ chức nghiên cứu điều hướng quyết định áp dụng AI của riêng họ.

Một Phần Của Chiến Lược Khoa Học Lớn Hơn

GABRIEL không tồn tại đơn lẻ. Đây là một phần trong chiến lược rộng lớn hơn của OpenAI nhằm trở thành lớp AI nền tảng cho nghiên cứu khoa học — cùng với Prism cho viết khoa học, ChatGPT Health cho y tế và OpenAI for Healthcare cho các tổ chức lâm sàng. Mô hình nhất quán: xác định một lĩnh vực nơi AI có thể giảm ma sát trong công việc nghiên cứu hàng ngày, xây dựng công cụ phù hợp mục đích và phát hành với rào cản thấp hoặc không có.

Khoa học xã hội là mục tiêu đặc biệt thú vị vì dữ liệu nó nghiên cứu — hành vi con người, ngôn ngữ, niềm tin, động lực xã hội — chính xác là nơi các mô hình ngôn ngữ lớn có năng lực tự nhiên sâu sắc nhất. GABRIEL, theo nghĩa đó, là cược vào AI làm điều mà nó luôn giỏi nhất: hiểu văn bản do con người tạo ra, ở quy mô lớn.

openaigabrielkhoa-học-xã-hộinghiên-cứugptmã-nguồn-mởđịnh-lượngkinh-tế