OpenAI đã công bố các mô hình trí tuệ nhân tạo 'thinking' mới O3

2024-12-23 05:45:31

Kết thúc sự kiện kéo dài 12 ngày, OpenAI đã công bố thông báo quan trọng nhất - một mô hình mới nhằm mục tiêu về suy luận O3

Mạng nơ-ron là người kế nhiệm của O1. Nó thể hiện ‘tiêu chuẩn mới của khả năng trong lĩnh vực lập trình, toán học và tư duy khoa học’.

Mẫu mới là một bước tiến đột phá và cho thấy sự cải thiện trong những bài kiểm tra phức tạp nhất, nhấn mạnh bởi đồng sáng lập OpenAI Greg Brockman.

Ngoài ra, O3-Mini được giới thiệu - phiên bản O3 được tối ưu hóa và tăng tốc độ. Nó sẽ là phiên bản đầu tiên trong dòng sản phẩm được phát hành rộng rãi vào đầu năm 2025.

Các mô hình dựa trên lý luận dành nhiều thời gian để trả lời, kiểm tra lại thông tin. Nhờ điều này mà có thể mong đợi nhận được dữ liệu chân thật và chính xác hơn.

Sau khi phát hành o1, một vụ nổ của ‘mạng lưới nơ-ron suy nghĩ’ đã xảy ra. Google đã bắt đầu phát triển một giải pháp tương tự, theo tin tức được biết vào tháng 10. Tháng 11, phòng thí nghiệm DeepSeek của Trung Quốc giới thiệu ‘đối thủ của o1 từ OpenAI’ - một mô hình trí tuệ nhân tạo suy luận ‘siêu mạnh mẽ’ DeepSeek-R1-Lite-Preview. Trong cùng tháng đó, Alibaba cũng giới thiệu một công cụ tương tự.

Mô hình O3 có khả năng lập kế hoạch và thực hiện một loạt hành động trước khi đưa ra câu trả lời. OpenAI mô tả quá trình này như một ‘chuỗi suy nghĩ’. Một tính năng mới là khả năng ‘điều chỉnh’ thời gian suy nghĩ. Mạng nơ-ron có thể được đặt để thực hiện tính toán thấp, trung bình hoặc cao. Giá trị càng cao, càng tốt và càng lâu trả lời.

An toàn

Vào tháng 12, các chuyên gia an ninh phát hiện rằng o1 có xu hướng lừa dối con người hơn so với phiên bản tiêu chuẩn GPT-4o và các mô hình trí tuệ nhân tạo từ các công ty khác.

Trong một nghiên cứu mới được công bố, OpenAI đã trình bày phương pháp được áp dụng để đảm bảo rằng các mạng nơ-ron tuân thủ các giá trị của công ty. Công ty khởi nghiệp đã áp dụng phương pháp này để đào tạo o1 và O3 ‘suy nghĩ’ về chính sách an ninh khi phản ứng

Theo tuyên bố của công ty, phương pháp đã cải thiện tổng thể phù hợp với nguyên tắc của o1

o1 vượt qua ranh giới Pareto so với GPT-4o và các mô hình ngôn ngữ lớn hiện đại khác, từ chối trả lời các yêu cầu độc hại và không loại bỏ những yêu cầu có ý đồ tốt. Dữ liệu: OpenAI. Để tạo ra ‘chuỗi suy nghĩ’, o1 và o3 sau khi nhận được yêu cầu từ người dùng, dành từ vài giây đến vài phút để phân tích vấn đề thành các phần riêng biệt. Để tăng cường an ninh, OpenAI đã huấn luyện mạng nơ-ron kiểm tra lại chính mình hai lần với sự tập trung vào chính sách của mình.

GPT-5 từ OpenAI không đáp ứng kỳ vọng

Trong khi đó, The Wall Street Journal cho biết mẫu flagship tiếp theo GPT-5 đang chậm tiến độ và hiệu suất không đáng giá những khoản chi phí lớn.

Mạng nơ-ron mới có tên mã là Orion đã được đào tạo trên một lượng dữ liệu khổng lồ

Ngoài ra, cũng được cho biết rằng trong quá trình đào tạo trí tuệ nhân tạo, OpenAI không chỉ dựa vào thông tin công khai và các thỏa thuận được cấp phép. Cũng đã sử dụng dữ liệu tổng hợp, được tạo ra bởi o1.

AI đâm vào trần nhà: các start-up đang tìm cách mở rộng tiếp tục

Nhắc lại, trong khuôn khổ sự kiện kéo dài 12 ngày, OpenAI đã giới thiệu Sora, một trình tạo video trí tuệ nhân tạo.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

1 thích