News | Gate.com

Hôm nay

05:17

GPT-5.5 Trở Lại Tuyến Đầu Trong Lập Trình, Nhưng OpenAI Đổi Benchmark Sau Khi Thua Opus 4.7

Tin tức cổng, ngày 27 tháng 4 — SemiAnalysis, một công ty phân tích chất bán dẫn và AI, đã phát hành một bảng benchmark so sánh các trợ lý lập trình bao gồm GPT-5.5, Claude Opus 4.7 và DeepSeek V4. Phát hiện then chốt: GPT-5.5 đánh dấu lần đầu tiên OpenAI quay trở lại tuyến đầu trong các mô hình lập trình trong vòng sáu tháng, với các kỹ sư của SemiAnalysis hiện đang luân phiên giữa Codex và Claude Code sau trước đó gần như chỉ dựa vào Claude. GPT-5.5 dựa trên một cách tiếp cận huấn luyện trước mới được mã danh "Spud" và thể hiện lần mở rộng quy mô huấn luyện trước đầu tiên của OpenAI kể từ GPT-4.5. Trong thử nghiệm thực tế, một sự phân công rõ ràng đã xuất hiện. Claude đảm nhiệm lập kế hoạch dự án mới và thiết lập ban đầu, trong khi Codex tỏ ra xuất sắc trong việc sửa các lỗi đòi hỏi nhiều suy luận. Codex thể hiện khả năng hiểu cấu trúc dữ liệu tốt hơn và lý luận logic mạnh hơn nhưng gặp khó khăn trong việc suy ra ý định người dùng mơ hồ. Trong một tác vụ trên cùng một bảng điều khiển, Claude tự động tái tạo bố cục trang tham chiếu nhưng bịa ra một lượng lớn dữ liệu, trong khi Codex bỏ qua bố cục nhưng lại cung cấp lượng dữ liệu chính xác hơn đáng kể. Bài phân tích tiết lộ chi tiết thao túng benchmark: Bài đăng blog của OpenAI hồi tháng 2 đã kêu gọi ngành áp dụng SWE-bench Pro làm tiêu chuẩn mới cho các benchmark lập trình. Tuy nhiên, thông báo của GPT-5.5 đã chuyển sang một benchmark mới có tên "Expert-SWE." Lý do, được chôn trong các chi tiết nhỏ, là GPT-5.5 đã bị Opus 4.7 vượt qua trên SWE-bench Pro và thua kém đáng kể so với Mythos 77.8% chưa được phát hành của Anthropic. Về Opus 4.7, Anthropic đã công bố một bài phân tích hậu kiểm một tuần sau khi phát hành, thừa nhận ba lỗi trong Claude Code đã tồn tại trong nhiều tuần từ tháng 3 đến tháng 4, ảnh hưởng đến gần như tất cả người dùng. Trước đó, nhiều kỹ sư đã báo cáo sự suy giảm hiệu năng ở phiên bản 4.6 nhưng bị bác bỏ như những quan sát chủ quan. Ngoài ra, bộ mã thông báo (tokenizer) mới của Opus 4.7 làm tăng số lượng token lên đến 35%, điều mà Anthropic đã công khai thừa nhận—thực chất tương đương với một đợt tăng giá ẩn. DeepSeek V4 được đánh giá là "theo kịp với tuyến đầu nhưng không dẫn đầu," định vị mình là lựa chọn thay thế có chi phí thấp nhất trong số các mô hình nguồn đóng. Bài phân tích cũng ghi nhận rằng "Claude tiếp tục vượt trội DeepSeek V4 Pro trên các tác vụ viết tiếng Trung có độ khó cao," và bình luận rằng "Claude đã thắng mô hình Trung Quốc ngay trên chính ngôn ngữ của nó." Bài viết đưa ra một khái niệm quan trọng: nên đánh giá giá mô hình theo "chi phí cho mỗi tác vụ" thay vì "chi phí cho mỗi token." Giá của GPT-5.5 gấp đôi so với GPT-5.4 input $5, output per million tokens, nhưng nó hoàn thành các tác vụ tương tự bằng ít token hơn, vì vậy chi phí thực tế không nhất thiết cao hơn. Dữ liệu ban đầu của SemiAnalysis cho thấy tỉ lệ đầu vào/đầu ra của Codex là 80:1, thấp hơn tỉ lệ 100:1 của Claude Code.

Xem thêm

03:21

OpenAI hợp tác với MediaTek và Qualcomm để phát triển bộ xử lý AI cho điện thoại thông minh, Foxconn Connector sẽ bắt đầu sản xuất vào năm 2028

Tin tức ngành AI

Tin cổng thông tin, ngày 27 tháng 4 — OpenAI đang hợp tác với MediaTek và Qualcomm để phát triển bộ xử lý cho điện thoại thông minh, theo phân tích chuỗi cung ứng của nhà phân tích Ming-Chi Kuo thuộc Tianfeng International Securities. Foxconn Connector (Luxshare Precision) sẽ đảm nhiệm vai trò là đối tác thiết kế hệ thống độc quyền và

Xem thêm

02:21

Samsung SDS Giành Được Quyền Bán ChatGPT Edu của OpenAI tại Hàn Quốc

Tin tức ngành AI

Tin tức từ Gate, ngày 27 tháng 4 — Samsung SDS, đơn vị dịch vụ CNTT của Tập đoàn Samsung, cho biết họ đã giành được quyền bán ChatGPT Edu của OpenAI. Công ty đang triển khai một chương trình thử nghiệm (proof of concept) với Đại học Quốc gia Hàn Quốc về Phát thanh và Truyền thông, bao phủ khoảng 90.000 sinh viên,

Xem thêm

01:13

Sam Altman vạch ra năm nguyên tắc vận hành của OpenAI, báo hiệu khả năng hạn chế quyền truy cập năng lực mô hình trong tương lai vì an toàn

Tin tức ngành AI

Tin tức cổng, ngày 27 tháng 4 — Giám đốc điều hành OpenAI Sam Altman đã công bố năm nguyên tắc vận hành cho công ty dưới chữ ký cá nhân của mình, báo hiệu rằng OpenAI có thể hạn chế quyền truy cập của người dùng vào năng lực của mô hình trong một số giai đoạn nhất định để ưu tiên an toàn. Trong tuyên bố, Altman đã mô tả một kịch bản tương lai có thể

Xem thêm

15:01

OpenAI Tuyển Dụng Nhân Tài Hàng Đầu Ngành Phần Mềm Doanh Nghiệp Khi Các Tác Nhân Tuy Tiến Phá Vỡ Ngành

Cổ phiếu

Tác nhân AI

Tin tức ngành AI

Tin tức Gate News ngày 26 tháng 4 — OpenAI và Anthropic đã tuyển dụng các lãnh đạo cấp cao và kỹ sư chuyên biệt từ các công ty phần mềm doanh nghiệp lớn, bao gồm Salesforce, Snowflake, Datadog và Palantir. Denise Dresser, cựu CEO của Slack thuộc Salesforce, gia nhập OpenAI với vai trò giám đốc doanh thu cấp cao

Xem thêm

03:33

OpenAI Sáp Nhập Codex Vào Mô Hình Chính Bắt Đầu Từ GPT-5.4, Ngừng Dòng Lập Trình Riêng

Tin tức ngành AI

Tin tức Cổng, ngày 26 tháng 4 — Giám đốc bộ phận trải nghiệm nhà phát triển của OpenAI, Romain Huet, đã tiết lộ trong một tuyên bố gần đây trên X rằng Codex, dòng mô hình lập trình chuyên biệt được công ty duy trì độc lập, đã được sáp nhập vào mô hình chính bắt đầu từ GPT-5.4 và sẽ không còn nhận các bản cập nhật riêng biệt

Xem thêm

09:21

Thẩm phán bác bỏ các cáo buộc gian lận trong vụ kiện OpenAI của Elon Musk; Vụ án tiến tới xét xử với hai cáo buộc còn lại

Tin tức ngành AI

Tin Cổng, ngày 24 tháng 4 — Một thẩm phán liên bang đã bác bỏ các cáo buộc gian lận trong vụ kiện của Elon Musk chống lại OpenAI, Sam Altman, Greg Brockman và Microsoft, mở đường để vụ việc được đưa ra xét xử dựa trên hai cáo buộc còn lại: vi phạm tín thác từ thiện và làm giàu bất chính. Mỹ.

Xem thêm

08:52

Giám đốc điều hành OpenAI Sam Altman xin lỗi vì đã không báo cáo tài khoản bị cấm của kẻ xả súng tại trường học cho cảnh sát

Tin tức ngành AI

Tin tức cổng Gate News, ngày 25 tháng 4 — Giám đốc điều hành OpenAI Sam Altman đã xin lỗi cộng đồng Tamborine ở Canada vì công ty đã không thông báo cho cảnh sát về một tài khoản bị cấm liên quan đến Jesse Van Rootselaar, người đã giết tám người tại một trường học vào tháng 2 trước khi tự sát. OpenAI

Xem thêm

06:12

Các thương vụ IPO của SpaceX, OpenAI và Anthropic Có Thể Thu Hút Hơn $240 tỷ đô la, Thậm Chí Có Thể Ảnh Hưởng Đến Thanh Khoản Thị Trường Crypto

Kinh tế vĩ mô

Cổ phiếu

Tin tức ngành AI

Tin tức Cổng, ngày 25 tháng 4 — Theo các báo cáo thị trường, SpaceX dự kiến sẽ lên sàn vào tháng 6 với mục tiêu huy động vốn vượt kỷ lục $29 tỷ đô la của IPO Saudi Aramco, trong khi OpenAI và Anthropic đang lên kế hoạch niêm yết vào nửa sau năm 2026. Ba công ty này được dự đoán sẽ

Xem thêm

BTC-0,2%

ETH-0,07%

03:11

Nvidia Triển Khai Tác Nhân AI Codex của OpenAI trên Toàn Bộ Lực Lượng Lao Động với Hạ Tầng Blackwell

Tác nhân AI

Tin tức ngành AI

Tin từ Gate News, ngày 25 tháng 4 — Nvidia đã triển khai Codex của OpenAI, một tác nhân AI được cung cấp bởi GPT-5.5, cho toàn bộ lực lượng lao động của mình sau một thử nghiệm thành công với khoảng 10.000 nhân viên, theo các trao đổi nội bộ từ CEO Jensen Huang và CEO OpenAI Sam Altman. Codex được thiết kế để hỗ trợ

Xem thêm