11:25
DeepSeek V3.2 versi resmi dirilis: Memperkuat kemampuan Agent, mengintegrasikan pemikiran dan penalaran
Laporan Golden Finance, hari ini, kami secara bersamaan merilis dua model versi resmi: DeepSeek-V3.2 dan DeepSeek-V3.2-Speciale. DeepSeek-V3.2 adalah model pertama yang kami luncurkan yang mengintegrasikan pemikiran ke dalam penggunaan alat, dan secara bersamaan mendukung pemanggilan alat dalam mode berpikir dan mode tidak berpikir. Kami mengusulkan metode sintesis data pelatihan Agent skala besar, membangun banyak tugas pembelajaran penguatan "sulit dijawab, mudah diverifikasi" (lebih dari 1800 lingkungan, lebih dari 85.000 instruksi kompleks), secara signifikan meningkatkan kemampuan generalisasi model. (DeepSeek)
- 1
- 2