DeepSeek V4 menggegarkan perlumbaan AI dengan sumber terbuka dan harga yang jatuh

  • DeepSeek V4 tiba dalam format terbuka dengan varian Pro dan Flash, serta tetingkap konteks sehingga satu juta token.
  • Model ini mempunyai keupayaan penaakulan dan ejen pada tahap sistem tertutup yang besar, tetapi dengan kos pengiraan yang sangat rendah.
  • Perikatan dengan Huawei dan pengoptimuman untuk cip Ascend 950PR bertujuan untuk mengurangkan kebergantungan pada pembekal NVIDIA dan Barat.
  • Bagi Eropah dan Sepanyol, ia membuka pilihan yang lebih murah dan boleh digunakan secara tempatan, walaupun terdapat keraguan tentang sokongan Sepanyol dan kematangan ekosistem.

DeepSeek V4

Generasi baharu model bahasa daripada DeepSeek, syarikat baharu China yang berpangkalan di Hangzhou, telah menjadi salah satu perkembangan yang paling banyak diperkatakan dalam landskap kecerdasan buatan. Siri mereka DeepSeek V4 pecah masuk Pada masa yang penuh dengan tawaran dan janji, tetapi dengan mesej yang sangat jelas: untuk menawarkan keupayaan peringkat tertinggi dalam penaakulan dan ejen, dengan tetingkap konteks yang besar dan, yang paling penting, dengan kos penggunaan yang jauh lebih rendah berbanding pesaingnya di Amerika.

Pelancaran ini bukanlah acara terpencil. Ia berlaku hanya beberapa hari selepas versi baharu SembangGPT dan model tertutup yang lainDan di tengah-tengah usaha berterusan China untuk mengurangkan kebergantungan teknologinya terhadap Barat, DeepSeek V4 menggabungkan a strategi sumber terbukaPenetapan harga yang agresif dan kerjasama rapat dengan Huawei dalam bidang perkakasan boleh mengubah keseimbangan kuasa bagi syarikat-syarikat Eropah yang mencari alternatif yang lebih murah dan lebih terkawal.

Apakah DeepSeek V4 dan bagaimana ia dibina?

Keluarga DeepSeek V4 terdiri daripada Model bahasa Campuran Pakar (MoE) direka bentuk untuk menjadi sangat cekap dalam konteks jangka panjang. Syarikat itu bercakap tentang model utama dengan sekitar 1 trilion jumlah parameterdi mana hanya sebahagian kecil diaktifkan dalam setiap token, dan versi yang lebih bercita-cita tinggi, V4-Pro, yang mencapai 1,6 trilion parameter, dengan kira-kira 49.000 bilion aset setiap pertanyaan.

Kunci kepada pendekatan MoE DeepSeek ialah, walaupun jumlah parameter adalah sangat besar, hanya puluhan bilion yang diaktifkan pada setiap langkah inferens. Ini membolehkan mengurangkan kos pengkomputeran dan memori secara drastik berbanding model padat yang bersaiz serupa. Beberapa bahan teknikal menyebut lebih kurang 37.000 bilion parameter aktif setiap token Dalam salah satu varian, ini sesuai dengan idea kecekapan yang melampau tanpa mengorbankan prestasi.

Dua varian: V4-Pro dan V4-Flash untuk keperluan yang berbeza

DeepSeek telah membahagikan tawarannya kepada dua model utama: V4-Pro dan V4-FlashV4-Pro ialah model utama, dengan parameter 1,6 trilion yang dinyatakan di atas dan tumpuan kepada penaakulan yang mendalam, pengetahuan global, dan keupayaan ejenterutamanya dalam pengaturcaraan dan tugasan analisis yang kompleks.

Bagi pihaknya, V4-Flash dibentangkan sebagai versi ringan dan pantasIa mempunyai kira-kira 284.000 bilion jumlah parameter dan sekitar 13.000 bilion parameter aktif, juga mengekalkan tetingkap konteks sehingga satu juta tokenIa direka bentuk untuk penggunaan besar-besaran, yang mana kos setiap token, latensi dan kebolehskalaan adalah lebih penting daripada mengurangkan setiap sepersepuluh terakhir penanda aras.

Dualiti Pro/Flash ini mempunyai lebih daripada strategi komersial yang melangkaui pembezaan teknikal yang mudahV4-Pro menyasarkan syarikat besar, makmal dan kes penggunaan yang memerlukan prestasi tertinggi; Sebaliknya, V4-Flash bertujuan untuk menjadi "kuda kerja" untuk PKS, syarikat baharu dan perkhidmatan volum tinggi yang memerlukan AI yang cekap dan murah.

Konteks sejuta token: perubahan apa dalam penggunaan dunia sebenar

Salah satu ciri paling menarik DeepSeek V4 ialah tetingkap konteks ultra panjang sehingga satu juta tokenIni jauh melebihi 128.000 token yang biasa terdapat dalam banyak model perniagaan semasa. Dalam praktiknya, ini bersamaan dengan keupayaan untuk bekerjasama dengan beratus-ratus ribu patah perkataan dalam satu pertanyaan: manual teknikal yang lengkap, repositori kod yang besar, rekod khidmat pelanggan yang sah atau bersejarah tanpa perlu memecahkannya.

Di luar rajah tersebut, konteks yang luas ini boleh mengurangkan kos dan kesilapan yang terhasil daripada pemisahan dokumenLebih sedikit panggilan API diperlukan, terdapat kurang risiko kehilangan maklumat antara imbasan, dan reka bentuk produk yang bergantung pada jumlah teks yang besar menjadi lebih mudah. ​​DeepSeek mempersembahkan model ini bukan sekadar chatbot mudah, tetapi sebagai pembantu projek atau ejen yang mampu merancang dan menyusun tugasan pada set data yang besar.

Di Eropah dan Sepanyol, konteks jenis ini amat menarik untuk sektor seperti perundangan, kewangan, perundingan, pentadbiran awam atau penjagaan kesihatandi mana ia adalah perkara biasa untuk mengendalikan dokumentasi yang sangat luas. Cabarannya adalah untuk mengesahkan sama ada model mengekalkan kapasiti tersebut dengan latensi yang munasabah dan kos setiap juta token yang benar-benar kompetitif dalam persekitaran pengeluaran.

Kebolehan dan ejen penaakulan: pertaruhan untuk bersaing dengan sistem tertutup

DeepSeek mendakwa bahawa V4-Pro Ia mengatasi kebanyakan model bumbung terbuka semasa. Dalam ujian pengetahuan dan penaakulan global, ia hanya sedikit ketinggalan di belakang beberapa model sumber tertutup terbaik, seperti lelaran terkini Gemini. Dalam penaakulan lanjutan, syarikat itu mendakwa setanding dengan penyelesaian premium daripada OpenAI dan Anthropic.

Dalam bidang ejen dan tugasan yang dipautkanDeepSeek V4 telah direka bentuk untuk berfungsi lebih daripada sekadar penjana teks. Syarikat itu telah pun menggunakan V4-Pro secara dalaman untuk pengaturcaraan berbantukan komputer, automasi aliran kerja dan analisis kompleks, dengan idea bahawa model itu boleh merancang, melaksanakan dan mengesahkan subtugasan dengan cara yang agak autonomi.

Bagi syarikat Sepanyol yang mengendalikan automasi proses, pembangunan perisian atau pejabat belakang intensif dataGabungan penaakulan yang kukuh, konteks yang panjang dan kos yang rendah boleh menjadi menarik. Walau bagaimanapun, tahap kematangan sebenar ejen V4 dan keteguhan dalam Bahasa Sepanyol Ini masih merupakan aspek yang perlu dinilai dalam ujian bebas.

Model sumber terbuka berbanding model tertutup: impak untuk Eropah

Siri V4 dibentangkan sebagai model terbuka dengan akses awalDeepSeek telah mengeluarkan V4-Pro dan V4-Flash pada platform seperti Hugging Face dalam mod pratonton, membolehkan pengujian dalam sembangnya sendiri dan melalui API. Sesetengah varian menyebut Lesen jenis MIT yang akan membuka pintu kepada muat turun dan penggunaan tempatan tanpa sekatan biasa bagi kebanyakan model perniagaan.

Pendekatan ini secara langsung berhadapan dengan strategi model Silicon Valley yang ditutupDan dengan perdebatan yang berterusan tentang cara menutup sumber terbuka, di mana akses sering dikaitkan dengan kontrak API, penyedia awan tertentu dan harga yang lebih tinggi, jika DeepSeek V4 mengesahkan bahawa jurang prestasi antara sumber terbuka dan tertutup telah mengecil kepada hampir tiada, banyak syarikat Eropah mungkin akan mempertimbangkan semula pergantungan mereka pada vendor AS.

Dalam konteks kawal selia EU, ditandai dengan Akta AI dan keperluan ketat mengenai kedaulatan dataMempunyai model berkuasa yang boleh dijalankan di premis atau di awan Eropah tanpa kehilangan kawalan ke atas maklumat menjadi faktor utama. Walau bagaimanapun, sumber terbuka China juga menimbulkan persoalan politik dan kepercayaan yang perlu dipertimbangkan dengan teliti oleh kerajaan dan syarikat besar.

Perikatan dengan Huawei dan perkakasan alternatif kepada NVIDIA

Salah satu elemen DeepSeek V4 yang paling halus ialah perubahan dalam asas perkakasanSusulan kontroversi mengenai penggunaan GPU NVIDIA H800 dan juga tuduhan mengenai penggunaan cip Blackwell yang diharamkan, syarikat itu telah memperkukuhkan hubungan dengan Huawei untuk mengurangkan pendedahannya kepada sekatan AS.

Tidak lama selepas mengumumkan V4, Huawei secara rasmi mengumumkan bahawa ia akan menyediakannya Cip Ascend dan sistem supernod untuk melaksanakan tugasan inferens DeepSeek. Antaranya, pemecut menonjol. Atlas 350 dikuasakan oleh pemproses Ascend 950PRyang telah dioptimumkan khusus untuk model MoE jenis ini dan telah pun dijual sebagai alternatif tempatan kepada infrastruktur berasaskan NVIDIA.

Dokumentasi teknikal V4 menyebut tentang perkembangan kernel yang disesuaikan untuk perkakasan Huawei dan GPU NVIDIAKeserasian berganda ini akan membolehkan syarikat itu bertahan daripada sekatan Barat yang berpotensi dan pada masa yang sama memanfaatkan kekuatan ekosistem cip China. Bagi Eropah, langkah ini membuka pintu kepada penawaran AI yang berkuasa yang tidak sepenuhnya terikat dengan rantaian bekalan Amerika Utara, walaupun penggunaan perkakasan dari China juga akan diteliti dari perspektif... keselamatan siber dan pergantungan strategik.

Strategi penetapan harga: kesan kepada kos setiap juta token

DeepSeek telah lama meletakkan dirinya sebagai pilihan "penaakulan murah"Ia telah berbuat demikian dengan model R1 dan kini mengukuhkan komitmen dengan V4. Dalam anggaran yang dikemukakan oleh syarikat itu sendiri dan oleh penyedia API yang telah menguji model tersebut, kos inferens mungkin sekitar $0,30 setiap juta token, jauh lebih rendah daripada yang dikenakan oleh kebanyakan perkhidmatan premium Barat.

Tambahan pula, DeepSeek menegaskan bahawa, untuk varian Flash, Ia akan mengekalkan kadar yang serupa dengan model V2. Dilancarkan pada tahun 2024, dan juga telah memberi bayangan bahawa harga boleh jatuh lebih jauh pada separuh kedua tahun 2026...kerana supernod Ascend 950PR Huawei digunakan secara besar-besaran. Pengumuman ini telah memberi kesan serta-merta kepada Pasaran saham China, melonjakkan syarikat semikonduktor tempatan.

Secara praktikalnya, bagi syarikat Sepanyol yang memproses dokumen undang-undang yang panjang, sejarah kewangan atau jumlah interaksi pelanggan yang besar, struktur penetapan harga ini membolehkannya beroperasi dengan margin yang jauh lebih tinggi kepada yang diperoleh dengan API yang lebih mahal. Walau bagaimanapun, masih belum dapat dilihat sama ada kadar ini akan kekal sebaik sahaja V4 keluar dari mod pratonton dan sama ada sebahagian daripada penjimatan akan diimbangi oleh kerumitan pelaksanaan yang lebih besar berbanding perkhidmatan yang lebih matang.

Ketersediaan, status pembangunan dan akses dari Eropah

DeepSeek V4, menurut syarikat itu sendiri, adalah dalam mod "pratonton" atau akses awalVarian V4-Pro dan versi yang lebih ringan sudah boleh diuji melalui sembang rasmi DeepSeek dan melalui API, manakala beberapa penyedia pihak ketiga, seperti platform pihak ketiga yang menawarkan nod ujianMereka telah mula memberikan akses terhad kepada pembangun.

Pelan hala tuju syarikat telah mengalami beberapa masalah kelewatan berbanding tarikh yang pada mulanya dibocorkanyang menunjukkan keluaran penuh sepanjang separuh pertama tahun 2026. Walaupun begitu, dalam praktiknya sudah ada model V4 yang dipaparkan di repositori awam, sedia untuk diuji dan digunakan dalam persekitaran makmal.

Bagi organisasi Eropah dan Sepanyol, akses kini tertumpu kepada API awam, muat turun daripada repositori sumber terbuka dan pengujian pada awan antarabangsaPelaksanaan infrastruktur dalaman akan bergantung pada keupayaan untuk mempunyai GPU yang serasi atau, jika perlu, perkakasan Cina yang diluluskan, sesuatu yang mungkin bercanggah dengan keselamatan dalaman dan keperluan pematuhan peraturan.

Implikasi untuk syarikat baharu dan syarikat di Sepanyol dan Eropah

Bagi fabrik keusahawanan Sepanyol dan negara-negara EU yang lain, DeepSeek V4 mewakili kemungkinan pendemokrasian akses kepada model skala "perusahaan"Dengan kos per juta token yang jauh lebih rendah dan pilihan pelaksanaan tempatan, projek yang sebelum ini memerlukan pusingan pembiayaan yang besar untuk menampung perbelanjaan API dan GPU kini boleh mempertimbangkan prototaip peringkat tinggi dengan sumber yang lebih terhad.

Dalam sektor seperti fintech, legaltech, kesihatan digital atau analitik dataKeupayaan untuk memproses konteks yang sangat besar dan menyelenggara data dalam infrastruktur yang dikawal oleh syarikat itu sendiri boleh membuat perbezaan yang besar dalam memenuhi keperluan Peraturan perlindungan data EropahWalau bagaimanapun, dominasi bahasa Inggeris dan Cina dalam dokumentasi rasmi, serta keutamaan yang diberikan kepada bahasa-bahasa ini dalam latihan, menunjukkan bahawa Bahasa Sepanyol memerlukan kerja penalaan halus tambahan untuk mencapai prestasi yang benar-benar kompetitif.

Isu lain ialah kematangan ekosistem alatan sekitar DeepSeek V4. Tidak seperti model seperti Llama atau GPT, yang mempunyai rangka kerja sumber terbukaVersi 4 bermula dengan kurang sokongan sedia ada. Syarikat yang mempunyai pasukan teknikal yang kecil perlu menilai sama ada mereka boleh mengendalikan lengkung integrasi tersebut atau sama ada mereka lebih suka menunggu persekitaran menjadi lebih mantap.

Dimensi geopolitik dan kawal selia: AI sebagai medan geseran baharu

Kemunculan V4 berlaku dalam konteks di mana AI ialah vektor kuasa ekonomi dan strategik.Model Cina yang terbuka dan berdaya saing memberi tekanan kepada naratif Barat tentang kepimpinan teknologi dan menambah ketegangan kepada perbincangan tentang kebergantungan teknologi dan piawaian global.

Walaupun China menyahut cabaran itu dengan penawaran kapasiti perindustrian, cip proprietari dan penggunaan pantasEropah cenderung untuk memperkukuhkan komponen kawal selia dan keperluan untuk ketelusan, keselamatan dan etika. Kemungkinan model terbuka yang berasal dari China boleh menjadi penanda aras global mungkin menggalakkan kerajaan Eropah untuk tingkatkan tembok api kawal seliaContohnya, dalam perolehan awam atau sektor kritikal.

Ini boleh menyebabkan Pasaran AI berpecah-belah mengikut blokDalam konteks ini, syarikat Sepanyol dan Eropah mesti memilih antara model AS yang sangat dikekang oleh peraturan penggunaan mereka sendiri, penyelesaian Eropah yang masih dalam pembangunan, dan cadangan China yang kuat dengan komponen geopolitik yang kompleks. DeepSeek V4, dengan gabungan sumber terbuka, kos rendah, dan sokongan Huawei, berada betul-betul di tengah-tengah perdebatan ini.

Secara keseluruhan, DeepSeek V4 dijangka menjadi salah satu pesaing paling serius untuk membawa model bahasa peringkat tinggi ke dalam bidang sumber terbuka dan harga yang agresifTingkap konteksnya yang sangat besar, pakatan dengan perkakasan alternatif kepada NVIDIA, dan tumpuan kepada ejen dan penaakulan menjadikannya pilihan untuk diperhatikan dengan teliti dari Sepanyol dan seluruh Eropah; impak sebenar akan bergantung pada prestasinya dalam pengeluaran, sokongan sebenar dalam bahasa Sepanyol, dan sejauh mana syarikat sanggup memasukkan sebahagian penting infrastruktur AI mereka daripada ekosistem teknologi Cina.

Sumber terbuka Grok 2.5
artikel berkaitan:
xAI mengeluarkan Grok 2.5 sebagai sumber terbuka: lesen, butiran dan keperluan