Shotcut 25.10 tiba dengan AI tempatan, HTML dan tangkapan asli

  • Teks-ke-ucapan tempatan dengan sokongan KokoroDoki dan CPU/GPU melalui Docker.
  • Penjana HTML dan penapis "Mesin Taip" dengan pratetap, ketelusan dan had 15 FPS.
  • Rakaman skrin asli mengikut persekitaran (FFmpeg, GNOME, Spectacle atau OBS).
  • Kemas kini kepada FFmpeg 8, perpustakaan yang dirombak dan beberapa pembetulan utama.

Shotcut 25.10

Editor video sumber terbuka yang paling terkenal pada desktop Linux Dia membuat langkah lain.. Shotcut 25.10 Ia sudah ada di sini dan dimuatkan dengan ciri yang menyasarkan produktiviti secara langsung: kecerdasan buatan tempatan, penjana HTML untuk tajuk bergaya dan rakaman skrin asli yang mengelak daripada bergantung pada utiliti luaran.

Selepas tempoh ujian beta, keluaran sebagai versi yang stabil mengesahkan bahawa projek itu sedang berjalan dengan mantap mengikut peta jalannya. Inovasi bintang ialah teks ke pertuturan (TTS) untuk nota dan sari kata, disertakan dengan penapis mesin taip, penjana imej/video daripada HTML dan kemas kini kepada FFmpeg 8, tidak lupa pakej pembaikan dan peningkatan keserasian yang baik.

Gambaran Keseluruhan: Perkara yang berubah dalam Shotcut 25.10

Pasukan ini telah menggabungkan ciri AI sejak kebelakangan ini: pertama kali datang transkripsi dengan Whisper (suara-ke-teks) dan kini bulatan dilengkapkan dengan teks-ke-ucapan bersepadu dan tempatanGabungan ini membuka aliran kerja yang sangat berkuasa untuk menceritakan, menyari kata dan membuat kandungan boleh diakses tanpa meninggalkan editor.

Bersama AI, ansuran ini memperkenalkan alat kreatif yang disokong oleh HTML dan ciri yang diminta oleh komuniti, seperti rakaman skrin merentas platform. Keluaran ini juga meningkatkan asas teknikal dengan FFmpeg 8 dan perpustakaan utama yang dikemas kini.

Shotcut 25.10 memperkenalkan teks-ke-ucapan tempatan untuk nota dan sari kata

Pelaksanaan TTS dalam Shotcut bergantung pada KokoroDoki dan model Kokoro 82MIa ialah enjin sintesis pertuturan sumber terbuka yang boleh berfungsi dalam masa nyata. Perlu diingat bahawa versi 25.07 menggabungkan model ucapan-ke-teksCiri yang paling ketara ialah segala-galanya berlaku pada komputer anda: tiada penghantaran ke awan, jadi privasi dan kawalan projek terjamin.

Untuk mempercepatkan pemprosesan, KokoroDoki boleh menggunakan NVIDIA CPU atau GPU dengan CUDAPada mesin dengan kad grafik yang serasi, anda akan melihat masa penjanaan yang jauh lebih singkat, yang dihargai apabila mengulangi banyak baris sari kata atau semasa menyediakan alih suara yang panjang.

Mengenai suara, pakej semasa lebih lengkap dalam bahasa Inggeris. Bahasa Inggeris Amerika mempunyai lebih daripada dua puluh suara.Versi British menawarkan sekitar lapan bahasa, dan liputan untuk bahasa lain lebih terhad buat masa ini. Rangkaian dijangka akan berkembang dalam semakan masa hadapan, tetapi pada mulanya sudah ada bahan yang mencukupi untuk model, prototaip dan projek akhir dalam bahasa Inggeris.

Terdapat satu butiran teknikal yang perlu diingat: Penyepaduan dilakukan menggunakan Docker.Ini menambah langkah tambahan dalam persediaan berbanding ciri lain, terutamanya jika anda tidak pernah menggunakan bekas sebelum ini. Ia bukan halangan yang tidak dapat diatasi, tetapi ia berbaloi untuk mengetepikan beberapa minit untuk memperhalusi segala-galanya.

Shotcut 25.10, menjana daripada HTML dan kesan mesin taip

Kreativiti berkembang dengan dua sumbangan yang seiring: yang baharu Penjana "Imej/Video daripada HTML". dan kesan teks yang menyerupai mesin taip. Pendekatannya adalah jelas: untuk membawa keupayaan penyemak imbas ke garis masa untuk menghasilkan tajuk, kapsyen dan animasi dengan latar belakang telus dan tanpa sebarang pemalam yang luar biasa.

Penjana HTML mencipta Imej atau klip dengan ketelusan lalaiUntuk mengekalkan kestabilan, video yang dihasilkan dihadkan kepada 15 bingkai sesaat, nilai yang mencukupi untuk grafik dan tindanan yang mengelakkan kesesakan. Hasilnya segera kelihatan. Ia dibuka secara automatik dalam pemapar Asal bersama-sama dengan HTMLnya, supaya anda boleh menyemak atau mengubah suai kod dengan cepat.

Kesan "Teks: Mesin taip" termasuk pratetap sedia untuk digunakan dan lain-lain yang direka untuk penyesuaian. Antara profil yang disertakan ialah: Imej 3D, lejang anjal, dilipat, logam emas o masa berpartiAlat ini merangkumi segala-galanya daripada kemasan imej pepejal kepada animasi video yang lebih menyeronokkan. Jika anda selesa dengan CSS dan JS, anda mempunyai peluang untuk mencipta kerja yang sangat serius.

  • Keserasian dengan Kod disusun daripada CodePen, sesuai untuk menggunakan semula coretan dan reka bentuk yang anda sudah ada dalam simpanan anda.
  • Render dengan had sebanyak 15 FPS untuk kestabilan dalam penjanaan berasaskan pelayar.
  • Kemungkinan kreatif dengan latar belakang yang telus tanpa komposisi yang rumit.

Rakaman skrin asli dan merentas platform

Satu lagi permintaan komuniti klasik akhirnya tiba: rakaman skrin bersepaduPelaksanaannya berbeza-beza bergantung pada persekitaran, tetapi dalam semua kes bahagian belakang asli yang paling boleh dipercayai telah dicari untuk mengurangkan geseran.

  • X11- Menggunakan FFmpeg sebagai bahagian belakang utama.
  • Wayland (GNOME): penyepaduan dengan alat tangkapan/siaran skrin asli.
  • Plasma KDE: sokongan dalam Spectacle untuk tangkapan.
  • AlternativaJika tiada satu pun perkara di atas hadir, maka gunakanlah OBS Studio sebagai kad liar.

Ini mengelakkan pemasangan utiliti tambahan dalam kebanyakan kes dan menyatukan aliran kerjaAnda merekod, mengedit dan mengeksport semua daripada aplikasi yang sama. Bagi pencipta tutorial, ulasan perisian atau sesi latihan, ini merupakan peningkatan yang ketara sejak hari pertama.

Shotcut 25.10 mengemas kini enjin multimedia: FFmpeg 8 dan perpustakaan

Terdapat pergerakan di bawah tudung juga. Apl bertukar kepada FFmpeg 8Ini bermakna peningkatan dalam pengekodan/penyahkodan, penapis baharu dan keserasian yang lebih luas dengan format moden. Pada tahap praktikal, ini diterjemahkan kepada eksport yang lebih konsisten dan main balik projek kompleks yang lebih lancar.

Komponen penting juga sedang dikemas kini, seperti SVT-AV1, libaom, dav1d, libvpx, libwebp y bisikan.cppPotongan ini menjejaskan codec AV1, VP9, ​​​​WebP atau transkripsi AI itu sendiri, menutup bulatan untuk aliran kerja yang lebih mantap.

Antara muka Shotcut 25.10 dan penambahbaikan aliran kerja

Butiran kecil yang ditambah: pilihan kini tersedia dalam panel Properties "Buka dengan" dan "Caj semula"Ini adalah perubahan sederhana tetapi praktikal apabila anda perlu memuat semula media yang diedit secara luaran atau melancarkannya dengan cepat menggunakan apl sistem.

Baru Penjana "Imej/Video daripada HTML". Ia wujud bersama penapis "Teks: Mesin Taip", jadi anda boleh menggabungkan penjanaan HTML di luar garis masa (sebagai aset media) dengan animasi mesin taip digunakan pada klip yang telah dimasukkan. Jumlah fleksibiliti bergantung pada kes penggunaan.

Shotcut 25.10 pembetulan pepijat dan peningkatan kestabilan

Keluaran itu membetulkan beberapa masalah menjengkelkan yang telah dilaporkan, serupa dengan kemas kini 25.08. Contohnya Kegagalan eksport apabila nama atau laluan mengandungi aksara ampersand (&)., masalah yang lebih biasa daripada yang kelihatan dalam projek kongsi.

Ia juga menyelesaikan a Masalah memulakan AppImage pada Linux apabila AppImageLauncher dipasang, dan ia telah ditetapkan bingkai utama lanjutan dalam «Teks: Kaya» yang tidak berkelakuan seperti sepatutnya. Akhirnya, a Ralat dalam saluran alfa semasa menyahkod Ut Video, kunci untuk mereka yang bekerja secara telus dalam saluran paip profesional.

Pemasangan dan keserasian

Untuk menjadikan kehidupan lebih mudah di Linux, projek itu mengedarkan a AppImage Universal yang boleh anda muat turun dan jalankan tanpa memasang kebergantungan. Dalam praktiknya, ia hanya perlu memberikan kebenaran melaksanakan dan anda telah selesai.

Dari segi keserasian, sokongan disahkan untuk glibc 2.35 pada Ubuntu 22.04 LTSOleh itu, versi LTS dilindungi. Sebarang pengedaran moden dengan kernel lebih tinggi daripada 5.10 Ia sepatutnya berjalan lancar, manakala pada sistem lama anda mungkin perlu melaraskan perpustakaan.

Kes penggunaan: daripada pencipta kepada pendidik dan pembangun

Bagi mereka yang mencipta kandungan di media sosial atau YouTube, pakej ini sesuai. Anda merakam skrin tanpa meninggalkan editorAnda menggunakan kesan teks yang bergaya dan menjana suara sintetik untuk pengenalan, penjelasan atau seruan bertindak tanpa perlu menceritakan setiap perubahan.

  • Tutorial video: rakaman bersepadu + anotasi TTS untuk irama dinamik.
  • PersembahanTajuk animasi profesional tanpa pemalam berbayar.
  • KebolehcapaianDengan menggabungkan Whisper (suara kepada teks) dan TTS, anda boleh menambah baik sari kata dan penceritaan.

Dalam pendidikan dan latihan, nilainya jelas: kelas rakaman, tutorial video dan bahan sokongan dengan label dan alih suara yang dijana tempatan. Beberapa profil suara bahasa Inggeris membenarkan untuk mengubah nada bergantung pada penonton.

  • Demo perisianTangkapan aplikasi asli tanpa bergantung pada alat luaran.
  • Dokumentasi visualVideo dengan anotasi teknikal dan pecahan teks yang boleh dibaca.
  • Ujian antara muka: rekod dan semak aliran kerja untuk maklum balas pantas.

Perbandingan pantas dengan versi sebelumnya

Berbanding dengan versi sebelumnya, penambahbaikan adalah ketara. Rakaman asli Ia menghapuskan keperluan untuk penyelesaian tambahan pada kebanyakan desktop, dan gabungan HTML+Typewriter menggandakan pilihan untuk tajuk dan pertiga yang lebih rendah.

  • ✅ Rakaman bersepadu tanpa melalui OBS (kecuali dalam senario alternatif).
  • ✅ Kesan teks lanjutan dengan sokongan HTML/CSS dan pratetap kualiti.
  • ✅ Teks ke ucapan untuk nota dan sari kata dalam Shotcut itu sendiri.
  • ✅ FFmpeg 8 untuk prestasi yang lebih baik dan format semasa.
  • ✅ Kestabilan yang diperkukuh dengan pembetulan dalam kes tepi biasa.

Keperluan dan konfigurasi yang disyorkan

Agar segala-galanya berjalan lancar, lebih baik menyasarkan pasukan yang seimbang. Dengan 8 GB RAM anda boleh bekerjaTetapi jika anda bekerja pada projek sederhana/besar, anda akan menghargai mempunyai 16 GB.

  • CPU: sekurang-kurangnya 4 teras untuk kesan dan pengekodan longgar.
  • RAM8 GB minimum, 16 GB disyorkan.
  • GPU: Serasi dengan OpenGL 3.3+; jika anda menggunakan CUDA, ia akan mempercepatkan TTS dengan KokoroDoki.
  • penyimpananSSD untuk media dan cache, terutamanya dalam projek dengan codec berat.

Dalam tetapan projek, ia adalah idea yang baik sepadan dengan FPS dan resolusi ke destinasi akhir anda untuk mengelakkan penskalaan semula yang tidak perlu. Mengekalkan proksi dan pratonton yang dioptimumkan akan menjimatkan anda daripada ketinggalan apabila menambah penapis dan berbilang trek.

Aliran kerja dengan HTML, CodePen dan Mesin Taip

Jika anda benar-benar akan menolak penjana HTML, Kerjakan reka bentuk dalam editor anda atau pada CodePen.Susun/bungkus sumber dan tampalkannya ke dalam templat Shotcut. Ini memastikan fon, gaya dan skrip diselesaikan tanpa panggilan luaran.

Untuk animasi teks, gantikan penapis "Teks: Mesin taip" Dan penjanaan luaran: apabila anda mahukan kelajuan dan sesuatu yang ringan, penapis membebaskan anda daripada masalah; jika anda memerlukan kemasan yang rumit, aliran HTML akan memberi anda lebih kawalan (dan ketelusan asli).

Nota tentang prestasi, privasi dan had

Pendekatan tempatan untuk TTS mempunyai dua kelebihan utama: melindungi kandungan anda Ia mengelakkan kependaman atau bayaran perkhidmatan dalam talian. Sebagai balasan, ia memerlukan konfigurasi Docker dan, untuk kelajuan maksimum, GPU NVIDIA dengan keupayaan CUDA.

Had 15 FPS dalam penjanaan HTML Ia bukan sekadar kehendak: ia menstabilkan pemaparan apabila enjin penyemak imbas menjana video atau imej dengan ketelusan dan lapisan. Dalam amalan, ia lebih daripada mencukupi untuk tajuk, peralihan dan tindanan.

Butiran kecil yang membuat perbezaan

Pilihan "Buka dengan" dalam Properties Ia mempercepatkan mengedit klip dalam alat luaran dan kembali tanpa kehilangan benang, sementara "Isi semula" Ia membolehkan anda memaksa kemas kini media jika fail telah berubah pada cakera. Kedua-dua kunci tersebut, ditambah dengan pemapar Sumber yang membuka kandungan yang dijana HTML secara automatik, menjadikan tugasan seharian lebih mudah.

Jumlah FFmpeg 8 dan perpustakaan yang dirombak Ia juga diterjemahkan kepada ketenangan fikiran: lebih sedikit kejutan apabila mengimport/mengeksport dan pengendalian format terkini seperti AV1 yang lebih baik, bersama-sama dengan penyahkodan yang lebih halus.

Mereka yang datang dari versi terdahulu akan menemui editor itu Ia telah matang tanpa kehilangan intipatinyaIa percuma, merentas platform dan menampilkan pilihan reka bentuk teknikal yang memihak kepada pembangunan tempatan. Perasaan bahawa projek itu mencapai tahap yang diperlukan untuk: prestasi, AI praktikal dan alat kreatif dengan keluk pembelajaran yang lembut.

Shotcut 25.05
artikel berkaitan:
Shotcut 25.05 menambah penambahbaikan HDR sambil menaik taraf Qt kepada versi 6.8.3