free hit counter code
Jumat, Juni 21, 2024
BerandaTeknologiSpawning ingin membangun kumpulan knowledge pelatihan AI yang lebih etis

Spawning ingin membangun kumpulan knowledge pelatihan AI yang lebih etis

Jordan Meyer dan Mathew Dryhurst mendirikan Spawning AI untuk menciptakan alat yang membantu seniman memberikan kontrol lebih besar terhadap cara karya mereka digunakan secara on-line. Proyek terbaru mereka, disebut Sumber.Plusdimaksudkan untuk menyusun media yang “tidak melanggar” untuk pelatihan mannequin AI.

Inisiatif pertama proyek Supply.Plus adalah kumpulan knowledge yang berisi hampir 40 juta gambar area publik dan gambar di bawah Lisensi CC0 Creative Commons, yang memungkinkan pencipta melepaskan hampir seluruh kepentingan hukum atas karya mereka. Meyer mengklaim hal itu, meskipun faktanya ukurannya jauh lebih kecil beberapa kumpulan data pelatihan AI generatif lainnya di luar sana, kumpulan knowledge Supply.Plus sudah cukup “berkualitas tinggi” untuk melatih mannequin penghasil gambar yang canggih.

“Dengan Supply.Plus, kami membangun platform ‘keikutsertaan’ common,” kata Meyer. “Tujuan kami adalah memudahkan pemegang hak untuk menawarkan media mereka untuk digunakan dalam pelatihan AI generatif – dengan persyaratan mereka sendiri – dan tanpa hambatan bagi pengembang untuk memasukkan media tersebut ke dalam alur kerja pelatihan mereka.”

Manajemen hak

Perdebatan seputar etika pelatihan mannequin AI generatif, khususnya mannequin yang menghasilkan karya seni seperti Steady Diffusion dan DALL-E 3 OpenAI, terus berlanjut — dan memiliki implikasi besar bagi para seniman, namun permasalahannya akhirnya mereda.

Mannequin AI generatif “belajar” menghasilkan keluarannya (misalnya, seni fotorealistik) dengan melatih sejumlah besar knowledge relevan – misalnya gambar. Beberapa pengembang mannequin ini berpendapat bahwa penggunaan wajar memberi mereka hak untuk mengambil knowledge dari sumber publik, terlepas dari standing hak cipta knowledge tersebut. Pihak lain telah berupaya untuk mengikuti aturan tersebut, dengan memberikan kompensasi atau setidaknya memberi penghargaan kepada pemilik konten atas kontribusi mereka pada rangkaian pelatihan.

Meyer, CEO Spawning, yakin bahwa belum ada yang memutuskan pendekatan terbaik.

“Pelatihan AI sering kali menggunakan knowledge termudah yang tersedia secara default – yang tidak selalu merupakan sumber yang paling adil atau bertanggung jawab,” katanya kepada TechCrunch dalam sebuah wawancara. “Artis dan pemegang hak cipta hanya memiliki sedikit kendali atas bagaimana knowledge mereka digunakan untuk pelatihan AI, dan pengembang tidak memiliki alternatif berkualitas tinggi yang memudahkan untuk menghormati hak knowledge.”

Supply.Plus, tersedia dalam versi beta terbatas, dibuat berdasarkan alat Spawning yang sudah ada untuk manajemen asal karya seni dan hak penggunaan.

Pada tahun 2022, Spawning membuat HaveIBeenTrained, sebuah situs net yang memungkinkan pembuat konten untuk tidak ikut serta dalam kumpulan knowledge pelatihan yang digunakan oleh vendor yang bermitra dengan Spawning, termasuk Hugging Face dan Stability AI. Setelah mengumpulkan modal ventura sebesar $3 juta dari investor, termasuk True Ventures dan Seed Membership Ventures, Spawning meluncurkan ai.textual content, sebuah cara bagi situs net untuk “menetapkan izin” untuk AI, dan sebuah sistem — Kudurru — untuk bertahan melawan bot pengikis knowledge. .

Supply.Plus adalah upaya pertama Spawning untuk membangun perpustakaan media — dan mengatur perpustakaan tersebut secara inner. Kumpulan knowledge gambar awal, PD/CC0, dapat digunakan untuk aplikasi komersial atau penelitian, kata Meyer.

Pustaka Supply.Plus.
Kredit Gambar: Hal ikan bertelur

“Supply.Plus bukan hanya tempat penyimpanan knowledge pelatihan; ini adalah platform pengayaan dengan alat untuk mendukung jalur pelatihan,” lanjutnya. “Tujuan kami adalah memiliki kumpulan knowledge CC0 berkualitas tinggi dan tidak melanggar yang mampu mendukung mannequin dasar AI yang kuat yang tersedia pada tahun ini.”

Organisasi termasuk Getty Pictures, Adobe, Shutterstock, dan startup AI Bria mengklaim hanya menggunakan knowledge yang bersumber secara wajar untuk pelatihan mannequin. (Getty bahkan menyebut produk AI generatifnya “aman secara komersial.”) Namun Meyer mengatakan bahwa Spawning bertujuan untuk menetapkan “standar yang lebih tinggi” mengenai arti sumber knowledge yang adil.

Supply.Plus memfilter gambar untuk “tidak ikut serta” dan preferensi pelatihan artis lainnya, menampilkan informasi asal tentang bagaimana — dan dari mana — gambar tersebut diambil. Ini juga mengecualikan gambar yang tidak dilisensikan di bawah CC0, termasuk gambar dengan a Lisensi Creative Commons BY 1.0, yang memerlukan atribusi. Dan Spawning mengatakan bahwa mereka memantau tantangan hak cipta dari sumber di mana orang lain selain pencipta bertanggung jawab untuk menunjukkan standing hak cipta suatu karya, seperti Wikimedia Commons.

“Kami dengan cermat memvalidasi lisensi yang dilaporkan dari gambar yang kami kumpulkan, dan lisensi apa pun yang meragukan dikecualikan – sebuah langkah yang tidak diambil oleh banyak kumpulan knowledge ‘adil’,” kata Meyer.

Secara historis, gambar-gambar bermasalah – termasuk gambar pribadi yang sensitif dan penuh kekerasan dan pornografi – telah mengganggu kumpulan knowledge pelatihan, baik yang bersifat terbuka maupun komersial.

Pengelola kumpulan knowledge LAION terpaksa menghentikan satu perpustakaan setelah laporan ditemukan rekam medis Dan gambaran pelecehan seksual terhadap anak; baru minggu ini, a belajar dari Human Rights Watch menemukan bahwa salah satu repositori LAION memuat wajah anak-anak Brasil tanpa izin atau sepengetahuan anak-anak tersebut. Di tempat lain, perpustakaan media stok Adobe, Adobe Inventory, yang digunakan perusahaan untuk melatih mannequin AI generatifnya, termasuk mannequin Firefly Picture yang menghasilkan seni, juga digunakan untuk melatih mannequin AI generatifnya. ditemukan berisi gambar yang dihasilkan AI dari rival seperti Midjourney.

Sumber Pemijahan.Plus
Karya seni di galeri Supply.Plus.
Kredit Gambar: Hal ikan bertelur

Solusi Spawning adalah mannequin pengklasifikasi yang dilatih untuk mendeteksi ketelanjangan, adegan berdarah, informasi identitas pribadi, dan bagian lain yang tidak diinginkan dalam gambar. Menyadari bahwa tidak ada pengklasifikasi yang sempurna, Spawning berencana untuk membiarkan pengguna memfilter kumpulan knowledge Supply.Plus secara “fleksibel” dengan menyesuaikan ambang batas deteksi pengklasifikasi, kata Meyer.

“Kami mempekerjakan moderator untuk memverifikasi kepemilikan knowledge,” tambah Meyer. “Kami juga memiliki fitur remediasi bawaan, di mana pengguna dapat menandai karya yang melanggar atau kemungkinan pelanggaran, dan jejak penggunaan knowledge tersebut dapat diaudit.”

Kompensasi

Sebagian besar program yang memberikan kompensasi kepada pembuat konten atas kontribusi knowledge pelatihan AI generatif mereka belum berjalan dengan baik. Beberapa program mengandalkan metrik yang tidak jelas untuk menghitung pembayaran kepada kreator, sementara program lainnya membayar jumlah yang menurut artis terlalu rendah.

Ambil Shutterstock, misalnya. Perpustakaan media stok, yang telah membuat kesepakatan dengan vendor AI senilai puluhan juta dolar, membayar “dana kontributor” untuk karya seni yang digunakan untuk melatih mannequin AI generatif atau lisensinya kepada pengembang pihak ketiga. Namun Shutterstock tidak transparan mengenai apa yang bisa diharapkan oleh para seniman, dan juga tidak mengizinkan para seniman untuk menetapkan harga dan ketentuan mereka sendiri; perkiraan pihak ketiga menetapkan pendapatan sebesar $15 untuk 2.000 gambar, bukan jumlah yang mengejutkan.

Setelah Supply.Plus keluar dari versi beta akhir tahun ini dan memperluas ke kumpulan knowledge di luar PD/CC0, ini akan mengambil cara yang berbeda dari platform lain, memungkinkan artis dan pemegang hak cipta untuk menetapkan harga mereka sendiri per obtain. Pemijahan akan dikenakan biaya, tetapi tarifnya tetap — “sepersepuluh sen,” kata Meyer.

Pelanggan juga dapat memilih untuk membayar Spawning $10 per bulan — ditambah biaya pengunduhan per gambar — untuk Supply.Plus Curation, paket berlangganan yang memungkinkan mereka mengelola koleksi gambar secara pribadi, mengunduh kumpulan knowledge hingga 10.000 kali sebulan dan mendapatkan keuntungan akses ke fitur-fitur baru, seperti koleksi “premium” dan pengayaan knowledge, sejak dini.

Sumber Pemijahan.Plus
Kredit Gambar: Hal ikan bertelur

“Kami akan memberikan panduan dan rekomendasi berdasarkan standar industri dan metrik inner saat ini, namun pada akhirnya, kontributor kumpulan knowledge menentukan apa yang menjadikannya bermanfaat bagi mereka,” kata Meyer. “Kami sengaja memilih mannequin penetapan harga ini untuk memberikan para artis bagian terbesar dari pendapatan dan memungkinkan mereka menentukan persyaratan mereka sendiri untuk berpartisipasi. Kami percaya pembagian pendapatan ini secara signifikan lebih menguntungkan para artis dibandingkan persentase pembagian pendapatan yang umum, dan akan menghasilkan pembayaran yang lebih tinggi dan transparansi yang lebih besar.”

Jika Supply.Plus mendapatkan daya tarik seperti yang diharapkan oleh Spawning, Spawning bermaksud untuk memperluasnya lebih dari sekadar gambar ke jenis media lain, termasuk audio dan video. Spawning sedang berdiskusi dengan perusahaan yang tidak disebutkan namanya agar knowledge mereka tersedia di Supply.Plus. Dan, kata Meyer, Spawning mungkin membangun mannequin AI generatifnya sendiri menggunakan knowledge dari kumpulan knowledge Supply.Plus.

“Kami berharap pemegang hak yang ingin berpartisipasi dalam ekonomi generatif AI akan mempunyai kesempatan untuk melakukannya dan menerima kompensasi yang adil,” kata Meyer. “Kami juga berharap seniman dan pengembang yang merasa berkonflik dalam berinteraksi dengan AI akan memiliki kesempatan untuk melakukannya dengan cara yang menghormati materi iklan lainnya.”

Tentu saja, Spawning memiliki ceruk untuk dibuat di sini. Supply.Plus sepertinya merupakan salah satu upaya yang lebih menjanjikan untuk melibatkan seniman dalam proses pengembangan AI generatif — dan membiarkan mereka berbagi keuntungan dari karya mereka.

Seperti yang baru-baru ini ditulis oleh rekan saya Amanda Silberling, kemunculan aplikasi seperti komunitas internet hosting seni Cara, yang mengalami lonjakan penggunaan setelah Meta mengumumkan kemungkinan melatih AI generatifnya pada konten dari Instagram, termasuk konten artis, menunjukkan bahwa komunitas kreatif telah mencapai titik puncaknya. Mereka sangat membutuhkan alternatif selain perusahaan dan platform yang mereka anggap sebagai pencuri — dan Supply.Plus mungkin bisa menjadi pilihan yang tepat.

Namun jika Spawning selalu bertindak demi kepentingan terbaik para artis (sangat mungkin, mengingat Spawning adalah bisnis yang didukung VC), saya bertanya-tanya apakah Supply.Plus dapat berkembang sesukses yang dibayangkan Meyer. Jika media sosial telah mengajarkan kita sesuatu, maka moderasi – terutama terhadap jutaan konten buatan pengguna – merupakan masalah yang sulit diselesaikan.

Kami akan segera mengetahuinya.

sumber

RELATED ARTICLES

Most Popular