Apa yang dapat mengganggu masa depan AI generatif?

Diterbitkan: 2023-09-22

Akhir-akhir ini banyak perbincangan tentang bagaimana AI generatif dapat membuat orang kehilangan pekerjaan. Tidak banyak pemikiran yang diberikan tentang bagaimana orang dapat menghentikan kerja AI generatif. Tapi mereka bisa – dan sangat mungkin akan melakukannya.

GenAI dan model dasarnya saat ini berada pada puncak siklus hype Gartner. Jika model Gartner bagus, alat-alat tersebut mungkin akan terjerumus ke dalam “palung kekecewaan” sebelum beberapa tahun kemudian muncul pada puncak produktivitas yang berguna.

Namun, terdapat argumen bahwa kekecewaan dapat menelan produk genAI selamanya. Selain risiko yang timbul karena mengandalkan “kecerdasan” yang pada dasarnya tidak disadari dan tidak bermoral, pengguna juga menghadapi prospek yang sangat nyata bahwa masalah hak cipta dan privasi dapat merugikan model bahasa besar (LLM) seperti ChatGPT.

Mari kita urutkan.

Daftar Do Not Scrape nasional?

Penerbit memonetisasi konten. Mereka tidak berupaya agar pihak ketiga memonetisasi konten tersebut tanpa izin, terutama karena penerbitnya kemungkinan besar sudah membayarnya. Penulis profesional memonetisasi apa yang mereka tulis. Mereka juga tidak mencari keuntungan pihak ketiga dari karyanya tanpa imbalan kepada penciptanya. Semua yang saya katakan di sini tentang konten tertulis berlaku sama untuk konten grafis, video, dan konten kreatif lainnya.

Tentu saja, kami memiliki undang-undang hak cipta yang melindungi penerbit dan penulis dari pencurian langsung. Hal ini tidak membantu dalam genAI karena ia meng-crawl begitu banyak sumber sehingga keluaran akhirnya mungkin tidak terlalu mirip dengan salah satu sumber individual (walaupun hal ini bisa saja terjadi).

Saat ini, penerbit secara aktif mencari cara untuk memblokir LLM agar tidak menyalin konten mereka. Ini adalah tantangan teknis yang sulit

Dalam video ini, kontributor MarTech Greg Krehbiel membahas cara penerbit mencoba memblokir LLM. Dia juga menyarankan perubahan syarat dan ketentuan untuk mempersiapkan dasar tuntutan hukum di masa depan. Seperti yang dia akui, tidak ada satu pun sarannya yang merupakan pukulan telak. Misalnya, apakah mungkin menghentikan Google merayapi situs Anda untuk mengambil konten tanpa juga menghentikannya merayapi situs Anda untuk menempatkannya di hasil penelusuran? Selain itu, tuntutan hukum juga memerlukan biaya yang besar.

Namun bagaimana dengan perbaikan regulasi? Apakah Anda ingat gangguan yang tiada habisnya dari panggilan telemarketing? Daftar Nasional Jangan Panggil menghentikan hal itu. Setiap orang yang peduli dapat mendaftarkan nomor teleponnya dan telemarketer dapat terus meneleponnya hanya dengan risiko FTC mengenakan denda yang besar.

Mendaftarkan domain dengan daftar National Do Not Scrape mungkin merupakan tantangan yang lebih berat, namun kita dapat melihat secara umum bagaimana strategi regulasi tersebut dapat berhasil. Apakah setiap pelanggaran akan terdeteksi? Tentu saja tidak. Namun hal yang sama juga berlaku, misalnya, untuk GDPR. GDPR memerintahkan kepatuhan bukan karena setiap pelanggaran terdeteksi, namun karena pelanggaran yang terdeteksi dapat mengakibatkan sanksi berat — “denda yang sangat besar hingga 4 persen dari total pendapatan global suatu perusahaan.”

Sudah terlambat. GenAI sudah memiliki datanya

Apakah ada perbaikan teknis atau peraturan untuk menghentikan genAI mencuri konten, bukankah kuda itu sudah meninggalkan kandangnya? LLM telah dilatih tentang kumpulan data yang sangat besar. Mereka mungkin rentan terhadap kesalahan, namun ada perasaan bahwa mereka mengetahui segalanya.

Ya, mereka mengetahui segalanya hingga beberapa tahun yang lalu. ChatGPT-4 telah dilatih sebelumnya tentang data dengan batas waktu pada September 2021. Artinya, ada banyak hal yang tidak diketahuinya. Mari kita ingatkan diri kita sendiri tentang apa yang sedang kita hadapi di sini.

Gali lebih dalam: Kecerdasan Buatan: Panduan pemula

GenAI menggunakan algoritme untuk memprediksi teks terbaik berikutnya yang akan dibuat, berdasarkan jutaan teks yang telah dilatih. Apa yang membuatnya “cerdas” adalah bahwa ia dapat meningkatkan algoritmenya sendiri berdasarkan umpan balik dan respons (manusia tidak perlu mengutak-atik algoritme, meskipun tentu saja ia bisa).

Apa yang genAI tidak lakukan - tidak bisa lakukan - adalah mencari tahu hal-hal tentang dunia yang berada di luar kumpulan pelatihan datanya. Hal ini menggarisbawahi poin yang dikemukakan oleh filsuf seperti Donald Davidson, ¹ bahwa AI tidak memiliki hubungan sebab akibat dengan dunia. Jika saya ingin mengetahui apakah sedang hujan, saya tidak mengandalkan kumpulan data; Saya melihat ke luar jendela. Secara teknis, genAI mungkin memiliki sintaksis (tata bahasa) yang bagus, tetapi asing dengan semantik (makna).

Kesimpulan yang dapat diambil dari hal ini adalah bahwa AI sepenuhnya bergantung pada makhluk, seperti kita, yang terhubung secara kausal dengan dunia; siapa yang tahu apakah sedang hujan, apakah ada bulan di langit, apakah Jefferson menyusun Deklarasi Kemerdekaan. Sejauh ini, hal ini bergantung pada apa yang telah dilakukan orang-orang di masa lalu. Agar tetap relevan, hal ini harus terus bergantung pada apa yang dapat dilakukan oleh orang-orang saja.

Jika kemampuan LLM untuk terus mengikis konten yang dibuat oleh manusia sangat terhambat, mereka tidak akan dapat menambah, memperbarui, memperbaiki, dan menambah kumpulan data mereka di masa mendatang. Hilangnya kegunaannya mungkin lambat, tapi bisa dipastikan.

Lepaskan PII-ku!

Selain desakan dari penerbit, penulis, dan pembuat konten lain untuk menjauhkan genAI dari konten mereka, ada masalah nyata lainnya yang akan dihadapi dalam waktu dekat. Kebutuhan untuk menjamin bahwa, ketika mereka mengambil jutaan gigabyte data dari web, mereka tidak secara tidak sengaja menyita informasi pengenal pribadi (PII) atau jenis data lain yang dilindungi oleh peraturan yang ada.

FTC membuka penyelidikan terhadap OpenAI atas masalah perlindungan konsumen.
Italia, seperti diberitakan secara luas, melarang OpenAI dan ChatGPT karena penanganan data pribadi serta tidak adanya kontrol verifikasi usia. Operasi dipulihkan setelah tuntutan Italia dipenuhi.
Tantangan yang dihadapi Eropa belum selesai. Keluhan besar-besaran yang diajukan di Polandia mengklaim bahwa OpenAI melakukan “pelanggaran sistematis” terhadap GDPR.

Cukuplah untuk mengatakan bahwa pengadilan Eropa cenderung lebih bersimpati pada hak-hak warga negara dibandingkan keuntungan perusahaan teknologi besar.

Kami bahkan belum menyebutkan kepercayaan dan keamanan. Kekhawatiran tersebut tercakup dalam percakapan saya baru-baru ini dengan pakar siklus AI Gartner, Afraz Jaffri, yang mengatakan:

Persoalan pertama sebenarnya adalah aspek kepercayaan. Terlepas dari peraturan eksternal, masih ada perasaan mendasar bahwa sangat sulit untuk mengontrol keluaran model dan menjamin keluaran benar-benar benar. Itu adalah kendala besar.
Bagaimana masa depan genAI? Siklus Hype Gartner

Akankah semua ini memicu tombol mati?

Mudah untuk mengatakan bahwa genAI akan tetap ada. Banyak orang yang mengatakannya. Dan tentu saja, perkembangan teknologi yang signifikan – atau bahkan sepenuhnya baru – kemungkinan besar tidak akan dilupakan atau ditinggalkan. Minimal, organisasi akan terus menggunakan kemampuan ini pada kumpulan data mereka sendiri, atau dengan hati-hati menentukan kumpulan data eksternal, dan hal ini akan memenuhi banyak kasus penggunaan yang penting.

Namun demikian, kemungkinan genAI akan terganggu, dibatasi, dan diubah oleh kombinasi hambatan peraturan, tantangan hukum, masalah kepercayaan – dan hambatan lain yang belum terlihat – jauh di atas nol.

Donald Davison, “Tes Turing”, Pikiran 59 (1950) ↩︎

Tambahkan MarTech ke umpan Google Berita Anda.

Cerita terkait

Baru di MarTech

Perkataan yang mendorong kebencian di media sosial dapat merusak merek secara signifikan: Studi

Memikirkan kembali tata kelola konten di era AI generatif

Pekerjaan terbaru di martech

Rilis martech bertenaga AI minggu ini

State Farm dan iHeartMedia menjadi tuan rumah pengalaman Ed Sheeran di Fortnite