25 Statistik Pengenalan Gambar untuk Mengungkap Piksel di Balik Teknologi
Diterbitkan: 2023-10-09Komputer modern belajar melihat seperti yang dilakukan manusia dan teknologi pengenalan gambar memungkinkan hal tersebut.
Jaringan saraf merupakan inti dari teknologi ini. Ia belajar dari data dan mengenali pola. Saat Anda memasukkan lebih banyak data tentang objek, wajah, dan bahkan emosi, “melihat” dan memahami gambar menjadi lebih baik.
Pengenalan gambar adalah bagian dari visi komputer dan kecerdasan buatan (AI). Ini mencakup teknik dan algoritma yang memberi label dan mengkategorikan konten gambar.
Pada dasarnya, teknologi ini baru mulai berkembang, namun banyak organisasi sudah mulai menggunakan perangkat lunak pengenalan gambar untuk melatih model dan menambahkan kemampuan untuk mengenali gambar di platform perangkat lunak lain. Saat ini, pengenalan gambar membantu diagnosis medis, menemukan orang hilang, dan bahkan mewujudkan mobil tanpa pengemudi.
Potensi pasarnya sangat besar dan terus berkembang untuk memasuki industri baru. Mari jelajahi statistik ini dan lihat apa yang baru dalam pengenalan gambar.
Statistik pasar pengenalan gambar
Pasar pengenalan gambar berkembang pesat dan menjadi populer di sektor ritel, layanan kesehatan, dan keamanan. Kecerdasan buatan dan pembelajaran mesin adalah pendorong utama pertumbuhan pasar. Berdasarkan statistik di bawah ini, peluang apa pun di pasar pengenalan gambar bisa jadi menjanjikan antara tahun 2023 dan 2030.
Lihat seperti apa statistiknya.
- Pasar pengenalan gambar global diperkirakan akan menunjukkan tingkat pertumbuhan tahunan gabungan (CAGR) sebesar 10,42% dari tahun 2023 hingga 2030.
- Ukuran pasar pengenalan gambar AS diperkirakan menjadi yang terbesar, senilai $3,94 miliar pada tahun 2023.
$10,53 miliar
adalah nilai proyeksi pasar pengenalan gambar untuk tahun 2023.
Sumber: Statista
- Ukuran pasar pengenalan gambar di Amerika Utara meningkat sebesar 11,86% pada tahun 2023.
- Pasar pengenalan gambar Australia diperkirakan mencapai $280 juta pada tahun 2023.
- Amerika Selatan menunjukkan peningkatan ukuran pasar yang signifikan sebesar 20,26% pada tahun 2023.
- Ukuran pasar pengenalan gambar AI global bernilai USD 3330,67 juta pada tahun 2022 dan diperkirakan akan meningkat pada CAGR sebesar 24,91% hingga mencapai 12652,88 juta pada tahun 2028.
- Pasar pengenalan gambar di Asia relatif lebih kecil, dengan jumlah $2,57 miliar pada tahun 2023.
- Ukuran pasar pengenalan gambar di Eropa Tengah dan Barat bahkan lebih kecil yaitu $1,88 miliar pada tahun 2023.
- CAGR yang diharapkan dari pasar pengenalan gambar AS dari tahun 2023 hingga 2030 adalah 7,86%.
Statistik teknologi pengenalan gambar
Pembelajaran mendalam memiliki peran utama dalam teknologi pengenalan gambar. Model pembelajaran mendalam yang populer seperti You Only Look Once (YOLO) dan Single-Shot Detector (SSD) menggunakan lapisan konvolusi untuk mengurai gambar atau foto digital. Teknik dan model pembelajaran mendalam akan terus ditingkatkan pada tahun 2023, menjadikan pengenalan gambar lebih sederhana dan akurat.
Selain itu, algoritme seperti transformasi fitur invarian skala (SIFT), fitur tangguh yang dipercepat (SURF), dan model pengenalan gambar analisis komponen utama (PCA) membaca, memproses, dan mengirimkan.
Ekosistem teknologi seputar pengenalan gambar berubah dengan cepat. Statistik ini akan memberi Anda informasi terbaru di bidang teknologi.
- Laboratorium Ilmu Komputer dan Kecerdasan Buatan (CSAIL) MIT mengembangkan Masked Generative Encoder (MAGE) untuk menyimpulkan bagian gambar yang hilang. Ini mencapai akurasi 80,9% dalam penyelidikan linier dan mengidentifikasi gambar dengan benar di 71,9% kasus ketika diberikan sepuluh contoh berlabel dari setiap kelas.
- Object365, kumpulan data deteksi objek berskala besar, telah dilatih dengan lebih dari 600.000 gambar.
1.000 gambar
setiap kelas diperlukan untuk melatih sistem mendeteksi dan mengenali gambar dan objek.
Sumber: IBM
- 1 hingga 2 megapiksel ideal bila gambar tidak memerlukan detail halus untuk deteksi objek. Jika gambar memerlukan detail halus, gambar tersebut dibagi menjadi gambar masing-masing 1-2 megapiksel.
- Sistem pengenalan gambar yang besar dan kuat dapat menangani 1000 frame per detik (FPS). Sebaliknya, sistem pengenalan gambar umum memproses pada 100 FPS.
- Kumpulan data terbesar yang tersedia untuk umum untuk melatih model pengenalan gambar adalah IMDB-Wiki, dengan lebih dari 500.000 gambar wajah manusia.
- Berkeley Deep Drive (BDD110K) adalah kumpulan data video mengemudi dengan variasi terbesar. Ini memiliki lebih dari 100.000 video yang dianotasi untuk tugas persepsi dalam mengemudi otonom.
- Pengenalan gambar terdiri dari tiga lapisan – masukan, tersembunyi, dan keluaran. Lapisan masukan menangkap sinyal, lapisan tersembunyi memprosesnya, dan lapisan keluaran memutuskan sinyal apa itu.
- Gambar berwarna memiliki kedalaman bit berkisar antara 8 hingga 24 atau lebih tinggi. Dalam gambar 24-bit, ada tiga pengelompokan: 8 untuk merah, 8 untuk hijau, dan 8 untuk biru. Kombinasi bit-bit ini mewakili warna lain.
- 4 statistik orde pertama (mean, varians, skewness, dan kurtosis) dan 5 statistik orde kedua (momen sudut kedua, kontras, korelasi, homogenitas, dan entropi) mewakili fitur tekstual suatu gambar.
Statistik akurasi sistem pengenalan gambar
Dengan jaringan saraf konvolusional (CNN), tingkat akurasi pengenalan gambar meningkat. Namun, tantangan seperti deformasi, variasi objek dalam kelas yang sama, dan oklusi dapat mempengaruhi keakuratan sistem. (Oklusi terjadi ketika suatu objek menyembunyikan bagian dari objek berbeda dalam gambar.)
Meskipun terdapat potensi kemunduran, sistem pengenalan gambar menunjukkan tingkat kepastian yang sangat tinggi. Jelajahi statistik ini untuk memahami keakuratan yang dapat Anda harapkan dari perangkat lunak pengenalan gambar dan seberapa besar ruang untuk kesalahan.
- Tingkat kesalahan rata-rata di seluruh kumpulan data dalam pengenalan gambar adalah 3,4%.
- Tingkat kesalahan 5 teratas dalam pengenalan gambar mengacu pada persentase frekuensi label target tidak muncul di antara lima prediksi dengan probabilitas tertinggi. Banyak teknik yang tidak bisa di bawah 25%.
6%
adalah tingkat kesalahan rata-rata untuk kumpulan data ImageNet, yang banyak digunakan dalam sistem pengenalan gambar yang dikembangkan oleh Google dan Facebook.
Sumber: MIT
- Perkiraan tingkat akurasi alat pengenalan gambar adalah 95%. Hal ini disebabkan oleh perkembangan CNN dan jaringan saraf dalam berbasis fitur lainnya.
- YOLOv7 adalah model deteksi objek real-time akurat yang paling efisien untuk tugas visi komputer.
Sumber:
- Statistik
- yahoo
- IBM
- Semua tentang sirkuit
- visa
- Altexsoft
- laboratorium V7
- PeretasSiang
Dari piksel hingga pola
Statistik di atas dengan jelas menunjukkan bahwa pasar pengenalan gambar berada pada lintasan pertumbuhan dari tahun 2023 hingga 2030. Teknologi ini berkembang dan meningkatkan akurasinya dengan pembaruan dan kemajuan baru. Namun pertumbuhan ini tidak hanya terjadi pada pengenalan gambar. Seluruh bidang visi komputer berkembang dalam ukuran pasar dan adopsi. Seiring dengan meningkatnya nilai pasar, bisnis yang mendapat tempat di sektor pengenalan gambar akan mendapatkan keuntungan.
Pelajari lebih lanjut tentang visi komputer dan pahami bagaimana mesin menafsirkan dunia visual.